普段Web制作に関わっていると、何気なく使っているユーザーインターフェイス(User Interface=UI)」という言葉。
一口にユーザーインターフェイスと言っても、その意味は奥が深く、様々な形があります。

そして、AppleのSiri、MicrosoftのCortana、GoogleGoogle AssistantやAllo、AmazonのAlexaのような音声認識AIの登場によって、「VUIという言葉が再度注目を集めています。
果たして、こうした「VUI」というのは、普段Web制作に関わっているひとが使っている「UI」という言葉と果たして何が異なるのでしょうか。

今回は、2017年に知っておきたい抽象的UIである「VUIについてのさまざまなことを、入門編としてご紹介していきます。
UIをはじめとして、VUIの本質的な部分を知ることで、今後のホームページ制作や様々なデバイスの活用にも活きてくるでしょう。

そもそもUIとは?

pexels-photo-205739.jpeg

昨今ではUI(ユーザーインターフェイス)とUX(ユーザーエクスペリエンス)の違いや優れたUXとは何かについて論じられることが多く、「そもそもUIとは何か」の本質的な議論をすることが少なくなったように思います。

ユーザーインターフェイスとは、もともとはコンピューターに関連する用語ではなく、機械類に関して広く使用されている言葉です。
機械とその利用者であるユーザーとの間で情報をやりとりするための媒介となる部分のことで、大きく分けるとユーザーが機械を操作する「入力」部分と、ユーザーが操作した結果機械が現在の情報を表示する「出力」部分があります。

あるシステムを使う際、ユーザーはそのシステムを制御し、そのシステムの状態を知る必要があります。
たとえば、バイクを運転する場合、運転手はハンドルを操作して進行方向を制御し、アクセルやブレーキを使って速度を制御します。
運転者は前方左右の見ることでバイクの位置を把握し、速度計(タコメーター)を見ることで正確な速度を知ることができます。
このように、バイクのユーザーインターフェイスは様々な機器群で構成されていて、全体を通してバイクの運転に必要なものを提供しています。

コンピューターにおけるユーザーインターフェイスは、ボタンやカーソルなどのデザインやフォント、製品であれば製品そのものの外観など、ユーザーの視覚に触れるすべての情報ユーザーインターフェイスといいます。
とりわけホームページのデザインに関していうと、ハイパーリンクテキストだけでなく、ボタンやアイコン、入力フォームなどの入力・出力を司るパーツのことを総じてユーザーインターフェイスと呼びます。

そして、そのUIを通じてどのようにユーザーに体験を提供するのかに着目したのがUXという言葉です。
綺麗でわかりやすいデザイン、可読性が高く読みやすいフォント、問い合わせしやすいフォームといった、UIを触ってエンゲージメントを高めるという部分から、すぐに届く商品、クオリティの高いサービスなど、製品全体を通して広義にUXについて語ることもあります。
その意味では、UIUXを高めるための一つの要素にすぎない、という考え方もあります。

さまざなまUI

さきほどはバイクやコンピューター、ホームページにおけるUIについて解説していきました。
しかし実際には、さまざまな形のUIが存在します。
ここでは、VUIを従来型のUIと比較するために、CUI・GUI・VUIを順に見ていくことにしましょう。

CUI (キャラクターユーザーインターフェイス)

command.png

コマンドプロンプトやターミナルのように、キーボードに入力されるコマンド(命令)によってOS上の操作を行うUIのことを、CUI(キャラクターユーザーインターフェイス)と呼びます。
マウスや音声はなく、すべての入出力をキーボードで行う点が特徴です。

コンピューターは、ユーザーの入力から処理の過程や結果を出力し、再び入力可能な状態になると改行して行頭にプロンプトを表示します。
この繰り返しで対話式に作業を進めていくのがCUIです。

GUI (グラフィカルユーザーインターフェイス)

mac.jpeg

コンピューターの画面に現れるグラフィックスと、マウスポインタのようなポインティングデバイスを使って、直感的に操作することができるインターフェイスがGUI(グラフィカルユーザーインターフェイス)です。

GUIでは、コンピューター上の画面に、ウィンドウやアイコン、ボタンといったグラフィックスが表示され、ユーザーはそれらの中から目的の動作を表すグラフィックスをマウスなどのポインティングデバイスで選択し、指示を与えていきます。

GUIにおいては、作業はウィンドウ単位に分割され、複数の作業を同時並行的に処理することができます。
最も多い方式は、Windows95以降で採用されているように、タスクバーと呼ばれる棒状の領域をデスクトップ上に用意して、ここに各ウィンドウのアイコンやタイトルを並べていく方法です。
また、CUIのようにキーボード操作ができることに加え、キーボードショートカットといった、機能性を向上させるようなものもあります。

そして、スマートフォンやタブレットの登場によって、ポインティングデバイスのないタッチパネル式GUIが登場したことも忘れてはなりません。
タッチパネルに表示されたボタンやアイコンに、直接ペンや指で触れることによって、各種操作を行うことができます。
ATMやコンビニで設置されているチケット発行端末もタッチパネル式のGUIを採用していますね。
これにより、ポインティングデバイスを目で追うことなく、さらに直感的に機械操作を行うことが可能になりました。

VUI (ボイスユーザーインターフェイス)

siri.jpg

そして、次世代のUIパラダイムとして近年再び着目されているのが、音を通じて機械操作を行う、VUI(ボイスユーザーインターフェイス)です。
SiriやAlexaのようなAI(人工知能)系システムだけでなく、TwillioやWebXMLのようなコマンド型システムでも採用されています。

面白いことに、GUIでは主に視覚情報を使って「図形的な」やりとりを行なっていましたが、VUIはCUIと同じように「対話的な(ナラティブな)」やりとりを目指していて、その点では「回顧的」だということができます。
CUIはコマンドラインを打ち込んで命令をしていますが、打ち込む文字が喋り言葉に置き換わっただけで、本質的にはCUIとVUIは変わらない、という考え方です。

VUIでは、ポケット型のデバイスや据え置き型のデバイスに可能性を与えてくれます。

例えば、スマートフォンを、コンピューターを小型化してマウスやキーボードなどのインターフェイスを取り除いたタッチパネル式デバイスと定義することもできるでしょう。
現在、このような端末は、ユーザー入力用の小さなボタンや小型のタッチパネルに依存しています。
しかし、もし音声だけで正確に入出力ができるのであれば、さらにコンパクトになり、持ち運びがもっと楽になる可能性を秘めています。

一方で、AmazonのEchoやLGのAmazon Alexaを搭載した冷蔵庫のようにIoTデバイスに溶け込めば、「身につけている」「システムを操作している」という感覚すらなしにあらゆる情報を操作することができます。
電子レンジからコピー機、湯沸かし器まで、あらゆるものから操作ボタンがなくなってしまうのも時間の問題かもしれません。

VUIの課題

しかし、VUIが広まっていくにはいくつかの課題もあると言われています。

まず、VUIは音声を使ってコマンドを与えるので、コマンドなどの入力と背景の会話とを区別する必要があるということです。
そうでなければ、「これをレンジで温めておいて」という会話を親子でしている間に、音声対応の電子レンジが勝手に起動してしまう恐れがあります。
そのため、スタートレックでいうところの「Computer!」やSiriを起動する場合の「Hey, Siri!」というようなわかりやすい待受解除のアクションが必要です。

また、VUIは、特定のユーザーの好みに応じて、情報を正確に処理し、発見し、検索し、アクションを実行するために、さまざまなソフトウェアと協働する必要があるという点です。
例えば「Hey, Siri! 昨夜の北海道での積雪に関する情報を教えて」と言った場合に、「北海道」での「積雪」に関する「昨夜」時点での情報を引っぱり出し、それを画面上に表示したり音声で引用したりする必要があります。
VUIは高度な処理を行うことができるAIとの結びつきが深くなるのもそのためです。

まとめ

AIや機械学習などとともに音声認識に関する注目度も日増しに高まっています。
Web担当者の中の認識では「UI」といえば「GUI」のことがほとんどだと思いますが、Web上で音声認識やVRなどの技術が本格的に活用できるようになるのも時間の問題でしょう。

VUIについて考えてみることが、Webにおける可能性を広げる第一歩になるのかもしれません。