ウェイクワードと音声認識の仕組み

日本語対応したときにどうなるかはわかりませんが、Alexaは現在英語とドイツ語に対応しており、その音声認識の仕組みを知ることは、ASKが日本語対応したときにも役に立つかもしれません。

例えば、Alexaに次のようなフレーズを聞いてみたとしましょう。

「Alexa, ask Forecast Tech for today’s weather.」
(Alexa、Forecast Techに今日の天気を聞いてみて)

「Hey, Siri」「OK, Google」のように、Alexaでは「Alexa」という言葉自体がウェイクワード(wake word)になっています。
Echoではマイクがこの言葉を拾うと呼びかけた方向が水色に、それ以外の方向は紺色に光り、それ以降の言葉がクラウド上のAlexaの各種APIを通信し、ストリーミングしてクラウドに送られ、テキストに変換されます。

その次に発せられた*「ask」起動フレーズ*(launch phrase)といい、この次にくる単語がSkill名であることをAlexaに伝えます。
起動フレーズには、ask以外にも「open」「start」「begin」「launch」「load」などがあり、これらの起動フレーズをSkill名に使うことはできません。

最後の*「for today’s weather」発話*(utterance)と呼ばれ、あらかじめ予想されている答え(sample utterance)からAlexaがどの答えと結びつきそうかを判断し、Skillを起動させます。
発話と答えの結びつきにはディープラーニングの技術が使われており、多少の言葉のゆらぎがあってもAlexaは理解してくれるようです。

Alexaを試すための方法

1. Alexa対応のデバイスを購入する

Alexaの対応デバイスを買うことで、すぐにAlexaを試すことができます。
しかし、Amazon Echoを含めた3種類のデバイスは日本国内ではまだ利用できません。
そのため、海外で試す必要があります。

2. Alexaシミュレーターを利用する

echoism.jpeg
https://echosim.io

Amazonが提供しているAlexaシミュレーター*「Echosim.io」*を利用することで、擬似的にAlexaを体験することができます。
Echoism.ioにはアメリカのAmazonアカウントがあればログインすることができます。

3. Alexa対応デバイスを製作する

git.jpeg
https://github.com/alexa/alexa-avs-sample-app

少し敷居が高いですが、自分でAlexa Voice Service(AVS)に対応したデバイスを実装するという方法があります。
AmazonのGitHub上でサンプルコードと開発キットが提供されています。
WindowsやMacなどの通常のコンピュータだけでなく、日本でも人気のRaspberry Piにも実装することができます。