
Project Common Voiceとは?Mozillaが推し進めるオープンソースの音声認識プロジェクト
AmazonのAlexaやMicrosoftのCortana、AppleのSiriだけではなく、日本でもLINEのClovaを搭載したWAVEが注目を集めるなど、*VUI(音声を使って操作するUI)*を活用したヴァーチャルアシスタントは日々進化を遂げています。
ただ、こうした音声を使ったプロジェクトは各企業が囲い込みを行っているので、私たちはSDKなどが公開されるまでその中身や仕組を知ることはできません。
もし、これらのプロジェクトがオープンソース化され、世界中の開発者によって改良・改善がなされていたらどうでしょうか。
私たちも、こうした分野に関する知識があればプラットフォームに参加することができ、開発の一翼を担うことができるかもしれません。
実は、「Mozilla Foundation」がオープンソースの音声プラットフォームプロジェクト*「Project Common Voice」*をローンチしていきました。
音声認識(Voice Recognition)の分野はまだまだ発展途中であり、Mozillaはこのプロジェクトをオープンソース化することで一気にこの分野での勢力を拡大しようとしています。
注目すべきは、プログラマーだけではなく、ノンプログラマーもこのプロジェクトに参加してプロジェクトを前進させる一助となることができるのです。音声認識がオープンソースによって気軽に使えるようになれば、私たちの生活で音声AIがより身近になるかもしれません。
今回は、*Mozillaが推し進めるオープンソースの音声認識プロジェクト「Project Common Voice」*の概要をお伝えします。
音声認識プログラムに対する需要
画像参照元:pexels.com
FOSSBYTES の報道によれば、Googleがモバイル端末での全検索の約20%(つまり5回中1回)は音声検索を使っていることが昨年明らかになったといいます。
そして、テキストを使ったサーチに対して、音声検索はますます勢いを増して増えてきています。実際、何年もの間、音声認識とその使い道はテック界を牽引してきた巨大企業にとって重要な要素となっています。SiriやCortana、AlexaやGoogle Assistantがその顕著な例と言えるでしょう。
WIRED によれば、何人もの専門家が音声認識の技術を*[「NBT」](The Next Big Thing=次にやってくる世界を変える技術):blank *だと考えています。
現在、iPhoneのようなタッチスクリーンのデバイスが何億人ものポケットに入っていますが、そのうちポケットの中にはスクリーンすらないデバイスに置き換わってしまう(Alexaのポケット版のようなものが出るのも時間の問題)かもしれません。しかし、オープンソースの世界では、音声認識に対する研究開発は遅れ気味であったことは事実です。AppleやMicrosoft、AmazonやGoogleは、こうした音声認識に関する技術を囲い込んでおり、世界中の開発者がイノベーションを起こしにくい状況となっていました。
その事実にメスを入れようとしたのが、Firefoxブラウザの生みの親でもあるMozillaです。Mozillaは2017年6月に、Project Common Voice と呼ばれるプロジェクトをスタートさせました。
- UI
- UIとは、ユーザーインターフェイス(User Interface)の略で、ユーザー(使い手)とデバイスとのインターフェイス(接点)のことを意味します。
- フォーム
- フォームとは、もともと「形」「書式」「伝票」などの意味を持つ英単語です。インターネットの分野では、パソコンの操作画面におけるユーザーからの入力を受け付ける部分を指します。企業のホームページでは、入力フォームが設置されていることが多いようです。
- フォーム
- フォームとは、もともと「形」「書式」「伝票」などの意味を持つ英単語です。インターネットの分野では、パソコンの操作画面におけるユーザーからの入力を受け付ける部分を指します。企業のホームページでは、入力フォームが設置されていることが多いようです。
- Googleとは、世界最大の検索エンジンであるGoogleを展開する米国の企業です。1998年に創業され急激に成長しました。その検索エンジンであるGoogleは、現在日本でも展開していて、日本のYahoo!Japanにも検索結果のデータを提供するなど、検索市場において圧倒的な地位を築いています。
- テキスト
- テキストとは、純粋に文字のみで構成されるデータのことをいいます。 太字や斜線などの修飾情報や、埋め込まれた画像などの文字以外のデータが表現することはできませんが、テキストのみで構成されたテキストファイルであれば、どのような機種のコンピューターでも共通して利用することができます。
- Googleとは、世界最大の検索エンジンであるGoogleを展開する米国の企業です。1998年に創業され急激に成長しました。その検索エンジンであるGoogleは、現在日本でも展開していて、日本のYahoo!Japanにも検索結果のデータを提供するなど、検索市場において圧倒的な地位を築いています。
- デバイス
- デバイスとは「特定の機能を持つ道具」を表す語で、転じてパソコンを構成するさまざまな機器や装置、パーツを指すようになりました。基本的に、コンピューターの内部装置や周辺機器などは、すべて「デバイス」と呼ばれます。
- Googleとは、世界最大の検索エンジンであるGoogleを展開する米国の企業です。1998年に創業され急激に成長しました。その検索エンジンであるGoogleは、現在日本でも展開していて、日本のYahoo!Japanにも検索結果のデータを提供するなど、検索市場において圧倒的な地位を築いています。
ツール紹介記事
おすすめエントリー
カテゴリから記事をさがす
Web マーケティング
- SEO(検索エンジン最適化)
- SNSマーケティング
- アプリマーケティング
- Web広告
- グロースハック
- ABテスト・EFO・CRO
- LP制作・LPO
- CMS・Webサイト制作
- 記事制作・ライティング
- コンテンツマーケティング
- メール配信・メールマーケティング
- マーケティングオートメーション(MA)
- リードジェネレーション(見込み顧客獲得)
- カスタマーサポート・カスタマーサクセス
- アクセス解析・広告効果測定
- データ分析
- リサーチ・市場調査
- 口コミ分析・ソーシャルリスニング
- O2O(Online to Offline)
- EC・通販・ネットショップ
- 多言語・翻訳
- 動画・映像制作
- AR・VR制作
- 統計データ
- マーケティングお役立ちレポート
- 連載
- チャットボット
- Web会議
- 動画マーケティング
- フォーム作成
- CRM(顧客管理)
その他のカテゴリ
