検索順位は、ホームページを使った販売やプロモーションを行う企業にとって、売上に大きく影響する場合もあり、気になることの一つです。SEO対策に力を入れているWeb担当者の皆さんは、2019年12月にGoogleがアップデートしたBERTアルゴリズムについてどのような対応をお考えでしょうか。

自然言語処理技術の一つであるBERTアルゴリズムは、これまでのアルゴリズムアップデートとは違った印象です。ホームページにどのような対応をするべきか、まだ具体的に検討していないWeb担当者も多いでしょう。今回は、BERTアルゴリズムがどのようなものなのか、また、必要とする対策についてわかりやすく解説します。

BERTアルゴリズムとは(文章型の検索クエリが高まった)

BERT(バート)は、Bidirectional Encoder Representations from Transformersの頭文字を取った略称であり、Googleが2019年10月に発表した人工知能を活用した自然言語処理のアルゴリズムです。発表時点では、米国においての英語検索を対象にしていましたが、日本では2019年12月10日にアップデートされました。

このとき、70種類以上の言語に導入され、世界的にBERTアルゴリズムが使われるようになったのです。Googleでは、検索のうちの10%の精度を高められたとしており、BERTアルゴリズムの影響力の強さを感じます。

そもそも自然言語処理とは何か

自然言語処理は人工知能と言語学の一分野です。人間の言葉に含まれる曖昧さを考慮した上で、コンピューターが処理をするものですが、自然言語は人間それぞれの環境によって異なるため、実用は難しいとされていました。自然言語処理は、まず文を単語単位に分解し、それぞれの単語のつながりを解析します。

そして、単語ごとの関連性が高いもの同士を結びつけ文章の意味を解析するのです。このようにすべての文を解析し、さらに文同士のつながりから文脈を解析する仕組みです。自動翻訳やチャットボットなど、自然言語処理は現代社会に必要とされる技術であり、発展が求められています。

BERTの何が優れているのか

従来の自然言語処理は、解析処理にあたり1つの自然言語モデルを使用し、特定のタスクに対応するものでした。しかし、BERTは、インターネット上に存在する大量のデータを利用して事前学習が可能です。さらに、転移学習と呼ばれる、学習データから新たなモデルを作り出すことができるため、限られたデータでも様々なタスクに対応することができます。従来はモデルごとに語彙を学習させる必要がありましたが、BERTはすでに学習しているデータを使えるので、効率的に機能するのです。

文章型の検索クエリこそ関連性が高くなる

GoogleのアルゴリズムにBERTが使われるようになり、今まで以上にユーザーに検索意図に最適化できるようになります。そのため、自然な問いかけのような文章型のクエリこそ、BERT導入の成果を発揮するでしょう。音声検索の普及などの背景もあり、ユーザーによる検索の利便性と、その結果の精度の高さはますます向上すると考えられます。

BERTでどのようなことができるようになったのか

BERTアルゴリズムの導入により、これまでの検索とどのような違いが生じるのでしょうか。できるようなったことと例を紹介します。

文脈を理解し精度が高くなった

BERTアルゴリズムは単語のみではなく、単語が含まれる文章から文脈を理解できます。自然言語処理技術により、人間が日常的に話す言語をGoogle検索エンジンが理解できるようになっているのです。つまり、検索エンジンが文脈からユーザーが何を知りたいと考えているのかを理解し、関連性の高い検索結果を表示できることを意味します。

これまで検索エンジンは、キーワードとなる単語は理解できても、文脈は理解できないものでした。そのため、コンテンツが本当にユーザーの求めているものではなかったとしても、キーワードの関連などから検索結果として関連づけてしまうことがあったのです。BERTアルゴリズムにより、文脈を理解できることでGoogleユーザーの検索意図に応える精度が高まりました。

BERTアルゴリズム導入のビフォーアフター

BERT導入の前後を比較できる具体的な例を紹介しましょう。

2019年10月25日にGoogleが公開している「Understanding searches better than ever before」という記事によると、「for」や「to」などの前置詞に重要な意味があったとしてもBERTアルゴリズムにより文脈を理解できるようになるので、ユーザーは自然に検索ができると言及しています。

例として挙げられたのは、「2019 brazil traveler to usa need a visa」という検索を行ったケースです。日本語では「2019年ブラジルへの旅行者はビザが必要」という意味であり、ここでは「to」という単語がユーザーの検索意図において特に重要な役割を果たします。文脈の読み取り精度が高まることで、的確な検索結果ユーザーに与えられる例です。

bert.png

BERT導入前後の検索結果の例(画像引用:Understanding searches better than ever before

「to」は「ブラジルから米国」という重要な部分を示していますが、BERTアルゴリズムの導入前は、上の図の左側(Before)のようにアメリカ人がブラジルに旅行すると解釈して検索結果を返してしまいます。しかし、BERTアルゴリズムの導入により、上の図の右側(AFTER)のようにブラジルの人が米国に旅行する場合にビザが必要であることを掲載したコンテンツを表示できるのです。

この例からわかるように、BERTアルゴリズムはキーワードの組み合わせではなく、ユーザーの自然な問いかけに柔軟に対応できます。ユーザーが調べたいことを頭の中で考え、自分でキーワード化して検索するのではなく、会話のように自然な入力で検索をしたほうが、的確に検索意図に応えられるということです。近年増えている音声検索はまさにこのような検索語句に該当するでしょう。Googleアナリティクスを見ていると、検索クエリに音声検索と感じるものが多くなっていることに気づいている人も多いのではないでしょうか。「検索」という行為がより身近になっているということです。