この記事は2015年8月25日に公開された記事を再編集したものです。

本来は「見出し」や「索引」という意味をもつ”インデックス”というキーワードは、GoogleのおかげですっかりSEO用語となってしまいました。
ほとんどのウェブ担当者は、Googleクローラーが収集したサイトのデータが、データベースに処理されることと認識しているでしょう。

Googleの自然検索からのトラフィックを増やすためには、ウェブページが正しくインデックスされることが当然の条件となります。
検索順位を高める施策を行っていても、ページインデックスされていないのでは元も子もありません。

今回は、インデックス数を確認する方法や、インデックスに影響を与える要因などをご紹介します。

ウェブサイトのインデックス数を確認する方法

ウェブサイトのインデックス数を調べる方法は、“site:”コマンドで調べる方法と、Google Search Consoleで調べる方法があります。

“site:”コマンドで調べる方法

“site:”コマンドで調べる方法は、Googleの検索フォームに、site:自社のURLと入力します。

SEO担当者なら知っておくべきインデックスに与える影響要因5つ

簡単に調べられる方法として知らていますが、非常に不安定な検索数を表示しますので数値はあてになりません。

しかし、“site:”コマンドでの検索結果で表示されているページ数が、公開しているページよりも極端に少ない場合は、インデックスされていないページが多い可能性がありますので、一つの目安として活用することができます。

Google Search Consoleで調べる方法

Google Search Console(旧ウェブマスターツール)には、インデックスに登録されているURLの数を表示する「インデックス ステータス」という項目があります。
ダッシュボードで[Google インデックス] > [インデックス ステータス]をクリックすると表示することができます。

search console

インデックスに登録されたページの総数が表示されますので、ウェブサイトを定期的に更新している場合は基本的に増えていくことになります。
数値は“site:”コマンドで調べる方法よりも正確なのはいうまでもありません。

インデックス ステータスの項目の「詳細」ボタンをクリックすると、「 インデックスに登録されたページの総数」だけでなく、「ロボットによりブロック済み 」「削除済み」などの他の項目も表示されます。

index status

「ロボットによるブロック済み」は、robots.txtファイルで禁止されているためにクロールできなかったURLの総数、「削除済み」は、URL削除ツールを使用して削除したURLの数を表しています。

また、Search Console ヘルプでは、ウェブ担当者がインデックス ステータスで定期的にチェックするべき4項目をあげています。

・グラフが着実に上昇しているかどうかを確認する
・急激な減少がないかどうか確認する
・サイトのインデックス数が異常に多くないか注意する
・急激な変化がないかどうか確認する
引用元:Search Console ヘルプ

インデックス ステータスのグラフに異常があった場合は、重複コンテンツ、正規化の処理、リダイレクト処理、robots.txt処理などの基本的な問題からチェックすると効率的です。

タブ切り替え型のデザインのウェブサイトは要注意

タブ切換え型のデザインを使用しているウェブサイトの場合、インデックスされないコンテンツが存在する可能性が高いので注意が必要です。

Googleのゲイリー・イリーズ氏はフォーラムで、「Bootstrapを使用しているウェブサイトのタブの動的コンテンツを、検索エンジンは見るのか?」という質問への回答として、ユーザーがタブをクリックすることでコンテンツが動的に生成される場合は、Googleはそのコンテンツを見ないと発言しています。

No, we (Google) won’t see the content behind tabs iff the content under the tab is dynamically generated (i.e. not just hidden).
引用元:Are search engines going to see my dynamically created content in Bootstrap tabs?

おしゃれなタブを活用したウェブデザインは魅力的ですが、コンテンツGoogleインデックスされないのならばSEO的には無意味です。

また、ウェブページHTMLのソースに存在していても、タブをクリックするまで表示されず隠れているタイプのコンテンツも重要視しないと発言していますので、上位表示を目指すページにはタブやカーテンなどのデザインを使用するべきではありません。

インデックスに影響を与える要因5つ

2010年に実施されたカフェインと呼ばれるインデックスシステムの刷新によって、Googleは新しいページを発見するとすぐにインデックスをする仕組みを作り上げています。

しかし、ウェブ担当者としては一刻も早くインデックスしてもらいたいと思うものです。
インデックスに影響を与える要因としては、Fetch as Googleサイトマップコンテンツの更新頻度、Ping送信、ソーシャルメディアなどがあります。

1.Fetch as Google

Fetch as Googleを使用すれば確実にクローラーがリクエストしたページに訪れてくれます。
Fetch as Googleは、Search Consoleのダッシュボードで[クロール] > [Fetch as Google]をクリックすると表示されますので、クロールさせたいページURLを入力します。

fetch as google

ただし、Fetch as Googleを実行した後のインデックス送信には上限数が定められており、単一のURLで使用する場合は月に500回、そのURLからリンクしているページも含む複数のURLをリクエストする場合は月に10回までとなっています。

新規コンテンツを公開する度にFetch as Googleを使用する必要はありませんので、ウェブページに大きな変更を加えたなどの特別な状況で使用します。

ちなみに、Fetch as Google以外にも、同様の機能を持ったページがあります。使ってみてはいかがでしょうか。
参考:新規作成ページや更新したページのURLをGoogleに通知する方法4選 | アソビズム

2.サイトマップの送信

サイトマップを送ることもインデックスの促進に役立ちます。
WordPressサイトの場合は、Google XML SitemapsYoast SEOなどのプラグインを使用すれば、新規投稿と同時にサイトマップを更新してGoogleに通知してくれます。

3.コンテンツの更新頻度

コンテンツの更新頻度が高ければ、クローラーの訪問頻度も高まります。何カ月も更新しないサイトと毎日更新するサイトのクロール頻度が異なるのは当然です。

高品質なコンテンツを定期的に更新していれば、自然とクロール頻度が増加してインデックスに結びつきます。

4.Ping送信

依然としてPing送信やRSS配信もインデックスの促進に役立ちます。
WordPressサイトの場合は、ダッシュボードの[設定] > [投稿設定]から、「更新情報サービス」の項目でPing送信の設定をすることができます。
Ping

5.ソーシャルメディア

TwitterやFacebook、Google+などのソーシャルメディアの要因は、ランキングのアルゴリズムに今のところ利用されていません。しかし、インデックスのスピードを高める可能性があります。

特にTwitterGoogleは2015年に2度目の提携をしていますので、ツイート内容をランキング要因として使用していなくても、URLの発見に活用している可能性があります。
コンテンツの新規投稿時に、記事のURL含んだをツイートするといいかもしれません。

まとめ

ウェブサイトのインデックス数を調べる方法や、インデックスに影響を与える要因について解説しましたが、インデックス状況を定期的に確認することはウェブ担当者の基本業務の一つです。

しかし、「インデックス ステータス」のグラフに急激な変化があった時に、インデックス ステータスの情報だけで問題点を特定することは困難です。
Search Consoleの「クロール」などのレポートもチェックしながら、問題点を広い視点で探すことが重要となります。

当記事をきっかけに、インデックスデータを1つの情報として使いこなせるようになりましょう。

このニュースを読んだあなたにおすすめ

SEO対策に関するカリキュラム
理解できてる?SEOのよくある間違い6選〜キーワード出現率・被リンク・インデックス数など〜
コンテンツSEOにおける魅力的なコンテンツの作り方

このニュースに関連するカリキュラム

SEO対策に関するカリキュラム

SEO対策に関するカリキュラム

SEO対策に関するカリキュラムを体系立てて学ぶことができます。