2024/03/30
Googleは、インターネット上の膨大な情報を整理して独自のデータベースに格納し、検索クエリ(入力されたキーワードとなる言葉)に対して最適化されたページを、ランキング形式にして表示する仕組みを作り上げています。
この膨大な情報の整理において重要なプロセスがインデックス登録であり、その仕組みをSEO担当者は理解しておくことが肝心です。
この記事では、インデックス登録とは何かという基礎知識を含め、インデックス登録にふさわしいページの内容などを包括的に解説します。
目次
Googleインデックス登録とは、Googleの検索エンジンがウェブページの存在を認識し、検索結果に表示するための情報を、データベースに分類して保存することを指します。
このプロセスによって、ユーザーが特定のキーワードで検索を行った際に、最も関連性の高い順に、ウェブページをリスト上にして検索結果として表示することができます。
インデックス登録は、ウェブサイトをGoogleの検索結果に表示させるためには必須のステップであり、SEO(検索エンジン最適化)において重要なポイントです。
Googleのクローラー(Googlebot)がインターネット上で新たに公開、アップデートされたウェブページの情報を自動的に収集し、Googleのアルゴリズムによって分析されます。
分析された情報を描画(レンダリング)し、問題がないと判断されると、インデックス登録の完了です。
Googleインデックス登録については、Google検索セントラルの「JavaScript を処理する仕組み」の図解が参考になります。
インデックス登録は、HTMLファイルだけでなく、
などが含まれ、その他にも、画像、動画、プログラミング言語のソースコードもインデックス登録の対象です。
ただし、これらのファイルをウェブサイトに掲載する際は、適切なメタデータや代替テキストを用いて、Googleが内容を理解できるようにすることが求められます。
主に、Google Search Consoleの機能である、
を使用してクロールを促すことになります。
同時に、ウェブページがユーザーフレンドリーで、高品質なコンテンツを提供していることも、インデックス登録には不可欠です。
ただし最終的には、アルゴリズムを基にインデックス登録がジャッジされるため、Google Search Console上で状況を確認しなければなりません。
インデックス登録されていないウェブページは、その理由も提示されることから、適切なメンテナンスをした後に、インデックス登録のリクエストを行うことでカバーできます。
XMLサイトマップは、ウェブサイトの全ウェブページのURLをリスト化したファイルです。
Google Search Consoleの左側メニューから「サイトマップ」を選択し、XMLサイトマップのURLを入力して「送信」をクリックするだけです。
なお、XMLファイルのURLは、WordPressを利用している場合は自動で生成され、大抵、「https://yourdomain.com/sitemap.xml」というパターンになります。
自動でXMLサイトマップが生成されないときは、以下の記事を参照するとよいです。
参照:Googleインデックス登録とは?インデックス完了方法を徹底解説! | 株式会社S-fleage (エスフレイジ)
一方、HTMLサイトマップと混同されることもありますが、HTMLサイトマップはクローラー向けではなく、主にウェブサイトの訪問者を対象として作成される、ウェブページのリンク集です。
新しくコンテンツを追加、または更新した場合は、Google Search Consoleの左側メニューから「URL検査」をクリックし、上部検索バーに当該URLを入力してエンターキーを押せば、最新のインデックス状況がステータスとして表示されます。
ステータスが、
のいずれかであったとしても、「インデックス登録をリクエスト」を実行します。
インデックス登録の確認は、主に3つの方法が代表的です。
1.Google Search Consoleのページメニューの選択
2.Google検索でウェブページのタイトルを入力する
3.Google検索で「site:」のコマンドを入力する
これらの方法を使用して、正しくGoogleにインデックス登録されているかどうかを確認することができます。
Google Search Consoleの左側メニュー「インデックス作成」の「ページ」を選択すると、未登録と登録済みのウェブページの数を把握できます。
下にスクロールすると、「ページがインデックス登録されなかった理由」がズラッと表示されますので、必要に応じて手を打つことになります。
また、左メニューの「サマリー」を選択して下にスクロール後、「インデックス作成」からも同様に確認が可能です。
この一連の手順を通じて、ウェブページがGoogleに正しくインデックス登録されているかを確認できます。
唯一無二の情報である記事タイトルを活かした方法で、例えば、ウェブページのタイトルに「SEO対策は京都の株式会社エスフレイジ」というフレーズが入っていれば、
“SEO対策は京都の株式会社エスフレイジ”
と、引用符付き(完全一致)で、精度の高いインデックス確認が可能です。
仮に社名のみでの検索となると、稀に同名の他社が検索結果に表れることがあるため、タイトルの文章やフレーズがおすすめです。
検索窓に、「site:URL」という形式で入力して確認する方法です。
例 site:https://www.s-fleage.com/
トップページのURLを入力すると、インデックス登録されているサイトの内のウェブページが検索結果に全て表示され、その数を調査することも可能になります。
ただし、あくまでインデックス登録の数であり、ランキングを意味するものではありません。
Google検索セントラルでは、「クロールには数日から数週間かかることがあります。」としか書かれていないことから、経験則や肌感覚から推測するしかないのが現状です。
新規ドメインならば、早くて数週間、遅ければ3ヶ月以上ということもあります。
ウェブサイトの構造、品質、内容、更新頻度、外部からのリンクの数、クローラーの巡回頻度など、さまざまな要素が影響することから、具体的な期間を挙げることは非常に難しいと言えます。
不透明だからこそ、XMLファイルを送信するといった手段を講ずることで、インデックス登録の可能性を高めていくことが必要です。
Googleの検索品質評価ガイドラインに見合わないウェブページと判断された場合は、その措置としてインデックスの削除が実行されます。
特に悪質なガイドラインに反するSEOの施策、あるいは疑いを持たれると、サイト全体がインデックス登録抹消という厳しい措置が取られ、ペナルティ発動を認識することになります。
一方で、意図的に検索結果から一部のウェブページを、一定期間、インデックス登録から取り除くことも可能です。
ペナルティは、手動による判定と機械的な判定の2種類に大別され、
という違いがあります。
ペナルティの状況は、Google Search Consoleの左側メニュー「セキュリティと手動による対策」から、さらに「手動による対策」にアクセスすることで確認が可能です。
解決策はペナルティの種類や違反内容によりますが、一般的にはガイドラインに適合するようサイトを修正し、Googleに再審査のリクエストをします。
古すぎる情報、ログインページなど、特定のウェブページを非表示にしたい場合は、
といった方法があります。
Google Search Consoleでは、左側メニューの「削除」を選択した後に、「一時的な削除」または「古いコンテンツの削除ツール」を使用します。
その他には、.htaccessファイルでのパスワード設定、サーバーから該当ファイル(ページ)の削除、「noindex」タグの使用でクロールを回避、といった方法も有効です。
インデックス削除の確認は、前述のインデックス登録の確認方法と全く同じ「site:」コマンドが手軽です。
該当のURLがGoogleの検索結果に表示されなければ、インデックスから削除されたと判断できます。
そもそもインデックス登録に絶対的な保証はありませんが、Googleにインデックスされない要因として挙がりやすいのは、以下の3点です。
1.新規ドメイン
2.低品質コンテンツである
3.noindexタグが付いている
インデックスされない、インデックスされにくい問題は、かなりの頻度で起こりがちのため、それぞれ対処法などを少し詳しく説明することにします。
ウェブサイトが適切に構造化され、ユーザーにとって有益なコンテンツを提供していることが大前提ではありますが、少なくともXMLサイトマップの送信は必須です。
定期的にインデックス登録の状況をGoogle Search Consoleでチェックし、XMLサイトマップ送信から1ヶ月近く経過しても好転しないときは、手動によるインデックス登録のリクエストも検討します。
ただし、インデックスがされない間もSEOの施策を実行し、クローラーを呼び込む自助努力は必要です。
ユーザーの検索に対して適切な回答を提供できない、情報量が少なく、経験、専門性、権威性、信頼性といった検索品質評価ガイドラインの重要な指標を満たしていないコンテンツは、低品質コンテンツと見なされます。
これらの重要な部分を考慮してコンテンツを作成し、最適化も実施することで、インデックス化の可能性を高めることが最善策です。
インデックスさせたいウェブページに、一部、noindexタグが付いていたということは、実はよくあることで、タグを外すことが最優先の改善事項になります。
同じように、robots.txtの記述ミスも、Googleにインデックスされない原因となりがちです。
noindexタグが適切に付与されているか、robots.txtが正しく記述されているか、確認することが重要です。
モバイルファーストインデックスとは、スマートフォン用Googlebotでクロールしたモバイルフレンドリーなサイトのコンテンツを優先して、インデックスの判定に使用するGoogleの方針を指します。
モバイルフレンドリーなサイトとは、主にレスポンシブデザインを意味し、Googleも推奨しています。
ゆえに、モバイルファーストインデックスを前提としたサイトのデザインも、ある意味では、インデックスに大きく影響することは間違いありません。
今回の記事では、Googleのインデックスについて詳しく解説しました。
インデックス登録は検索結果の表示に必須のプロセスであり、多くのユーザーに訪問してもらうための布石に過ぎません。
逆に、インデックス登録されなければ、優れたコンテンツだとしても、存在していないことと同じです。
SEOは、インデックスされて初めて効果が現れるものであり、それまでのプロセスは、ほんの土台作りでしかありません。
改めてインデックス登録は、SEO対策のスタート以前のことでありながらも、密接に関わっていることが理解できれば幸いです。