第4章:実践手順:原因特定から具体的な修正まで
Googleサーチコンソールで「インデックス未登録」と表示された場合、焦らずに以下の手順で原因を特定し、修正作業を進めていきましょう。
ステップ1:サーチコンソールでインデックス状況を確認する
まず、Googleサーチコンソールの「インデックスカバレッジレポート」を開きます。このレポートは、サイト内の各ページのインデックス状況を「有効」「除外」「エラー」の3つのカテゴリに分けて表示します。
「除外」タブをクリックし、どのステータスでページが除外されているかを確認します。ここに表示される「原因」が、問題解決の糸口となります。
ステップ2:未登録の原因を特定する(各ステータスの意味と対処法)
インデックスカバレッジレポートの「除外」セクションには、様々な「原因」が表示されます。それぞれの意味を理解し、該当するページがなぜ除外されているのかを詳細に分析します。
「検出 – インデックス未登録」
意味: Googlebotがページを認識しているものの、まだクロールしていない状態です。クローラーはサイトマップなどでURLを発見しましたが、クロール予算(Googlebotがサイトに割り当てるクロールの頻度や深さ)の都合や、ページの重要度が低いと判断されたため、クロールを後回しにしている可能性があります。
考えられる原因:
- 新しいページで、まだGooglebotが訪れていない。
- サイトのクロール予算が不足している(特に大規模サイト)。
- 内部リンクが少ない、あるいはページへのリンクパスが深い。
- コンテンツの品質が低いと判断されている。
対処法:
- URL検査ツールで確認: まず対象のURLをURL検査ツールで検査し、「検出済み – 未インデックス登録」となっていることを確認します。
- 内部リンクの強化: サイト内の重要なページから、このページへの内部リンクを増やす。
- コンテンツの質向上: ユーザーにとって価値のある、ユニークで網羅性の高いコンテンツに改善する。
- XMLサイトマップへの追加: ページがサイトマップに含まれているか確認し、含まれていなければ追加・更新する。
- クロール予算の最適化: ページの読み込み速度を改善し、サーバーの応答時間を短縮する。不要なページのクロールをrobots.txtで制限し、重要なページにクロールを集中させる。
- 手動でインデックス登録をリクエスト: 緊急性が高い場合は、URL検査ツールから「インデックス登録をリクエスト」を実行する。ただし、根本的な原因が解決されていないと、再度インデックスから外れる可能性があります。
「クロール済み – インデックス未登録」
意味: Googlebotがページをクロール(訪問)しましたが、インデックス登録しなかった状態です。多くの場合、コンテンツの品質が低い、重複している、あるいはGoogleの品質ガイドラインに違反していると判断されたことが原因です。
考えられる原因:
- コンテンツの質が低い(情報不足、独自性がない、スパム的)。
- 他のページや外部サイトと内容が重複している。
- noindexタグが削除されているにもかかわらず、Googleが古いキャッシュ情報に基づいてインデックスしないと判断している。
- ページの品質やユーザー体験が低いと判断された。
対処法:
- コンテンツの改善: ページのコンテンツを大幅に改善し、独自性、網羅性、専門性を高める。ユーザーの検索意図を満たす内容になっているか見直す。
- 重複コンテンツの解消: 他のページと内容が重複している場合は、正規URLをcanonicalタグで指定するか、内容を統合・差別化する。
- noindexタグの確認: 誤ってnoindexタグが付与されていないか確認。もし以前にnoindexが付与されており、最近削除したばかりであれば、Googleが再評価するまで待つ必要があります。
- 手動でインデックス登録をリクエスト: コンテンツ改善後にURL検査ツールからリクエストする。
「noindexタグによって除外されました」
意味: ページのHTMLに「」タグが記述されているため、Googleが意図的にインデックスから除外した状態です。
考えられる原因:
- 意図的にnoindexを設定している。
- 設定ミスやプラグインの不具合で、意図せずnoindexが付与されている。
対処法:
- noindexタグの確認と削除: 対象ページのHTMLソースを確認し、noindexタグが存在するかを確認します。CMSを使用している場合は、ページ編集画面やSEOプラグインの設定でnoindexが有効になっていないか確認し、必要であれば削除します。
- 再インデックスのリクエスト: noindexタグを削除したら、URL検査ツールで「インデックス登録をリクエスト」します。
「ページにリダイレクトがあります」
意味: 対象のURLが他のURLにリダイレクトされているため、リダイレクト先のページがインデックスの対象となります。
考えられる原因:
- 意図的に301リダイレクトを設定している(例: 旧URLから新URLへ)。
- URLの正規化のためにリダイレクトしている。
- 設定ミスで無限リダイレクトループが発生している。
対処法:
- リダイレクトの確認: これが意図されたリダイレクトであれば問題ありません。リダイレクト先のページが正しくインデックスされているかを確認します。
- リダイレクトミスの修正: 意図しないリダイレクトや、リダイレクトチェーン(複数のリダイレクトが連続している状態)が発生している場合は、.htaccessファイルやCMSのリダイレクト設定を見直し、直接正規URLへリダイレクトするように修正します。
「ソフト404」
意味: ページが存在しないにもかかわらず、HTTPステータスコード200(成功)を返し、かつ内容が「ページが見つかりません」といった404ページと酷似している状態です。Googleはこれをエラーページとみなし、インデックスから除外します。
考えられる原因:
- 存在しないページがHTTP 200を返している。
- サイト内検索結果ページなど、内容が非常に薄いページが多数生成されている。
対処法:
- HTTPステータスコードの修正: ページが存在しない場合は、必ずHTTPステータスコード404(Not Found)または410(Gone)を返すようにサーバーを設定します。CMSの場合は、テーマやプラグインの設定を見直します。
- コンテンツの改善または削除: 内容が薄いページは改善するか、削除して404/410を返すようにします。
「重複しています。Googleにより、ユーザーが選択した正規ページとは異なるものとして認識されました」
意味: サイト内に同じ内容のページが複数存在し、Googleが正規(オリジナル)ではないと判断したページです。
考えられる原因:
- 複数のURLで同じコンテンツにアクセスできる(例: PC版とモバイル版、異なるパラメータ付きURL)。
- canonicalタグが設定されていない、あるいは間違って設定されている。
- 重複コンテンツが大量に生成されている(例: 検索結果ページ、タグページ、カテゴリページ)。
対処法:
- canonicalタグの設定: 重複する各ページのheadセクションに、正規のURLを指すcanonicalタグを記述します。
- 301リダイレクト: 不要な重複ページは、正規ページへ301リダイレクトを設定します。
- コンテンツの統合・差別化: 内容が重複している複数のページを一つに統合するか、それぞれの内容を大幅に差別化します。
ステップ3:原因に応じた具体的な修正を行う
原因が特定できたら、それぞれの問題に対応した修正作業を行います。
サイトマップの更新
サイトマップが最新の状態であるかを確認し、変更が加えられたページや新しく公開されたページが正しく含まれているか確認します。必要に応じてサイトマップを再生成し、Googleサーチコンソールから再送信します。大規模サイトでサイトマップが肥大化している場合は、重要なページのみを抜粋したサイトマップを作成したり、サイトマップを分割したりすることも検討します。
noindexタグの確認と修正
URL検査ツールで対象ページを検査し、「インデックス登録を許可」の項目がどうなっているか確認します。「noindex検出」と表示されていれば、HTMLソースやCMSの設定を確認し、noindexタグを削除します。修正後、再度URL検査ツールでインデックス登録をリクエストします。
canonicalタグの適正化
重複コンテンツの疑いがある場合は、正規化したいURLを明示するcanonicalタグをHTMLの
セクションに設置します。例えば、パラメーター付きのURLやセッションIDを含むURLがインデックスされないように、シンプルな正規URLを指定します。自己参照canonical(そのページ自身を正規と宣言する)も重要です。robots.txtの確認
Googleサーチコンソールの「robots.txtテスター」を使用して、対象のURLがrobots.txtによってブロックされていないかを確認します。意図せずブロックされている場合は、robots.txtファイルを編集し、「Disallow」の記述を修正します。修正後は、テスターで再度検証し、サーチコンソールに更新を通知します。
コンテンツの品質改善
「クロール済み – インデックス未登録」の原因として最も多いのが、コンテンツの品質問題です。ユーザーにとって本当に価値のある情報を提供できているか、情報を網羅できているか、独自の見解が含まれているか、などを徹底的に見直します。不十分であれば、追記・加筆を行い、情報の信頼性を高める工夫(出典の明記など)も有効です。
内部リンクの最適化
孤立しているページや、深い階層に埋もれているページには、重要な関連ページから内部リンクを張ります。アンカーテキストは、リンク先のコンテンツ内容が分かりやすい具体的な言葉を使用します。これにより、クローラーの巡回効率が向上し、ページの重要度をGoogleに伝えることができます。
クロールの再リクエスト
上記いずれかの修正を行った後、GoogleサーチコンソールのURL検査ツールで対象URLを再度検査し、「インデックス登録をリクエスト」をクリックします。これにより、Googlebotに修正後のページを再度クロールするよう促します。ただし、リクエストはあくまでクロールを促すものであり、インデックスを保証するものではありません。根本的な問題が解決されていない限り、インデックスされない可能性があります。
これらの手順を根気強く実行し、Googleサーチコンソールを定期的に確認しながら改善を続けることが、インデックス未登録問題を解決し、サイトの検索パフォーマンスを向上させる鍵となります。
第5章:インデックス対策における注意点
インデックス未登録の問題に対処する際、いくつかの重要な注意点を理解しておくことが、無駄な労力を省き、効果的な対策を行う上で不可欠です。
1. 即効性を求めない
Googleのインデックスプロセスは、リアルタイムで即座に反映されるものではありません。特に大規模サイトや新規サイトの場合、修正を加えてからGooglebotが再クロールし、インデックスに反映されるまでには、数日から数週間、場合によってはそれ以上の時間がかかることがあります。
修正後は、すぐに結果を期待するのではなく、Googleサーチコンソールのインデックスカバレッジレポートを定期的に確認し、気長に変化を観察する姿勢が重要です。焦って不必要な変更を繰り返すと、かえって状況を悪化させる可能性もあります。
2. 重複コンテンツとURLの正規化に細心の注意を払う
重複コンテンツは、インデックス未登録の大きな原因の一つです。特に大規模なECサイトや情報サイトでは、意図せず重複コンテンツが大量に発生することがあります。
- 自己生成されるURLの監視: パラメーター付きURL(例: ?sort=price, ?cat=shoes)、セッションID、トラッキングコードなどによって、同じコンテンツに異なるURLが生成されていないか確認します。
- canonicalタグの正確な実装: 重複コンテンツがある場合、必ず正規のURLを指すcanonicalタグをセクションに記述します。自己参照canonical(そのページ自身を正規と宣言する)も忘れずに設定しましょう。
- 301リダイレクトの活用: 完全に不要になった旧URLや重複URLは、適切な正規URLへ301リダイレクトを設定します。
これらの設定が間違っていると、Googleはどのページをインデックスすべきか判断できず、結果としていずれのページもインデックスされなかったり、SEO評価が分散したりする可能性があります。
3. noindexとrobots.txtの併用は避ける
「このページをインデックスさせたくない」という場合に、robots.txtでクロールをブロックし、同時にnoindexタグも記述するという誤った対策が見受けられます。
これはNGです。robots.txtでクロールをブロックすると、Googlebotはそのページにアクセスできないため、noindexタグを発見できません。結果として、Googleはそのページにnoindexタグがあることを知らず、インデックスから削除されないままになってしまう可能性があります。
- インデックスさせたくない場合: robots.txtでブロックせず、noindexタグのみを記述します。Googlebotがページにアクセスし、noindexタグを認識することで、インデックスから除外されます。
- クロールさせたくない場合(インデックス以前の問題): robots.txtでクロールをブロックします。この場合、noindexタグは不要です。ただし、既にインデックスされているページをrobots.txtでブロックしても、Googleがそのページをインデックスから削除するとは限りません。
目的に応じて正しく使い分けましょう。
4. 変更後の検証とモニタリングを怠らない
何らかの修正を行った後には、必ずその変更が意図通りに機能しているかを検証し、継続的にモニタリングすることが重要です。
- URL検査ツールでの確認: 修正後のページをURL検査ツールで検査し、エラーが解消されているか、noindexタグが削除されているかなどを確認します。
- インデックスカバレッジレポートの監視: レポートの変化を追跡し、対象ページが「除外」から「有効」へと移行しているかを確認します。
- サイト全体への影響: 一部の修正がサイト全体に予期せぬ影響を与えていないか、他のページに新たな問題が発生していないかも確認します。
5. 大規模サイトでのクロール予算管理の重要性
数万、数十万といったページを持つ大規模サイトの場合、Googlebotが全てのページを頻繁にクロールすることは困難です。このような状況では、「クロール予算」という概念が重要になります。
- 不要なページのクロール抑制: 検索結果に表示する必要がないページ(ログインページ、管理画面、フィルタリング結果の多数ページなど)は、robots.txtでクロールをブロックするか、noindexタグでインデックスを抑制することで、クロール予算を節約し、重要なページにクロールを集中させることができます。
- ページ表示速度の最適化: ページの読み込みが速いサイトは、より多くのページがクロールされる傾向にあります。サーバーの応答速度や画像の最適化などを行い、クロール効率を高めましょう。
インデックス未登録の問題は、サイト運営において避けて通れない課題ですが、これらの注意点を踏まえることで、より効果的かつ安全に問題解決に取り組むことができます。