Google Search Consoleインデックスカバレッジと向き合ってみました

二度目まして!毎月のサイトチェック作業に震えていますハシモトです!

弊社では、「Google Search Console」を使用して、サイト上に問題点がないか、毎月定期的にチェックを実施しております。※弊社にてサイトの運用・保守を請け負っているクライアント様のWebサイトを対象
(以下、Google Search Consoleのことを敬意を込めてサチコ様とお呼びさせて頂きます。)
このチェック作業は、入社後早々から携わっているので、以前に比べるとだいぶ私自身の知見も深められてきているところですが、正直なところ、毎度サチコ様のご指摘にドキドキさせられてます。今回は、サチコ様の数あるご指摘の中でも「インデックスカバレッジ」について、真摯に受け止める記事にしていきたいと思います。

インデックスカバレッジとは

インデックスカバレッジとは、サーチコンソールに実装されている機能の一つです。サイト内の各ページはインデックス状況をチェックすることができます。インデックス状況に異常がある場合は、カバレッジエラーとしてサチコ様よりご指摘があります。
※カバレッジ…カバーしている(した)範囲

Q.どこで確認できる? ツール内左メニューの「カバレッジ」項目より確認できます。サチコ様からのご指摘はインデックスカバレッジレポートにまとめてあります。

Q.インデックス状況の確認はなぜ必要? インデックスとは、クロールしたページの情報をGoogleのデータベースに格納することを意味します。「Googleのデータベースに格納されている」ということは、「ページがGoogleに認識されている」ということになり、その結果、ページはGoogleの検索結果一覧に表示されるようになります。
インデックスされていなければ、そのページはGoogleに認識されておらず、検索結果に表示されません。

カバレッジエラー解読&解消法

ここでは、サチコ様からより頂いたご指摘を翻訳し、ご指摘内容と向き合っていきたいと思います。サチコ様のご指摘内容と向き合う際は「該当URLはインデックスしないページか?インデックスしたいページか?」を明確にしておきましょう。

送信されたURLに noindex タグが追加されています

訳『サイトマップにURL記載されているから見に来たのに、noindexタグがついているんだけど、インデックスさせたいの?インデックスさせたくないの?』

noindexタグとは、文字通り「インデックスしない」ように設定するタグです。「インデックスをする」設定と「インデックスをしない」設定がしてある矛盾した状況に、サチコ様は混乱されているということです。混乱を解消するために、「インデックスをする設定」と「インデックスをしない設定」の両方がある矛盾した状況を正してあげましょう。

◆解消方法◆
・インデックスしないページの場合  サイトマップより該当ページのURLを削除しましょう。

・インデックスしたいページの場合  該当ページをよりnoindexタグを削除しましょう。WordPressを使用している場合、プラグインにて設定されている可能性があるので、こちらも確認して設定変更しましょう。

送信されたURLが見つかりませんでした(404)

訳『サイトマップに記載されているURLを見に行ったけど、ページがなかったよ』

URLはサイトマップに記載されているけど、記載されているURLのページが存在していない状況です。

◆解消方法◆
・インデックスしないページの場合 サイトマップからも該当ページのURLを削除しましょう。

・インデックスしたいページの場合 サイトマップに記載しているURLにスペルミスなどがないか確認、あれば修正。

※ページを公開/非公開するサイトの場合
ブログのように記事を「公開」にしたり、「非公開」にしたりするサイトがあるかと思います。一時的に「非公開」としていたとき、クローラーのタイミングが重なることがあります。
この場合は、再度クローラーされるタイミングで解消することがありますので、しばらく様子をみましょう。もしくは、インデックス登録のリクエストを送信し、次回のクローラーを待ちましょう。

送信されたURLはソフト 404 エラーのようです

訳『サイトマップURLに記載されているから見に来たけど、このページは404ページみたいにインデックスさせなくても良いレベルのページだよ』

URLがサイトマップに記載されており、対象ページが存在しているにも関わらずGoogleからコンテンツがないと判断されており、実質的に404ページと同等なものとして扱われてしまっている状況です。

◆解消方法◆
・インデックスしないページの場合  ページのHTTPステータスコードを変更して404設定を明示しましょう。もしくは、 noindex設定をしてインデックス登録させないようにしておきましょう。
 
・インデックスしたいページの場合 「このページはインデックスするに値しますよ」と明示する必要があります。「このページはインデックスするに値しない」と判断されてしまうのは、様々な原因がありますが、ここでは3つ程ご紹介します。

①ページ内のコンテンツが適切に読み込まれていない
robots.txt によってブロックされていたり、ページ上のリソースが多すぎ・大きすぎる、読み込みが遅い場合はソフト 404 と解釈されるようです。robots.txtによってブロックしている場合は解除しましょう。ブロックされていない場合は、リソースの圧縮や余分なリソースがないか確認してみましょう。

②コンテンツがない or 乏しい
コンテンツがない場合や存在していても低品質、量が少ない場合はソフト404と判断されてしまう可能性が高いようです。コンテンツの拡充を考えてみましょう。

③Googleの誤判定
「存在しません」「見つかりませんでした」「Not Found」「Error」などエラーページにありがちなテキストが強調されているページは、誤判定を受けてしまう可能性が高いようです。上記のようなテキストの強調表示は控えましょう。

悩みが解消しないときは

Google 検索セントラルのヘルプコミュニティというものがあります。Google Search Consoleの使い方やインデックス、ランク付け、クロールなどに関連する質問とその回答が記述されています。
同じような状況の質問を探してみたり、状況マッチしない場合は、質問してみるのも良いでしょう。

まとめ

今回はサーチコンソールの中でも「インデックスカバレッジ」に着目してみました。インデックスカバレッジは、作成したサイトがきちんとGoogleに認識されているかどうかを教えてくれる重要な機能です。サチコ様のご指摘は、サイトに意図していない設定をしていたことに気づくきっかけにもなる、ありがたいお言葉です。サチコ様よりご指摘があった場合は、内容・サイトの状況等を確認して、解消しておきましょう!
株式会社ライズウィル

株式会社ライズウィル

〒103-0013
東京都中央区日本橋人形町2-15-1
フジタ人形町ビル7F
TEL : 03-4590-3200
FAX : 03-4590-3201
E-Mail : info@risewill.co.jp
URL : https://www.risewill.co.jp