インデックスに登録されていないページ数を確認する方法!原因と対処法も解説
Webサイトの検索エンジン最適化(SEO)において、インデックスに登録されていないページ数を把握し、適切な対策を講じることは重要です。この記事では、インデックスに登録されていないページ数を確認する方法や、インデックス登録されない原因と対処法について詳しくご紹介します。
インデックスに登録されていないページ数を調べる方法
インデックス登録とは、GoogleのクローラーがWebページを収集し、大規模なデータベースに登録することを指します。登録されたページのみが検索結果に表示されるため、自社サイトのインデックスに登録されていないページ数を把握し、改善することは重要です。
インデックスに登録されていないページ数を確認するには、Google Search Consoleを使用します。手順は簡単で、Search Consoleを開き、サイドメニューの「インデックス作成」タブから「ページ」を選択するだけで確認できます。
これによりインデックス登録済みのページ数と未登録のページ数が表示され、さらに詳細を知りたい場合は「ページがインデックスに登録されなかった理由」にある各項目をクリックしてURLの一覧を確認します。これにより、未登録になった理由を把握でき、改善することでインデックスへの登録が期待できます。
インデックスに登録されない主な原因
ここでは、インデックスに登録されない主な原因についてご紹介します。
クローラーが来ていない
ページがインデックス登録されない主な原因には、クローラーが来ていないことがあげられます。特に新しいサイトや更新頻度が低いサイトなどでは、クローラーの訪問数が少なくなり、インデックス登録までに時間がかかることがあります。
また、内部リンクのない孤立したページや深い階層にあるページも、クローラーが見つけにくくなります。このようなページについては、Google Search Consoleでのインデックス登録のリクエストやXMLサイトマップの送信を試してみると効果的です。
ガイドラインに違反している
Googleのガイドラインに違反しているコンテンツは、クローラーが認識していてもインデックスされないことがあります。従って、ほかのサイトからのコンテンツのコピーや不自然な被リンクは避けるべきです。自サイトや他サイトですでに紹介されている内容の記事であれば、Googleは同様のページをインデックスしないでしょう。
robots.txtやmetaタグを設定している
robots.txtやmetaタグを使用してGoogleクローラーの巡回を拒否する設定は、サイトの特定のページを意図的に非表示にするために行われます。これはコンテンツマーケティングの戦略の一環として行われるため、施策を行っていないサイトでrobots.txtやmetaタグを意図的に設定し、非掲載にすることはまれです。しかし、サイト管理者の引き継ぎや過去の設定の把握不足により、このような設定が残っている場合もあります。
インデックス登録されないときの対処法
ここでは、インデックス登録されないときの対処法についてご紹介します。
URL検査を行う
Google Search ConsoleのURL検査機能を使えば、自分の指定したページにクローラーが訪れるようにリクエストできます。ただし、リクエストを行ったからといってすぐにクローラーが訪れてインデックスされるわけではありません。リクエストをしてから一定の時間を置いてから、再度インデックスされているかを確認することが重要です。
サイトマップを送信する
Googleのクローラーがサイトの構成を認識しにくい場合、ページが登録されないことがあります。このような場合は、サイトの構成をクローラーが認識しやすいように改善するか、Google Search Consoleのサイトマップ送信機能を活用しましょう。サイトマップ送信では、サイトマップがある「sitemap.xml」を送信することで、クローラーにページの登録をリクエストできます。
ただし、リクエストしたからといってすぐにページが登録されるわけではないので、しばらく時間を置いて再度確認しましょう。登録されない場合は、サイトの構成を改善してクローラーがページを認識しやすくする必要があります。
E-E-A-Tを考慮してコンテンツを作成する
ページが登録されない問題を解決するには、良質なコンテンツを作成することが重要です。ユーザーの検索意図に合った価値の高い情報を提供することで、インデックス登録されない状況を改善できます。E-E-A-T(経験、専門性、信頼性、権威性)の側面も考慮しながら、コンテンツの質を向上させましょう。
robots.txtやmetaタグタグを見直す
インデックスに登録しないように設定されていることがあります。ここでは、robots.txtやmetaタグの見直しについてご紹介します。
robots.txt
robots.txtで非掲載設定をしている場合、クローラーがその指示に従い、特定のURLへのアクセスを制限します。例えば、robots.txtに「Disallow: /wp-admin/」と記述すると、/wp-admin/配下のページへのクローラー巡回をブロックします。このような設定があると、クローラーはそのページを巡回せず、結果としてそのページはインデックスに登録されなくなることがあります。
noindexタグ
ページのHTMLにnoindexタグが設定されていると、そのページを検索エンジンがインデックスしないように指示されます。noindexタグは、Googleの検索結果に表示したくないページや、クローラーにインデックスしてほしくないページに使用されます。
noindexされているページには、HTMLファイルのhead内に、<meta name="robots" content="noindex">というタグが追加されています。WordPressなどのCMSを使用している場合は、設定画面でnoindexにチェックをしていることもありますので、確認してみましょう。これにより、noindexを解除し、該当のページをインデックスに登録させられます。
まとめ
この記事では、インデックスに登録されていないページ数の確認方法や、未登録の原因と対処法についてご紹介しました。原因にはクローラーが来ていないことやガイドラインに違反していること、robots.txtやnoindexタグを設定していることがあげられます。これらを対処することで、ページをインデックスに登録できる可能性が高まり、ビジネスの成果につなげることが期待できるでしょう。