SEO

【SEO対策】ブログ記事がインデックスされない理由とその解決方法

2022年6月6日

悩める人
悩める人

ブログ記事を公開しましたが、なかなかインデックスされません。

何が原因なのでしょうか?

インデックスされない理由とその解決方法を知りたいです。

今回はこのようなお悩みにお答えします。

インデックスとは、検索エンジンのデータベースにWebページの情報が登録されることを指します。

検索エンジンには、Yahoo や Bing など様々なものがありますが、本記事では代表的な Google エンジンを例に取り上げます。

ラインナップ

  • インデックスとは?
  • インデックスの申請方法
  • インデックスの状況を確認する方法と原因の特定
  • インデックスされない理由と対処法
  • どうしても自分で解決しない時は?
  • まとめ

このようなラインナップとなっています。

インデックスされないことは、ブログを始めたばかりの方だけでなく、ある程度サイトを運用している方にとっても経験があることでしょう。

気になった方は、ぜひ今回の記事を参考にして役立てていただければと思います。

それでは、早速みていきましょう!

インデックスとは?

「インデックス」について説明する前に、Google がどのような手順をもって検索データベースを構築しているかを説明します。

クロールとインデックス

検索エンジンの仕組みは、クロールで集めた情報をデータベースにインデックスし、ユーザーのニーズを反映したページであるものを上位に表示しています。

みなさんがよく使う Google 検索でキーワードを入力し、表示されるには、Google 側が次のような手順を踏み検索結果を作成しています。

  • Google がクローラー(ロボット)というプログラム(アルゴリズム)を用いて世界中のサイトを巡回
  • 巡回して収集したページのデータを分析し、データベースに登録
  • ユーザーの検索ワードとマッチしたページを、データベースから選択して表示

この手順2 がインデックスと呼ばれる作業です。

手順3 ではインデックスされたページを元に、検索結果を表示するので、インデックスされなければ結果に表示されようがありません。

それほど、Google にインデックスされる、またその作業を行うことはブログ運営をしていく上で重要事項となるわけです。

インデックスの申請方法

ブログやサイトを運営していく中で、ただ記事を淡々と書いているだけでは Google にインデックス登録はされません。

そこでインデックスされるためには、次の2点の作業が必要となります。

  • Google Search Console(サーチコンソール) にリクエストを送る
  • サイトマップ(sitemap.xml)を作成し、アップロードする

それでは順に見ていきます。

① サーチコンソールにリクエストを送る

次のような場合、Google にリクエストを送信する必要があります。

  • 新規投稿ページを公開した
  • 既存の記事をリライトした
  • ペナルティーを改善した

このような場合、リクエストを送信することで、Google にページ評価を促すことができます。
※クローラーを待つ前に、先んじて Google に促すわけです。

リクエストの送り方は次のとおりになります。
※Google Search Console には Google アカウントでログインして利用できることが前提となります。

1、Google サーチコンソールの検索欄に対象記事のURLを入力します。

2、「インデックス登録をリクエスト」をクリック

3、1〜2分ほど待って、「インデックス登録をリクエスト済み」が表示されれば、それでOKです。

② サイトマップを作成し、アップロードする

ブログ運営をするなら、サイトマップ = XMLファイル を必ず作成しましょう。

なぜなら、XMLファイルを作成しアップロードすることで、クローラーにいち早くサイト全体を分析してもらえるからです。

サイトマップ = XMLファイル とGoogle Search Console との連携については、次の記事で詳しく解説しています。

>> 【WordPress】サイトマップの作り方と設定方法【PS Auto Sitemap & XML Sitemaps(旧 Google XML Sitemaps)プラグイン 】

そこまで手間が掛からず簡単に設定できるので、必ず導入しましょう。

インデックスの状況を確認する方法と原因の特定

上記のようにインデックス申請をしても、すべての記事が即インデックス化されるわけではありません。

そこで、インデックス申請した記事のうち、検索エンジンに登録されているかどうかまたその原因を確かめる方法として、次のやり方があります。

インデックス状況の確認

  • 「site:」+ 「サイトドメイン」で検索
  • サーチコンソールで原因を探る

それでは、詳しく見ていきましょう。

① 「site:」+ 「サイトドメイン」で検索

Google エンジンで「site:」+ 「サイトドメイン」を入力することで、サイト全体の記事のインデックス状況を確認することができます。

※ちなみに「サイトドメイン」ではなくても、

  • site:https://yumemoriblog.com/category/blog/
  • site:https://yumemoriblog.com/self-affiliate-and-self-back/

① ディレクトリ単位での検索で、その下位層のページを確認できます。
② 記事独自のURL の検索で、該当ページのみの確認ができます。

1、Google エンジンで「site:」+ 「検索したいURL」で検索する

2、該当記事が検索結果で表示されれば、インデックスされていることになります。

3、実際に存在する記事で、「site:https://yumemoriblog.com/XXXXX/ に一致する情報は見つかりませんでした。」と表示された場合は、この記事はインデックスされていないことを表しています。
※ /XXXXX/ は該当する記事を入力してください。

記事がインデックスされていないとなると、記事の設定やコンテンツに何らかの原因を抱えていることを示しています。

② サーチコンソールで原因を探る

上記のように、インデックスされていない事実が判明した場合、Google サーチコンソールを用いて原因を探ることができます。

1、サーチコンソールで、インデックスされていないページのURLを入力し、検索する。

2、「URL が Google に登録されていません」と表示

3、少し下部の「レポートを開く」をクリック

4、インデックスされていない記事のステータスを確認できます。

ステータスの情報をより知りたければ、「詳細」をクリックすると次のページに移動します。

上記のように、「検出 - インデックス未登録」の場合、インデックス カバレッジ レポートには、次のような記載があります。

検出 - インデックス未登録: ページは Google により検出されましたが、まだクロールされていません。これは通常、Google が URL をクロールしようとしたものの、サイトへの過負荷が予想されたため、クロールの再スケジュールが必要となった場合です。そのため、レポート上で最終クロール日が空欄になっています。

インデックス カバレッジ レポート (Google サポート)

このようにして、理由があって Google から除外されていることがわかります。

以上のようにして、インデックス状況の確認、そしてインデックスされない原因を知り、記事の修正や改善に努めることができますね。

続いては、記事がインデックスされない理由や考え得る事柄についてまとめてみました。

インデックスされない理由と対処法

主な原因としては、「クロールの設定」と「サイト構造」に問題があります。

インデックスされない理由として挙げられるものは、次のとおりです。

  • 新規ドメインで記事を書き始めたばかり
  • noindex 設定をしている
  • robots.txt でアクセス制限をしている
  • ガイドライン違反(ペナルティ)を受けている
  • 記事が孤立している
  • ブログやサイトの質が低い
  • 検索アルゴリズムの変化

それでは、順に見ていきましょう!

① 新規ドメインで記事を書き始めたばかり

サイトやブログを立ち上げてから間もない間、アクセス数や記事数も少ないこともあって、クローラーがサイトを十分に見つけてもらえない可能性があります。

▶︎ 解決方法

新規ドメインでサイトを運営し、アクセス数が上がり軌道に乗り、さらにクローラーに見つけてもらえるまでには、約3ヶ月ほど掛かると言われています。

そのため、初めは検索エンジンに記事が登録される可能性は低いため、アクセス数を稼ぐためには、SNSなどを用いてサイトへの流入を促すことが最善です。

② noindex 設定をしている

noindex 設定をしている場合、Google からインデックスはされません。

noindex とは特定のページをインデックスさせないための記述コードです。

・なぜ noindex を使うのか?

以下のような目的が挙げられます。

  • 検索結果に表示させたくないページ
  • コンテンツの低いページ
  • 重複ページに疑われるメインではない方のページ

本来、記事を作成したらすべて検索エンジンに載せた方が良いのでは?と思うかもしれません。

しかし、上記のような事柄からサイト自体の評価を下げたくないとする見方もあり、質の低い記事を減らし全体的なコンテンツの質を上げる方法もあるのです。

コンテンツ数を稼ぐだけがSEO対策の全てではないということですね。

▶︎ 解決方法

コンテンツの質を上げることは何よりもプラスに働くわけですから、上記のような事項以外の目的では、なるべく noindex 設定をしないよう心がけましょう。

※ noindex の設定の仕方は次に詳細が書かれてあります。
>>noindex を使用して検索インデックス登録をブロックする (Google 検索セントラル)

③ robots.txt でアクセス制限をしている

検索エンジンは、クローラーと呼ばれるロボットにサイトを巡回させて、サイトの情報を収集しています。

robots.txt は検索エンジンにクロールを指示するファイルで、クローラーがサイトを訪れる際、一番最初にこのファイルを読み取ります。そしてこのファイルには、クロールをすべきかそうでないページを明示することができます。

したがって、インデックスがされない場合、robots.txt でサイトや記事ページ、そしてディレクトリのアクセス制限をし、検索結果に表示されないように指示している可能性を疑う必要性があります。

▶︎ 解決方法

robots.txt を確認し、アクセス制限を行っていないかどうか確認しましょう。

もしインデックスされない場合、下記のように「Disallow:」の記述があると思いますので、修正または削除をし、robots.txt をアップロードしてください。

※ ファイル内の「Disallow:」という記述で、「クロールしない」指示をクローラーに伝えることができます。

簡単に記述の説明をします。(robots.txt の記述の一例です。)

User-agent:* → 「あらゆるユーザーエージェントのロボットに対して命令する」という意味
PC用Google クローラーのみに指示したければ、「User-agent: Googlebot」と記述
Disallow: / → 「すべてのページを巡回しない」という意味
Disallow: /xxx/ → 「https://〇〇.com/xxx/」以下のページすべてを巡回しなくなります。
Disallow: /xxx/abc.html → 「https://〇〇.com/xxx/abc.html」この特定のページのみ巡回しなくなります。

このように、Disallow: 以降のディレクトリやファイルに対して、クローラーの巡回を拒否することが可能となります。

※ robots.txt の確認方法や詳細についてはこちら
>> robots.txt テスターで robots.txt をテストする (Search Console ヘルプ)

④ ガイドライン違反(ペナルティ)を受けている

Google では、良質なサイトを運営していく上で、コンテンツに関する詳細な規定を設けたガイドラインを公開しています。

したがって、このガイドラインに違反している場合は、ペナルティーによりインデックスされません。

▶︎ 解決方法

ペナルティーを受けないようにするには、次のガイドライン(基本方針)の内容を理解し実践しましょう。

  • ユーザーの利便性を最優先に考慮してページを作成
  • ユーザーをだますようなことはしない
  • 検索エンジンでの掲載位置を上げるための不正行為をしない。
  • 同分野の他のサイトとの差別化を図る。

引用: ウェブマスター向けガイドライン (品質に関するガイドライン)

その他、具体的に次のような手法を禁止しています。

  • オリジナル要素が全くないページ作成
  • 隠しテキストや隠しリンク
  • 誘導ページ
  • 無断複製されたコンテンツ
  • 付加価値のないアフィリエイトサイト
  • フィッシングやウイルスといった悪意のある動作を行うページ作成

引用: ウェブマスター向けガイドライン (品質に関するガイドライン)

上記に該当するようなコンテンツが見つかった場合、すぐさま Google 側から問答無用でインデックス削除されます。

⑤ 記事が孤立している

ブログ内で記事が孤立している場合、そうでない場合と比べるとクローラーが記事を拾いにくくなります。

▶︎ 解決方法

  • 関連する記事を内部リンクでつなく
  • 外部リンクもあればなお良し

このようにサイトを見直し改善を図ることで、記事を見つけてもらいやすくなり、結果としてインデックスされやすくなります。

⑥ ブログやサイトの質が低い

低品質なコンテンツ記事が多いと、クロールの頻度が下がり、インデックスされにくくなります。

Google は低品質なコンテンツに対して、次のような対策を講じています。

  • Google のサイト品質アルゴリズムは、質の低いコンテンツの掲載順位を下げることで、「質の高い」サイトを見つけやすくすることを目指しています。
  • ウェブサイトが質の低いコンテンツを含む場合、サイト全体のランキングに影響が及ぶ可能性があります。質の低いページを削除したり、コンテンツの内容が薄いページを有用なページに統合あるいは改善したり、質の低いページを別のドメインに移動したりすることによって、コンテンツの質が良くなり、掲載順位が上がる可能性があることを Google の他の個別のガイダンスで説明しています。
  • 質の高いサイトを運営するウェブマスターが検索から多くのトラフィックを獲得できるよう、Google は引き続きアルゴリズムの改善に取り組みます。

引用: 質の高いサイトの作成方法についてのガイダンス (Google 検索セントラル)

▶︎ 解決方法

またリンク先には、「質の高いサイトと見なされるもの」としていくつかの例が挙げられていますが、裏を返せば、これを満たしているかどうかで低品質のサイトであるかどうかの判断がつきますね。

⑦ 検索アルゴリズムの変化

先のように、Google は定期的に検索アルゴリズムを変更するため、ページのインデックスが削除されてしまう場合があります。

▶︎ 解決方法

もしインデックスが削除されたとしても、Google の意図を分析し、記事を修正してサイトマップを再度送信することで解決します。

また、記事を修正する際には、タイトルキーワードを元に、検索上位の記事内容を参考にすることです。

どうしても自分で解決しない時は?

インデックスされるかどうかについては、上記の内容を考察することである程度解決することができます。

しかし、いつまで経ってもインデックスされないといった場合、Google 側の不具合やバグも考えられます。

こういったケースのために、2021年8月に、Google サーチコンソールを利用しているWebサイト運営者向けにインデックスに関する問題を報告するフォーラムが公開されています。

2022年6月現在、日本語ではなく、英語のみでの申請を受け付けています。どうしても解決しない場合はこれを利用してみてはいかがでしょうか?

下記のリンクは、インデックスに関する詳細事項や、問題報告のリンクが設けられています。

参考: インデックスカバレッジレポート (検索コンソールヘルプ)

もう一つの方法としては、下記のリンクの「ウェブマスターフォーラム」を利用し、疑問点や質問事項を投稿することで、他のサイト所有者や Google 社員からのサポートを受けることができます。

参考: ウェブマスターフォーラム (Search Console ヘルプ)

リンク先から、Google 検索セントラル のヘルプ コミュニティへようこそ

を辿ることで、質問事項を投稿することができます。

まとめ:インデックスされない理由を見極め、対策を講じよう!

今回は、ブログ記事がインデックスされない理由と、その解決方法についてご説明しました。

ラインナップとしては、次のとおりでした。

  • インデックスとは?
  • インデックスの申請方法
  • インデックスの状況を確認する方法と原因の特定
  • インデックスされない理由と対処法
  • どうしても自分で解決しない時は?
  • まとめ

サイトを運営していると、記事がインデックスされるか否かを気にすることが多々あることと思います。

実のところ、Google は検索アルゴリズムを公開していないため、自ら検証・分析・実践して確実な方法を見出すしかありません。

しかし、インデックスされるかどうかについては、ある程度 Google のコンテンツ作成の基本理念に基づく方針を考えると自ずと見えてくるものだと分かります。

記事がインデックスされる = 検索エンジンに登録される、ということはSEO的に重要であることは確かです。

しかし、SEO的にはすべての記事がインデックス登録されるのではなく、場合によっては noindex や robots.txt を用いて、低品質な記事を載せないようにし、サイト全体の評価を上げる方法もあります。

また、今回ご紹介した方法以外にも、設定ファイルを触ったり、さらに進んだ上級者向けの対策方法もあります。こちらは今後の私の課題にもなるかもしれないので、また詳細記事を書ければと思っています。

自身のサイトを将来的にどのように運営・運用していこうとするのかを見極め、それによってインデックス登録のあり方、そしてその対処法を講じていきましょう。

今回は以上となります。

最後までご覧いただきありがとうございました。

-SEO
-,