Google検索でインデックスに登録されなくなった記事からその理由を推測してみる
ブログやプログラミング関連の記事を書き続けてはや5年。途中、ダレたりして投稿ペースが遅くなったりしたことはありますが、これまでに執筆した記事の合計は1000を超えています。
ただ、記事数は多いものの内容が内容なので、まったくアクセスされないといった記事も沢山あり、その中で、なぜかGoogle検索のインデックスに登録されなくなったものが一部あるので、今回はその記事の内容を振り返って、インデックスに登録されていない理由を推測してみたいと思います。
目次
- 検索インデックスに登録されない一般的な理由
- ブログ記事でインデックスに登録されていないコンテンツ
- プログラミングメモでインデックスに登録されていないコンテンツ
- まとめ
検索インデックスに登録されない一般的な理由
一般的に検索のインデックスに登録されない理由としては以下のものが挙げられています。
- 技術的な問題(robots.txtの設定ミス、リダイレクト不正、noindexの指定など)
- 低品質なコンテンツ
- 同じような記事がすでにたくさん存在する
- 個人情報などのさらし行為が行われている
- 法律違反や著作権侵害
以下のヘルプを読むことで、ある程度、インデックスに登録されない可能性のあるコンテンツが分かると思います。
今回の場合、同じサイト内で正常にインデックス登録されているコンテンツがあることから、技術的な問題は考えられず、間違った情報を公開している可能性は否定できませんが、個人情報の晒し行為や法律違反のようなコンテンツは一切ありません。
Search Consoleで手動による対策が実施された痕跡もないので、一般的な理由から考えられる可能性としては、低品質なコンテンツか、同じような記事がたくさん存在するかのどちらか。
上記に挙げた理由以外も考えられますが、この2点に絞って、インデックスが登録されていないコンテンツを確認していきたいと思います。
ブログ記事でインデックスに登録されていないコンテンツ
記事は大きく分けて、ブログとプログラミングメモの2つがあるので、まずはブログ記事の方から確認することにして、以下は、インデックスに登録されていないコンテンツのリンクと、記載している内容についての概要、さらに登録されない理由についての予想になります。
-
サイト開設時に用意した1ページ目のコンテンツ。数行しか書いていないので、低品質と言われてしまえばその通りです。
-
アニメ視聴ランキング関連の記事は当サイトでまったく人気のないコンテンツなのですが、複数あるコンテンツの中で、他のランキング記事は登録されているのに、なぜか、この2017年冬アニメのランキング記事はインデックスに登録されていませんでした。
コンテンツの品質的には他のランキング記事と同じレベルなので、品質の問題ではないと思います。可能性としては、この頃は視聴した全てのアニメに対してコメントしているため、若干、作品に対して、マイナスな意見を述べていることがあり、こちらの記事はその傾向が強いといった特徴があります。
-
NHKがクローズアップされていた時期に書いたので、これまでのNHKに対する不満や思いが大爆発している記事です。そのため、言葉遣いは丁寧ですが、節々に悪態に近い言葉を使っているので、それが原因のような...。もしかしたらNHKを敵に回してしまったのかもしれません。
-
書くことがなかったので、数枚の写真と数行のコメントで投稿した記事ですが、さすがに低品質と判断されたようです。
-
2020年にやりたいことをただ綴った記事ですが、これくらいのレベルの内容であってもインデックスに登録されている記事はあるので、低品質が原因ではなく、タイトルにまったく特徴がないので、検索のことをまったく意識していないのが原因のような気がします。
人生で初めてふるさと納税したら北海道グルメを堪能できて超ハッピーになれた話
初めてふるさと納税した時の様子を綴った記事。こちらの記事がインデックスに登録されない理由がまったく分からないのですが、タイトルに「超ハッピー」とか使っているのが不味かったような気もします。
今どき副業禁止なんてあり得ない!?と思っていたら働いていた会社がそうだった話
副業禁止とかあり得ない、そういった会社は今後生き残れない、みたいなことを書いたのですが、こちらもインデックスNGです。副業禁止にしている会社を悪者のように言っている感はあるので、それですかね。
-
車を通販で買ってその様子を紹介しようとしましたが、そこまで安くなかったので、結局、近くの販売店で購入したという記事。こちらは特定の企業名をタイトルや記事内で使用しているのが問題だと思います。
-
んー、こちらもアニメのランキング記事ですが、面白かった作品以外のコメントをしているのが、やはり原因でしょう。
「プログラミング能力が高い人」と「教えることが上手い人」は相反する関係
分からないことがあったら人を選んで尋ねよう、という戒めを含んだ記事で、個人や企業、さらには作品といった特定のものに対して、意見を言っているわけではないのですが、こちらもNGでした。
新型コロナウイルスの蔓延でお一人様の引き篭もりが最高であると再認識した話
結局、引き篭もりが最強といった内容の記事ですが、タイトルから「引き篭もり」というワードを抜いたら「コロナ」「蔓延」「最高」という、さすがにNGなワードが残ってしまうので、タイトル付けが悪かった気がします。
-
ドメイン管理でレコード追加・編集の手順を解説しただけの記事ですが、なぜか、こちらもNG。UIが分かり難いと言っているから? でも、さすがにそれだけではインデックスNGとはならないと思うので、原因は不明です。
インデックスNGの記事をまとめてみましたが、上記の記事から考えられる、登録されない原因として可能性が高いのは以下の2通りです。
- 内容が薄い ⇒ 低品質なコンテンツ
- 特定のものに対してマイナスイメージの意見がある ⇒ さらし行為は個人以外にも該当する?
すべての記事を確認すると、上記の原因に該当しない記事もあり、手動による対策についての報告がないことから、おそらく機械的にこの辺りの判断をしているものと思われます。
このため、タイトルや記事の内容を少し修正して、インデックスの再リクエストを送れば、登録される可能性がありそうです。
プログラミングメモでインデックスに登録されていないコンテンツ
ブログ記事と同様にプログラミングメモについてもインデックス登録されていないものがあります。
- 概要・リンク集 - HTML
- 概要・リンク集 - AngularJS
- 概要・リンク集 - PHP
- Webサイトの検証・モバイルユーザビリティについて
- border-radiusの設定例 - CSS
- 作成したテーブルを元にしてフォームを自動で生成する(フォームウィザード) - Access
- コンボボックスやリストボックスで「値リスト」を設定する方法 - Access
- VBAでユーザー名やコンピュータ名を取得する方法 - Access
- VBAの整数型「Integer」は2バイト(-32,768~32,767)なので要注意 - Access
- 表示エリアよりも大きい画像を縮小せずに中央に表示する - CSS
- 複数の配列をマージ(結合)する方法 - JavaScript
- WindowsとUbuntu(WSL)に配置したNode.jsプロジェクトのビルド速度の比較 - VSCode
プログラミングメモの場合、概要・リンク集については低品質なコンテンツである可能性が高いですが、他の記事については結構頑張って作っているものもあるので、そういったものについては、同じようなコンテンツがすでにたくさん存在するのが原因かと思います。
まとめ
今回の調査で、低品質だったり重複するコンテンツ、または、あるものに対してマイナスイメージの意見がある記事といったものは、インデックスに登録されない可能性が高いことが分かりました。
意外だったのはインデックス登録可否について、アクセス数の多さは関係がないこと。(上記に挙げた記事以外で、インデックスに登録されていても、まったくアクセスされていない記事がたくさんある)
個人的にはまったく需要がない記事(検索もアクセスもされない記事)が、インデックスから外されるものと思っていましたが、今回の調査で判明した限りでは、そういうことではないようです。
なお、これまでインデックスの登録は、サイトマップに記載するだけで、あとはGoogleのボット任せにしていたので、記事の内容によっては、手動によるインデックス登録のリクエストで登録される可能性があります。
登録されなくても、今回、例に挙げたような記事であれば、インデックスに登録されるかどうかはGoogleのボットが自動で判定しているようなので、タイトルや内容を少し見直すことで改善可能だと思います。