• ホーム
  • サイトのインデックスの仕組み

サイトのインデックスの仕組み

検索エンジンの検索窓とスーツ姿の男性

サイトが検索サイトに登録されることをインデックスといいます。このインデックスですが、いくつかの仕組みがあります。
まず、基本的にサイト内の新しいページを作ったり、サイトを作った場合は検索サイトに新しいページを作ったことを伝えます。そうするとクローラーと呼ばれる検索サイトのロボットがサイトにやってきてサイト内を動き、検索結果にページやサイトの表示を反映させます。この場合、リンクの有無や被リンクの数、あるいは高品質なサイトや低品質なサイトなどを比較して検索結果に反映させ、検索時の順位をつけます。これをSEOといいます。

とはいえ、この時にどのような順位になるかは、いろいろな点で判断されます。その点で最も大事になるのが、コンテンツの質です。基本的にコンテンツの質が低かったり、サイトのコンテンツがサイトのコピーコンテンツだと判断される場合、検索結果でも低い順位にしかなりません。重複などが悪質な場合は検索結果にそもそも表示されず、検索サイトからのペナルティを受ける場合があります。このため、重複するようなコンテンツではなく、ある程度オリジナリティのあるコンテンツが重要なのです。

もう一つはサイトのnofollowやnoidexの有無です。これらはサイトを作成するときにHTML内のheaderに書くmetaタグ内に記述します。metaタグとは検索サイトや様々なサイトにどのように登録するかを書き表したもので、基本的にページ内に表示されることはありません。とはいえ、nofollowやnoidexがあるとサイトの検索結果に良い影響を及ぼしませんので、サイト内の作りがどうなっているかチェックしましょう。

そのほか、URL正規化などのURLの重複対策も大事な点です。例えばSSL化しているページとしていないページ、ページの重複、似たようなコンテンツのページや薄いコンテンツのページなどがあるかもしれません。この場合、ある程度canonicalタグで操作をしておきましょう。

これもheader内に書くもので、似たようなコンテンツがあるページや同じ内容でも違うURLのページを使う場合はcanonicalタグでしっかり違うと表示しておきましょう。
そのほか、サイトのSSL化がどのようになっているか、低品質なページをどのくらいcanonicalでインデックスしないようにしているかなども重要です。特にSEOをしっかりしているかどうか、URL正規化はきちんと行っているか、なども気をつけたいところでしょう。

関連記事
サイト内検索
人気記事一覧