サイトマップとは
サイトマップとは、Webサイト内のページやコンテンツのURLを一覧にしてクローラーがサイト内のページをたどりやすくしたファイルのことです。
サイトマップの種類
サイトマップには、2つの種類があります。それぞれの概要としては、以下の通りです。
HTMLサイトマップ
HTMLサイトマップは、Webサイト内のページを一覧表示したものです。カテゴリーに応じて表示することで、ユーザーはどのようなページがあるのかを網羅的に理解できます。また、HTMLサイトマップを利用すれば、目的のページに瞬時に到達できるため、ユーザーの利便性向上にも役立ちます。
XMLサイトマップ
XMLサイトマップは、検索エンジンにサイトの情報を素早く、正確に伝えるために用いられるものです。検索エンジンの検索結果でサイトが表示されるには、まずクローラーにサイトを見つけてもらう必要があります。
XMLサイトマップには、URLやそのURLの情報を最終更新した日付情報、クロール頻度、そのURLのクロール優先度を設定することができます。
サイトマップのメリット
クロールを希望するURLを検索エンジンに知らせる
サイトマップを作成すると、クロールしてほしいURLをまとめて検索エンジンに知らせることができます。
従来、サイトマップを使用していなかったときは、クローラーがリンクをたどって、たどれるリンクを検索のデータベース(インデックス)に登録し、検索できるようにするしかなかったのですが、従来のこの方法だと、全てのリンクをたどることができずに、意図せずにインデックス対象外になってしまうURLが出ていました。
このような問題を解消できるのがサイトマップです。ここに記載したURLはもれなく検索エンジンに知らせることができ、意図せずインデックス対象外になってしまうURLを減らすことができます。
クロールする優先順位を指定できる
サイトマップのプライオリティ(優先順位)属性を使用することで、サイト内のクロール優先順位の高いURLはどれか、明示的に優先順位を指定することができます。
サイト内の優先順位を指定することができると、最新情報を提供するニュースをまとめているページなどはクロール頻度を上げて、滅多に更新しないページはクロール頻度を下げるといった工夫を行い、検索結果に表示されるページの情報の新しさのコントロールや、クロールロボットがたくさんサーバーにアクセスしてしまって、アクセス過多になるケースをある程度コントロールすることができるようになります。