xmlサイトマップとは
サイトマップとは
xmlサイトマップ(通常は「サイトマップ」と呼ばれます)は、WEBサイトのページリストを指します。
サイトマップを作成することで、検索エンジンのクロール処理では検出できない可能性のあるURLを含むサイト上のすべてのページを検索リストに登録することができます。
詳細はSitemaps.orgを参照して下さい。
以下は概要を簡単に記載しています。
xmlサイトマップの作り方
サイトマップの記述ルールは次のとおりです。
- <urlset>タグで始めて</urlset>タグで閉じます。
- <urlset>タグ内にネームスペース (プロトコル標準) を指定します。
- 各URL毎に、<url>エントリとそれに内包する子エントリ<loc>などを記述します。
- サイトマップのファイルは「UTF-8」エンコードで作成する必要があります。
- URLなどのデータ値はXMLエスケープコードを使用する必要があります。
タグについて
<urlset> | 必須 | サイトマップに含まれるURLセットに関する全情報を囲みます。 |
<url> | 必須 | 各URLに関する情報を囲みます。 |
<loc> | 必須 | URLを指定します。 |
<lastmod> | 省略可 | URLの最終更新日(YYYY-MM-DDThh:mmTZD 形式)を指定します。 |
<changefreq> | 省略可 | そのページの予想される更新頻度を指定します。「always|hourly|daily|weekly|monthly|yearly|never」から指定します。 |
<priority> | 省略可 | URLの優先順位を指定します。1.0(重要)から0.1(重要でない)の範囲で指定できます。 |
記述例
<?xml version="1.0" encoding="UTF-8"?>
<urlset
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
<url>
<loc>http://capm-network.com/</loc>
<lastmod>2012-06-24T12:59:09+00:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.00</priority>
</url>
<url>
<loc>http://capm-network.com/?tag=Mac%20photo%20booth</loc>
<lastmod>2012-06-24T12:59:09+00:00</lastmod>
<changefreq>daily</changefreq>
<priority>0.51</priority>
</url>
</urlset>
サイトマップの配置
サイトマップ位置場所
サイトマップファイル(sitemap.xml)は、ファイルを配置したディレクトリ階層より下にあるページURLのみ記述する仕様です。
サイトマップファイルはより上位(ルート)ディレクトリへの設置が推奨されています。
例えば、サイトマップを「http://capm-network.com/data/sitemap.xml」に配置した場合、「/data」以下のページURL以外を記述してはなりません。
全てのページURLを登録する場合には、「http://capm-network.com/sitemap.xml」に配置する必要があります。
サイトマップの場所を robots.txt ファイルで指定
サイトマップの場所を指定するには、robots.txt ファイルを使用します。
次の行を追加してください。
Sitemap: http://capm-network.com/sitemap.xml