HTML-METAタグについて
HTML METAタグとは
METAタグは、ロボット型検索エンジンにおいて「クローラ」と呼ばれるプログラムにWEBサイトの情報を拾わせるためのHTML記述情報です。
WEBコンテンツの制作者やキーワード等の情報をname属性で定義して、 content属性でその値を指定します。
METAタグはページ内容の説明やキーワード、ファイル情報などを記載しますが、直接ブラウザに表示されるわけではありません。
クローラ (Crawler)とは
クローラ (Crawler) は、ネットワーク上を巡回し、WEBサイトコンテンツを周期的に取得し、自動的にデータベース化するプログラムです。
発見したページのHTML文書の中からMETA情報やキーワードを拾い集め、URLを検索ページに反映させます。
クローラは「ボット(Bot)」、「スパイダー(Spider)」、「ロボット」などとも呼ばれます。
METAタグの記述
<meta>タグは<head>~</head>の中に記述します。
meta要素の指定には、name属性、http-equiv属性、charset属性のいずれか指定します。
また、name属性、http-equiv属性を指定する際にはcontent属性を記述し、メタデータの定義と内容を関連付けます。
指定 | 説明 |
---|---|
name属性 | メタデータの名前を指定 |
http-equiv属性 | プラグマ指示子を指定 |
content属性 | メタデータの値などを指定 |
charset属性 | HTML文書の文字エンコーディングを指定 |
プラグマ指示子について
「http-equiv属性」を指定すると、そのmeta要素はプラグマ指示子(pragma directive)となります。
プラグマ指示子とは「実行命令の指示」を意味し、エージェント(ブラウザ)に対して文書の「状態や処理動作」を指示する役割があります。
http-equiv属性の値には、以下の4つのキーワードを指定することができます。
指定 | 説明 |
---|---|
content-language | コンテンツ言語の指定 |
content-type | ファイルタイプや文字エンコーディングの指定 |
default-style | デフォルトスタイルの指定 |
refresh | リダイレクト・再読み込みの指定 |
主要METAタグ
利用頻度が高いものについて以下に記載します。
作者情報
文書の作者を表記します。
<meta name="author" content="capm-network">
著作権情報
文書の著作権を表記します。
<meta name="copyright" content="capm-network">
文字コード
文書の文字コードを明示します。
文字コードを指定することは文字化け防止に有用です。
なお、文字コードの指定は、<TITLE>~</TITLE>内などで日本語が現れる前に行う必要があります。
charsetはSJISの場合「shift_jis」、 EUCの場合「euc-jp」とします。
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
文書における言語の指定
日本ならば「ja」とします。
英語文書の場合「en」とします。
<meta http-equiv="Content-Language" content="ja">
文書の説明
文書の概要を短文で定義します。
このMETA情報は、多くの検索エンジンで利用されており、検索結果に影響します。
<meta name="description" content="HTML METAタグ">
文書のキーワード
文書がどのような内容であるか端的に示すキーワードを定義します。
このMETA情報は、多くの検索エンジンで利用されており、検索結果に影響します。
複数のキーワードを指定する場合には、半角カンマ(,)区切りで指定します。
<meta name="keywords" content="HTML,META,タグ">
基準スタイルシート言語
文書のデフォルトのスタイルシート言語を指定します。
タグに直接style属性でスタイルシートを指定する場合などに、ここで指定した定義種類であると解釈されます。
本項目は指定しなくてもブラウザ側で自動的に判断しますが、誤動作を避けるために記述しておく方がよいといえます。
<meta http-equiv="Content-Style-Type" content="text/css">
基準スクリプト言語
文書のデフォルトのスクリプト言語を指定します。
本項目は指定しなくてもブラウザ側で自動的に判断しますが、誤動作を避けるために記述しておく方がよいといえます。
<meta http-equiv="Content-Script-Type" content="text/javascript">
閲覧者のブラウザのキャッシュを制御する
ページがブラウザ側にキャッシュされるのを防ぎ、アクセスする度に最新のページを読み込ませる事ができます。
<meta http-equiv="pragma" content="no-cache">
文書を作成情報
文書作成に使用したツールやソフトウェアを記述します。
WEBコンテンツ生成ツールを使用するなど、ページが自動生成をされた場合にツール自身がページのhead要素内に挿入するものです。
<meta name="generator" content="stw">
イメージツールバーを表示させない
イメージツールバーを表示させない設定です。
イメージツールバーはIEなどのブラウザで、一定以上のサイズの画像の上にマウスカーソルを合わせると表示されます。
<meta http-equiv="imagetoolbar" content="no">
検索ロボットの制御
robotsメタ情報は、検索ロボットに対して登録制御方法を指定しています。
この指定はすべての検索ロボットに対して有効ではなく、この情報を参照する検索ロボットに対してのみ有効です。
<meta name="robots" content="noindex,nofollow">
contentには以下のキーワードを指定します。
指定 | 説明 |
---|---|
none | 当該ぺージとそこからリンクしているページの両方とも巡回拒否します。 |
index,nofollow | 当該ぺージのみ登録し、リンクを辿るのは拒否します。 |
index | そのページの登録を許可します。 |
noindex | リンクを辿ることを許可するが、当該ページに対する指定は拒否します。 |
all | 下部階層ページの巡回を許可します。 |
index,follow | 当該ページとリンクされている全てのページの検索を許可します。 |
noindex,follow | 当該ページを登録しないが、ページ内のリンク先は巡回を許可する。 |
noimageindex | 当該ページ内の画像が検索対象となることを拒否します。 |
noimageclick | 当該ページ内の画像への直接リンクを拒否します。 |
検索ロボットに後日、再巡回させる
ロボットが訪れた際に後日再度訪問させたい場合に記述します。
<meta name="revisit_after" content="15 days">