日本語URLについて
日本語URLについて
WebサイトのURLに日本語を用いることによる諸影響について記載します。
日本語URLとは
日本語URLとは、日本語文字列が記述されているURLです。
リンクする場合は以下の形となります。
<a href="日本語.html">日本語</a>
また、CGIで動的にコンテンツを表示するWEBサイトの場合、コンテンツデータをテキストファイルとして保存する仕組みがよく使われます。
日本語のファイル名をCGIに渡すことで内容を閲覧する場合には以下のようなURLとなります。
<a href="/?cmd=view&file=日本語">日本語</a>
アクセスエラーは発生しないのか
「Internet Explorer 5」の時期のブラウザソフトウェアでは、日本語が含まれるURLにアクセスすると、「ページが見つかりません」といったエラーメッセージが表示されて、Webページが表示できない場合がありました。
しかし、2000年以降のブラウザソフト及びWebサーバーソフトでは、UTF-8などへの文字エンコード処理が上手くおこなわれているため、発生することは少ないといえます。
URLの文字列長の制限
RFC 2616 Hypertext Transfer Protocol -- HTTP/1.1 (ftp://ftp.isi.edu/in-notes/rfc2616.txt)では、URLの長さに関する要件は取り決められていません。
ただし、ブラウザソフトウェア側でなんらかの制限が決められている可能性はあります。
Internet Explorer 6.0では、URLに使用できる最大文字数は「2,083文字」という制限がありました。
日本語URLはブラウザとサーバ間ではUTF-8などへのエンコード処理が行われる場合がありますので、SHIFT-JISなどの2バイト文字を基準にしないほうがよいといえます。
検索エンジンへの影響
日本語とGoogleのヒット率は全く関係無いといわれています。
検索エンジン側から明確な仕様などは公開されていないため真相は不明です。