本当は怖い文字コードの話:第3回 US-ASCIIによるクロスサイトスクリプティング|gihyo.jp … 技術評論社(情報元のブックマーク数)

IEだけじゃない、US-ASCIIの問題、それをはせがわさんが技評で記事!

US-ASCIIとは,みなさんもご存じのとおり,7ビットで英数字と少数の記号を表現する文字コードで,0x00から0x7Fまでの128種類の文字を扱うことができます。US-ASCIIで記述されたコンテンツをInternet Explorerで開いたときには,0x00から0x7Fの128文字を解釈するだけでなく,0x80から0xFFまでの7ビットにおさまらない範囲の文字について,最上位ビットが無視され0x00から0xFFと等価と解釈されます。

たとえば,「A」「B」「C」という文字はUS-ASCIIではそれぞれ0x41,0x42,0x43と規定されていますが,Internet Explorerではそれらの最上位ビットを1にセットした0xC1,0xC2,0xC3の各バイト値についても,0x41,0x42,0x43と同様に「A」「B」「C」と解釈します

第3回 US-ASCIIによるクロスサイトスクリプティング:本当は怖い文字コードの話|gihyo.jp … 技術評論社

screenshot