本当は怖い文字コードの話:第4回 UTF-8の冗長なエンコード|gihyo.jp … 技術評論社(情報元のブックマーク数)
id:hasegawayosukeキタ━━━━(゜∀゜)━━━━ッ!!<3!!!
冗長なUTF-8エンコード、、、
第4回 UTF-8の冗長なエンコード:本当は怖い文字コードの話|gihyo.jp … 技術評論社冗長なエンコードとは
先に述べたとおり,UTF-8ではU+0000からU+007Fまでの範囲の文字はUS-ASCIIと互換を持ち,0x00〜0x7Fとなりますので,多くのOSでのパス区切り記号として使われる「/」(U+002F)は0x2Fとなります。
ところが,これを表1のU+0000〜U+007F以外の欄に無理やり当てはめて,1バイト以外の形式で表現することができてしまいます