【このエントリーは会社員時代に書いた記事のリブログです。】
インターネットを見ていると、まれに文字化けすることがあります。
「なんじゃこりゃ?」とあわてる前に、以下のパターンを覚えておけばだいたいの場合は直すことが出来ます。
まず大前提の知識として、
「日本語の文字コード(※1)は、何種類もある!」
(※1.パソコン上で日本語を表示させるための技術というかルールみたいなやつ)
ということを知っておいてください。何種類もあって、普段は自動で正しいやつを判別して表示してくれるんだけど、PC側もたまに間違うことがある(=コレが文字化け)ので、手動で訂正してやらないといけないことがあるんです。
で、この文字化けの起こり方にはパターンがあります。このパターンもいくつかありますが、とりあえず3種類の文字化け特徴だけ覚えておけばほぼ大丈夫かと思います。
文字コードの変え方
3つの文字化けパターンの特徴を知る前に、まずは文字コードの判別が間違ってた場合に手動で直す方法をご説明します。
下の画像はInternet Explorer 8の場合ですが、並んでるメニューの中から「ページ」(ない場合は、「表示」)というのを探してください。
「ページ」メニューを選択すると、その中に「エンコード」というのがあると思います。そこを選択すると、文字コードを選んで変更することが出来ます。
通常は、「自動選択」にしておけば良いです。
さて、変更方法が分かったところで、文字化けのケースごとに見ていきましょう。
パターン1.半角カタカナや「、」が多い
こんな感じで、半角のカタカナや「、」「・」などの記号が入り混じっている場合。
ス、キ、ニヌ鋧リ、ハ、ホ、ヒナキチウ、ハ、ネ、ウ、惕筍」サ荀ホヘ
この場合は文字コードを「日本語(EUC)」に変えてください。
きっと、正しい日本表示に直ったと思います。
(これは、本来は「日本語(EUC)」で表示しなければいけないところを、誤って「日本語(シフトJIS)」で表示したときに起こるタイプの文字化けです。)
パターン2.ものすごく画数の多い漢字が大量発生!
結構ウイルスっぽくて怖い感じの文字化けがコレ。
縺ァ縲∽サ頑律縺ッ譎ョ谿オ縺ェ縺九↑縺矩擇縺ィ蜷代°縺」縺ヲ縺雁ョ
この場合は文字コードを「Unicode(UTF-8)」に変えてください。
(これは、本来は「Unicode(UTF-8)」で表示しなければいけないところを、誤って「日本語(シフトJIS)」で表示したときに起こるタイプの文字化けです。)
パターン3.□または?がやたら多い
???????????E???????i
または
□□□□□□E□□□□□□□□□□i
この場合は文字コードを「日本語(シフトJIS)」に変えてください。
(これは、本来は「日本語(シフトJIS)」で表示しなければいけないところを、誤って「日本語(EUC)」または「Unicode(UTF-8)」、その他別言語で表示したときに起こるタイプの文字化けです。)
よくあるのはこの3つです。
文字コードに関する話を詳しくしていくと、いつもにも増して、かなり長~い文章が書けてしまうので・・・・それはまた別の機会にします。
とりあえずはこの基本パターンを覚えておけば、ホームページを見たときの文字化けだって怖くない!です!