19.文字コード|代表格

謎の「ASCII-8BIT」文字コードエラーに悩まされ…。
そもそも文字コードって…ってところから振り返り。

文字コード

コンピュータ上で文字(キャラクタ)を利用する目的で各文字に割り当てられるバイト表現。
もしくは、バイト表現と文字の対応関係(文字コード体系)のこと。

文章をテキスト形式で扱う場合に、その各文字(単一の文字でない場合もある)に対して持っているコードのことを指す。

ASCII

American Standard Code for Information Interchangeの略。
アルファベット・数字・記号などを収録した文字コードの一つ。
最も基本的な文字コードとして世界的に普及しており、他の多くの文字コードがASCIIの拡張になるよう実装されている。
文字を7ビット(0~127)で表し、128文字が収録されている。

UTF-8

世界的に最もポピュラーな文字コードで、ASCII互換。
ASCIIと同じ部分は1バイトで表現し、他の部分を2~6バイトで表現する可変長の符号化方式。