文字コード(簡単に)
主な文字コード
ASCⅡ
7ビットの文字コード。
128種類の文字(英数字、記号、制御コード)を表現
ISO-8859
ASCⅡを8ビットに拡張したもの。2256種類の文字を表現
Unicode
多言語を扱う為に作成された文字コード
※Unicodeで定義された文字を表現する符号化方式には、
UTF-8, UTF-16, UTF-32などがある。
ECP-JP
UNIX環境で標準的に利用される日本語文字コード
Shift_JIS
WindowsやMac OSで標準的に利用される日本語文字コード
iconvコマンドで、文字コードの変換が行える
iconv [オプション] [入力ファイル]
オプション
-l :扱える文字コードを表示(list)
-f 文字コード:変換前の文字コードを指定(from)
-t 文字コード:変換後の文字コードを指定(to)