文字コード
アイシーティーリンクのたんです。
コマンドやスクリプトの実行をした際に文字化けになることが
僕のような初心者には度々起きてしまうことがあるので、
今回は文字コードについて、少し触れていきたいと思います。
まず最もポピュラーな文字コードが、「UTF-8」
UTF-8は、Unicode文字のエンコード方法の1つで、
世界中に存在するさまざまな言語の文字を統一して使えるようにするための文字コードとのこと。
そもそも文字コードってなにって話ですが、
PC上で文字を扱うために、それぞれの文字や記号に割り当てられた、固有の番号のことを指します。
PCはデータを数値でしか認識できないため、文字に関しても数値で認識させる必要があります。この変換を担っているのが文字コードであり、PCにおいて文字コードは必須な要素とのこと。
文字によってコード番号が違うため、それぞれの文字コードに合わせることが必要になる。(←これのせいで文字化けになる)
他にも代表的な文字コードとして以下があります。
・JIS
・Shift_JIS
・JIS(ジス)
JIS(日本工業規格)が定めた情報交換用の文字コードのことです。また、下記のような文字の種類もJISのなかに含まれます。
・ASCIIコード
・ひらがな
・漢字
・カタカナ
・Shift_JIS(シフトジス)
SJISとも呼ばれているMicrosoft社が開発した文字コードです。世界的標準であるASCIIコードの文字に、日本語を追加した文字コードになります。
日本語を扱う文字コードとしてMS-DOSやWindows、MacやUNIXなど幅広く利用されています。また、Shift_JISは、JIS規格によって定められたJISコードの改良版です。
英語や数字は特に気にすることはないのですが、
漢字やひらがなが入った場合には要注意。
スクリプトの文字コードが「UTF-8」になってなっていても、
実際に使用するシステムの文字コードに合わせないと文字化けなったり、
うまく動作しないことが起きたりするので、
はじめのうちは文字コードを意識してやろうと思いました。
ではまた。
深掘りすればするほど沼に入るので、、、