ビットとバイトとは?:情報量の単位
一言で言えば…
1ビット(bit)は1桁の情報量の単位です。2通り(2の1乗)の選択肢を持っています。1バイト(B)は8桁の情報量の単位です。256通り(2の8乗)の選択肢を持っています。したがって、1バイト=8ビットです。
0だけのシンプルな情報表現方法
デジタルでは、数値、文字、音声、静止画、動画など、すべての情報を0と1の組み合わせで表現します。この0と1の組み合わせのことをビットパターンと言います。
詳しくはこちらの記事をご覧ください。
理解のために、シンプルな例題でコンピュータの仕組みを説明します。
0という文字だけで、A、B、C、・・・というアルファベットを表現してください、というお題が与えられたとしましょう。
あなたなら、どう表現しますか?
一つのアイデアは、0の個数にアルファベットを割り当てる方法です。
つまり、
0が1個(0)=A
0が2個(00)=B
0が3個(000)=C
0が4個(000)=D
という表現方法です。この方法なら、0という数字だけですべての文字を表現することができます。
でもちょっと待ってください、この方法を使うと表現したい文字数の分だけ、桁数を用意する必要が出てきますね。
アルファベットは全部で26文字あり、大文字と小文字を区別すると2倍の52文字になります。つまり、桁数だけで表現する方法を使ってしまうと、アルファベットのために、52桁もの0の箱を用意しておく必要があるわけです。
それだけではありません。
私たち日本人は、日本語を話しますね。
日本語はひらがな46文字、カタカナ46文字に加えて、常用漢字2136文字があります。常用漢字だけという訳にはいかないので、一般的には3000文字程度使用するそうです。
3000桁もの0の並び順という規則を決定したうえで、ようやくスタートラインです。
例えば、ABという文字列を書こうと思うと、
000(Aの0、Bの00の合計)となります。
ABCという文字列を書こうと思うと、
000000(Aの0、Bの00、Cの000の合計)になります。
それでは、ZZZZZを書いてください、と言われたらどうでしょうか?
もう、お分かりですね。Zは最後のアルファベットなので26番目なので、0を26×3回=78回繰り返す必要があるのです。これは手間がかかりすぎますね。
コンピュータの中での情報処理
幸いなことに私たちは1も含めて2通りの文字で表現することができます。さて、2通りの文字を使った場合には、どうやってアルファベットを表現するのが良いでしょうか?
答えは、”0と1の組み合わせで表現する” ということです。ちょっとわかりずらいので、3桁の場合で具体例を説明しましょう。
000=A
001=B
010=C
011=D
100=E
101=F
110=G
111=H
いかがでしょうか?
3桁の0と1だけで、AからHまでの8文字(2の3乗)を表現することができています。0だけだと、A、B、Cの3文字しか表現できなかったので、8/3倍=2.7倍もの情報が表現できるようになりました。
この調子で桁数を増やしていけば、0しか使えなかったときに比べて圧倒的に少ない桁数で情報表現が可能になります。
これがコンピュータにおける情報処理の本質部分です。
ビットとバイト
0か1の2通りの情報量を1ビットという単位で表現します。
8ビットの情報量があれば、2の8乗なので256通りの情報を表現することができます。この8ビットの情報量の塊を1バイトと言います。60分=1時間のように別の言い方をするのと同じですね。
ちなみに、0と1の2通りで情報を処理するのが従来のコンピュータですが、0と1の中間状態のようなものがあるとすれば、同じ桁数でさらに多くの情報を処理できますよね。
そのアイデアが、量子コンピュータにつながっていきます。
量子コンピュータについてもまた別で説明記事を書こうと思っていますので、ご期待ください。
身近な情報量の例
具体的な例があった方が分かりやすいと思いますので。みなさんの身近な情報がどれくらいの情報量を持っているか示したいと思います。
1文字(英語)
⇒ 1バイト(8ビット)1画像(VGA形式:640画素×480画素、24ビット深度)
⇒ 900キロバイト(7,200,000ビット)動画(VGA形式画像×30fps)
⇒ 27メガバイト(216,000,000ビット)
こうやって考えていくと、動画がいかに大量の情報量を必要とするのかが分かりますね。
逆を返せば、動画にはそれだけの情報量が詰め込まれているので、何かを学ぶときに、本よりも漫画、漫画よりも動画の方が大量の情報から学ぶことができるという訳です。
なので、Youtubeで勉強していますというのは、一見遊んでいるかのような印象(参考書の方がなんとなく、ちゃんと勉強しているかのような印象)を受けますが、情報量という面で見れば非常に合理的な手段なのです。
ということを、noteというテキスト+画像ベースの媒体で伝えているのは、若干矛盾を抱えていますね(笑)。
まとめ
この記事では、ビットとバイトという情報量の単位について説明し、それがコンピュータの中でどのように処理されているのかを解説しました。
1ビット(bit)は1桁の情報量の単位です。2通り(2の1乗)の選択肢を持っています。
1バイト(B)は8桁の情報量の単位です。256通り(2の8乗)の選択肢を持っています。したがって、1バイト=8ビットです。
コンピュータは、0と1の組み合わせで情報を表現する。
勉強になったな、と思ったら ”スキ” していただけると、今後のコンテンツ制作の励みになります。
最後まで読んでいただきまして、ありがとうございました!
参考文献
おすすめ記事
#半導体 #半導体関連 #半導体株 #半導体って何 #半導体の基礎
# フォロバ # 半導体Times