人が分るのと電脳が分るは違う
「AIって何?」連載五節で神経電網(ニューラル・ネットワーク)が「文字を記憶する」に結び付くことを示した。思い出してもらいたい、人にとって意味のある「2」や「5」も電脳の神経電網では、記憶域の特定の番地が「1」か「0」に過ぎなかった。
入力は人がするので「2」や「5」と判断できる必要がある。従って縦と横の二次元構造にする必要があった。しかし、解答(出力や正解)は、これを考慮する必要は無い。電脳内で区別できれば良いのだ。神経電網の第三層(解答、出力)は以下の様に短縮できる。
00010 00010を「2」とする
00000 10000を「5」とする
こうすると、第三層の細胞数は10個なので、第二層は30個位に減らせる。どのくらい減らせるかは実装して見ないと分からない。さらに、第三層の各細胞の重みは、第二層の細胞数と同じ30個で良いことになる。これで全体の計算量を減らすことができる。電脳の力が増しているとは言え、計算量を減らす工夫は重要である。以下では減量の流れを示している。
人の顔認証では両目と鼻を四角で囲った、T字型の囲いだけで98%以上の識別が可能と言う研究がある。また、個人個人の違いが複雑な顔も、特殊な加工をすることで単純化することができる。
余談だが、以前顔認証無形具で、ゴリラの顔に黒人という識別子が付いてしまって、問題になった事がある。ゴリラと黒人の情報粒不足が原因と言う事だった。ゴリラの識別子付与を止める回避策を取ったが、今だに正しくは識別できないらしい。AIは全く万能では無い。
「AIって何?」連載三、四、五節で、解答を二値化して、0と1で文字を表現したが、二値化する前の実数を直接扱うこともできる。例えば、電脳は色を赤、緑、青、透明度の数値(0〜255の整数範囲)で扱い、それらを画面の画素に反映させる。しかし、この数値は正規化して、0.0〜1.0の範囲で扱う事もできる。多くの画像無形具や専用画像有形具機器は小数点方式を採用している。
色を0.0〜1.0の範囲で扱う事が出来るなら、電脳の神経電網で処理する事も可能になる。AIと言うと、顔認証、各種癌診断、農作物生育診断、山林や海洋の自然環境診断、魚の種類識別や数の推定等、画像を処理するものが多いのは、画像電帳が数値の塊だからである。
音は標本抽出により、相似型から計数型に変換され、数値の塊の電脳の音源電帳として保存される。これも音声認識等でAIとの相性が良い。
逆に数値化できなものは、電脳の神経電網で直接扱えない。人が介在する工夫がいるが、これは次回としよう。