見出し画像

ディープラーニングに魅せられ、「天気予測システム」まで自作してしまった男

人間の脳神経の仕組みをコンピュータ上に再現することで、人間の考え方に近い認識や判断をさせる「ディープラーニング」。この技術は、自動運転車や囲碁、将棋、自動翻訳など、日々の生活に関わる分野でも活用されていることから、耳にする機会が多くなっている。

 しかし、世の中を変え得る技術として期待が高まる一方で、エンタープライズ分野への実用化は、まだあまり進んでいないのが現状だ。実証実験レベルで止まっている企業も多く、事例はまだまだ少ない。試してみたいが、何ができるのかよく分からない――そんな企業も多いだろう。

 そんな中、ディープラーニングの可能性に魅せられ、エバンジェリストになろうと決意した1人の男がいる。日本ヒューレット・パッカードの置田誠さんだ。PC歴37年、自作の自宅用サーバは7世代目という根っからの“自作オタク”だが、ディープラーニングのシステムも自作して「遊んでいる」という。そんな彼にディープラーニングの面白さについて聞いてみた。

「ディープラーニング」は何がスゴいのか?

日本ヒューレット・パッカード ディープラーニングエバンジェリスト 置田誠さん

 置田さんによると、ディープラーニングのすごいところは「機械が“正確な目”を持った」点にあるという。これは見るということだけではなく認識、つまり物事を見分けることが人間とほぼ同じような精度でできるということを指す。曖昧なデータについて、曖昧な判断をすることも可能で、そのスピードは人間とは比べものにならないほど高速だ。

 「従来のコンピュータに何らかの判断をさせる場合、簡単に言えば、データを個別に分けて記録し、それぞれ比較しながら見分ける仕組みだったと言えます。プログラムで言うと、if文などで条件を分岐させていくイメージですね。それに対して、ディープラーニングはさまざまな物事の特徴を重ねた状態で記憶しています。あとは、足し算と掛け算で計算するだけなので、少ないコンピューティングリソースで、非常に高速な判断ができるわけです」(置田さん)

 基本的な構造が単純であるため、応用範囲が広いのもディープラーニングの特徴だ。果物の画像を記憶させることもできれば、音声を記憶させることも、翻訳向けのテキストを記憶させることもできる。「正しくデータを学習させれば、さまざまな分野で使えるというのも革命的です。日常生活にも応用できるため、文字通り社会を大きく変える可能性があるといえるでしょう」(置田さん)

ディープラーニングでリンゴの画像を判定する仕組みの例。入力画像のピクセル値(ピクセル単位の色情報)に演算を繰り返して、入力画像の分類に最も適した特徴を数値計算し、分類結果を導き出す

 最近では、ディープラーニングによってAIに“創作活動”をさせる動きも盛んだ。オランダの画家、レンブラント風の絵画を生みだそうと挑む米Microsoftのプロジェクト「The Next Rembrandt」や、ジャズを生成した「deepjazz」、そして白黒写真に自動で着色する技術も生まれている。

 大きな可能性を持つディープラーニングだが、置田さんによると、一般的なエンジニアでも“手が出せる”点が魅力的なのだという。

 「高度な機械学習は、数学的な知見や豊富な実戦経験がないとアルゴリズムが組めないこともあって、僕には相当厳しいですね(笑)。膨大なデータにどのような予測モデルを当てはめるのかを判断するのが、特に難しい部分だと思います。予測モデル自体は全部で数百パターンもあり、試しながら最適なモデルを推測していくのですが、そのノウハウを得るためには、1年以上の修業を積まないと厳しいという話をよく聞きます」(置田さん)

 ディープラーニングの場合、先駆者たちが作ったアルゴリズムに正しくデータを入れられれば、かなりの精度で結果を得ることができる。入力するデータと出力させたいデータの両者を設定できれば良く、そのためには、「何が知りたいのか」「どんなデータを入れればよいのか」という課題設定の部分が重要になってくる。

 「収穫したキュウリの等級を決めたいならば、各等級の写真データがあればいいですし、翻訳がしたいならば、意味が一致するペアの文章データを入れていけばいい。やりたいことが決まっていれば、必要なデータもおのずと見えてきます」(置田さん)

企業でディープラーニングが普及しない理由

 業務効率化などにつながることから、ディープラーニングはビジネス分野でも注目を集めているが、なかなか実案件が増えない理由の1つに、置田さんは“ディープラーニングについての理解がまだ足りない”ことを挙げる。

 「さまざまな企業の方と話していると、大量のデータを読み込ませれば、機械学習(ディープラーニング)のシステムが実現できると考えている人が意外と多いです。それもある面では正しいのですが、目的に合わせて、機械に読み込ませるデータを作る必要があり、これがかなり大変なのです」(置田さん)

 例えば、内視鏡検査の画像からガンを発見するという目的でディープラーニングを使うならば、まずは膨大な画像データから、正常な状態と異常な状態を分類しなければならない。この分類したデータがAIが判断する基準、つまり「教師データ」になるのだが、この分類を人力で行おうとすれば、当然、膨大な工数と時間がかかる。この部分でカベにぶつかってしまう企業が多いのだ。

ディープラーニングで分析をするまでの作業の流れ

 そのため、置田さんは教師データの作成にもディープラーニングが使えないかということを研究している。

 「最近では、『教師データはお金につながる宝物だ』と多くの人が言い始めています。まるでゴールドラッシュみたいなイメージですが、教師データの作成が人力なのでは、手作業で金を掘ろうとしているようなものです。この作業を機械化できないかというのが、今ディープラーニング分野で盛り上がり始めている議論です」(置田さん)

ディープラーニングを系統立てて学べる環境が必要

 ディープラーニングが普及しない理由は、これ以外にもある。まだ実用化が始まって間もない技術であることから、体系的に学べる環境が整っていないことだ。その結果、“試したくても試し方が分からない”という状況が生まれてしまっている。

 「まずは、系統だった情報が少ないです。Web上で公開されている情報は、ピンポイントかつ散在している状況で、内容もかなり高度です。書籍も少なく、知らないキーワードも山ほど出てくるので、初心者にはかなりしきいが高いんですよ。私自身も“正解ラベル”という単語の意味が分からず、半日ぐらい調べ続けた経験があります。また、参考になるコードや勉強を行うためのデータセットもまだまだ少ない。このような状況では、ディープラーニングを学ぶ人が増えないのも仕方のないことです」(置田さん)

 実例が少ないため、ディープラーニングがどのようにビジネスにつながるかがイメージできない。さまざまな課題に対し、具体的に何をしていけばよいのかが見えないと、人材育成や投資をしてもらえないのだ。置田さんはこんな状況を打開したいと考え、自らさまざまなディープラーニングのシステムを自作しているという。

自宅のベランダにWebカメラを設置。各種センサーはダクト内にあるという

 その1つが「天気予測システム」だ。Webカメラで自宅前の映像を撮影し、その画像と気温や湿度、気圧といった数値と照らし合わせて、天気を学習し、数時間後の天気を予測するというものだ。気温などを測る各種センサーをRaspberry PIに接続し、ベランダに設置。実家が町工場ということもあり、はんだ付けは“お手のもの”だ。

 システム自体にかかった費用は2万円程度、時間も3日ほどだった。その後、夜間の画像が見えない、曇りと雨の区別がつかない、カメラが壊れる――といった苦難もあったが、地道に活動を続けているという。このほかにも、家に届いたスパムメールを学習させてみたり、スマートフォンのジェスチャー(振る、回すなど)を学習させてみたりと、いろいろなことを試しているそうだ。

天気予測システムの概略図

 「今後は自分が作って学んだ経験を基に、実装向けのトレーニングもやりたいですね。ディープラーニングという分野は黎明期で、まだまだエンジニアが少ない状況です、ぜひ若い人にチャレンジしてもらいたいです。エンジニアを増やしながら、企業内でディープラーニングをやろうかどうか、悩んでいる人の背中をそっと押してあげる。そんなエバンジェリストになりたいですね」(置田さん)

ソース


pic ref


いいなと思ったら応援しよう!

この記事が参加している募集