見出し画像

つぶやくカメラ「エッジLLMカメラ」のデモを作ってもらった ブログ投稿No.6

こんにちは。ダルマBです👺
事の発端は、上司から「AIで世の中の課題を解決できないの?」と言われたことでした。例えば、学校のプールが溢れる前に通知したり、熊が町中に出没したら住民に通知とかAIで解決できないのか?

とりあえず、学校のプールや熊の写真をchatGPT君に見せたところ、状況をしっかり説明できることに感動。

ということで、管理職権限を行使して、Rockchip社の商品を扱っている部下たちに、カメラ+SBC(ラズパイみたいなモノ)のハードにLLM(大規模言語モデル)を実装した「エッジLLMカメラ」のデモを作ってもらっています(現在進行形)

1.「エッジLLMカメラ」の構成は、以下の通り

USBカメラ+Rockchip社「RK3588」搭載SBC+LLMの構成

2.「エッジLLMカメラ」のデモ
 指示してから、1ヶ月経過したので、デモ開発の進捗を確認した結果
 LLMをONNX形式に変換して、RK3588のNPU(AI処理用プロセッサ)へ
 実装するには、もう少し時間が欲しいとの事。
 正直、部下の説明を理解しきれてないけど、、、、
 とにかく、CPUに実装したデモはできた。という事なので、とりあえず
 デモをみせてもらいました
 
・デモの様子は以下の通り
①タッチパネル付液晶の「質問ボタン」から質問を選択する
 → 質問:画像に写ってる人物は何をしてる?
②「キャプチャボタン」を押すと、右側にキャプチャした画像が表示される
 → パソコン前の部下をキャプチャしてみました
③ キャプチャした画像の状況の回答が表示される
 → 回答:画像には、一人の男性がパソコンを操作している様子が描かれ
      ています。彼は白いシャツを着ていて、手元にペンを持ってお
      り画面前で何かを見ているように見えます。背景には建物や
      ガラス張りの部分があります

デモ画面のイメージ(左)と実際にデモした時の写真(右)
設定した質問リスト(質問リストは用途によって事前に設定可能にする予定)

3.感想
 カメラ+SBCの構成でキャプチャした画像の状況をLLMに言語化して
 もらえる事は証明出来た。
 今回のデモは、写真をキャプチャしてから回答が表示されるまで約20秒
 かかっている。CPUではなく、NPUにLLMを実装したら、これが劇的に
 短くなるだろうとの報告を受けたので、NPUにLLMを実装したデモに期
 待。1ヶ月以内には完成するかな?

 今回の「エッジLLMカメラ」を使えば、カメラで撮影した状況を文字で
 教えてくれるカメラを用意できる事が分かったので、「つぶやくカメラ」 
 で、以下2つに関しては上司にAIで解決できますと報告できそうかな
 案① プールの水が溢れていないか? ”つぶやく”
 案② 町中に熊が徘徊していないか ”つぶやく”

 GPT君に聞いた結果は以下の通り
 案③ 高齢者の見守り:室内の異常検知、家事事故の防止
 案④ 子どもの安全確認:通学時の見守り、塾や習い事の出欠管理
 案⑤ 近隣トラブルの解決:ゴミ出しの監視、駐車場の無断駐車監視
 案⑥ 混雑緩和と効率的な利用:公共施設、交通機関の混雑情報
 案⑦ 地域ごとの天気情報提供:空模様のリアルタイム通知
 案⑧ 交通機関の運行管理:道路状況通知
 案⑨ 災害対策:川の増水や土砂災害の監視

本当にLLMでどこまで”つぶやく”ことが出来るか次第だけど
色々と試していきます。10月中には最新状況を更新予定                            (続く)




この記事が気に入ったらサポートをしてみませんか?