【LINE BOT】LINEへ「大規模アクションモデル(LAM)」を組み込む事が日本に生成AIを浸透させる最適解なのかも
背景
個人的に「どのLLMが速度早い」「賢い」「精度高い」だのには興味がありません。どうせ全部ストレスの無いレベルになるのが必然かなと考えています。じゃあ何に興味があるのかというと「大規模アクションモデル(LAM)」です。
これを簡単に説明すると、LLMからの入力に対して適切なアプリケーションを立ち上げたり、APIを実行するものになります。Rabbit R1が分かりやすので記事を参照ください。
またAppleがiOS 18にOpenAIのChatGPTを搭載するようで、これはsiri(ChatGPT搭載ver)に命令すると、端末に入っているアプリを起動させたりスケジュールの入力させたりするものと予測されます。
ユーザーの入力をトリガーとして、複数のAPIを使い分けるGPTsは以前作成したことがありましたが、これを更に拡張させたものかなと。
そんなこんなで、生成AIの社会実装に一番近いのは、既に圧倒的に浸透している「LINE」と、この入力に対してタスクを実行するものが、最適解なのではないかと考えました。どうせやるなら最大限に拡張して、「次世代LINEのUI/UX」の提示を目指す!
基本機能
作成したプロダクトは、LINEを使用したユーザーのシンプルな入力を通じて、大規模言語モデルが意図を解釈し、適切なAPIを選択して実行します。これにより、ユーザーはアプリ間、トーク間の移動なしで必要な情報にシームレスにアクセスできます。
この「シームレスなアクセス」こそAIとLINEを組み合わせた次世代のUI/UXになると考え開発しました。トリガーとなる会話は、ユーザーは特別な操作をすることなく、まるで秘書に依頼するかのようにこのサービスを利用できます。
また、過去の対話から学習を行い、各ユーザーにパーソナライズされた体験を提供します。これらの機能はデータ分析と連携し、ユーザーのニーズや傾向を把握し、最適化された情報やサービスを提供することが可能です。提供される情報については、APIを通じて常に最新の状態に保ち、学習データの遅れや誤情報のリスクを最小限に抑えています。
プロダクト名「WIRE」は、「配線」を意味し、より複雑なアクションと通信を行うこと、そして「LINE」の直線的な意味を超えた多角的な通信ネットワークを指すことから名付けています。
主な機能
テキストと画像の解析:
GPT4V:自然言語処理モデルを利用して、テキストの内容を解析
DALLE 3:高品質な画像を生成
ウェブサーチ:
Google Web Search:Googleで情報を検索
Google Images Search:Google Imagesで画像を検索
Google Scholar:Google Scholarで学術論文などを検索
Google Shopping:Google Shoppingで商品を検索
Wikipedia:Wikipediaで情報を検索
ファイナンス:
Yahoo Finance:株価や企業の財務情報などを取得
CryptoTicker:暗号通貨の情報を取得
旅行と地理:
Tripadvisor:ホテルやレストランなどの情報を検索
Google Maps:地図やルート案内などを提供
ニュースとメディア:
Get Top News:Googleでニュースを検索
YouTube:YouTubeで動画を検索
Tiktok:TikTokで動画を検索
Netflix:Netflixで映画やドラマを検索
Prime:Amazon Prime Videoで映画やドラマを検索
Disney:Disney+で映画やドラマを検索
Reddit:Redditでコンテンツを検索
X(Twitter):Twitterでツイートを検索
文書の読み取り:
Doc Reader:文書の閲覧や検索
Notion:Notionのページを閲覧
LinkReader:ウェブページの情報を取得
天候:
Yahoo Weather:天気情報を取得
ジョブサーチ:
Google Jobs:求人情報を検索
総評
Macbook proのコマンドキーがぶっ壊れたけど、買い換えるお金がなかったのでハッカソンに参加しました。LINEbotなんか作ったことなかったですが、もう一個の作品の「むーちゃん」は色々と問題ありそうなので、ちゃんと考えて作りました。
正直、めちゃくちゃ便利です。無料枠(200トーク)さえなければこれ以上ないプラットフォームになります。LINEとしても、このBotの機能を標準的に組み込むと、LINEの会話データだけはなく、Googleしか持っていないデータ、各SNSのデータなど、今まで手に入れられなかった「サイコグラフィックデータ」が手に入るため、圧倒的なデータ収集が可能になります。
様々な使用料金を差し引いても、このデータプラットホームとしての次世代のLINEは素晴らしい価値があると考えます。
実際の社会実装としてはちゃんとしたエンジニアが設計する必要があると思いますが、「WIRE」という名前も含めて、コンセプトとしては良いのではないでしょうか。