生成AIカンファレンス2024参加レポート
Generative AI Conference 生成AIカンファレンス2024 〜徹底解剖「トップランナーから見た日本が挑む生成AIの最前線」〜 2024年5月8日 @東京大学伊藤謝恩ホール にオンライン参加したので、概要をまとめました。
オープニングセッション Vol.1
生成AI産業の直感的理解とAIの社会実装装置としてのPKSHA
株式会社PKSHA Technology 代表取締役 上野山 勝也氏
不正検知システム「パークシャーセキュリティ」
クレジットカードの不正利用を検知するAIシステム
過去は人間が行っていたルールベースの判定を、機械学習べースに切り替えることで高度化
現在、約40兆円の決済トランザクションをリアルタイムに監視
チャットボット・ボイスボット
6年前から社会実装し、日本で最も利用されているチャットボットサービスを提供
現在、1つのエージェントが年収100万円程度の価値を生み出していると試算
47都道府県全てで導入が進んでいる
子供の不登校予測システム
小中学校での導入が進んでいるAIシステム
様々なデータから不登校の予兆を検知し、教職員に知らせることで早期の対応を可能に
AIの活用により、これまで個人の経験や勘に頼っていた部分をシステム化
オープニングセッション Vol.2
LLMの最前線と今後の展望
株式会社Preferred Networks 代表取締役 最高研究責任者 岡野原 大輔氏
LLMの発展の歴史
ディープラーニングの登場から、LLMが急速に発展
GPT-4などの登場により、AIが人間の知能に匹敵するレベルに到達
LLMの性能評価
大学生や専門家と同等以上の性能を示すようになってきている
例: 数学、生物学、歴史、計算機科学、法律などの分野での問題解決能力
LLMがもたらす影響
専門的な知識を必要とするタスクが自動化される可能性
例: プログラミングにおけるAIの活用で生産性が40〜50%向上
プリファードネットワークスの取り組み
2023年初めから自社でLLMの開発を開始
計算資源の確保や、日本語と英語の性能を重視したモデル開発
具体例: 「pFN-PaLM」シリーズのモデル開発、ジェミニ計画への参加
LLMの活用事例
材料探索: 自然言語での指示からプログラムを生成し、シミュレーションを実行
文章生成: 社内データを活用した報告書や営業資料の自動生成
分類タスク: LLMを用いたデータの高速分類
画像認識との組み合わせ: 画像からの状況理解と分析
今後の展望
モデルの大規模化に伴う計算資源の確保が課題
データの品質向上やモデルの軽量化などの研究が進む
LLMを活用したアプリケーション開発が加速
パネルディスカッション Vol.1
大規模言語モデルを作るその意義に迫る
東京工業大学 教授 岡崎 直観氏
ストックマーク株式会社 VP of Research 近江 崇宏氏
株式会社ELYZA 代表取締役CEO 曽根岡 侑也氏
LLMを作る意義
研究コミュニティで使えるLLMの開発、LLMの仕組みの理解、特定のアプリケーションやドメインに特化したモデルの開発
日本語特有の処理の効率化(トークナイザーの工夫)、日本の事情に合わせた知識の追加(法律など)
ビジネスに特化した知識を持つLLMの開発、日本語LLMの発展への貢献
LLM開発の苦労
大規模なデータの収集と処理、計算資源の確保、モデルの学習における細かな設定の調整
多額の計算資源コストの確保("1000万円ガチャ")、事前学習済みモデルの活用によるコスト削減
モデルサイズとパフォーマンスのバランス調整、モデルの振る舞いのコントロールの難しさ
社会実装に向けた取り組み
汎用的な対話モデルの開発、企業との共同研究を通じた応用事例の蓄積
大企業との協業を通じたLLMの実用化、プロンプトエンジニアリングやUIの工夫によるユーザビリティの向上
ビジネス特化型LLMを用いたアプリケーション開発、ユーザーフィードバックを重視した評価手法の確立
今後の展望
オープンなモデルと大企業のモデルに匹敵する日本語LLMの登場、研究者コミュニティの拡大と知見の共有
選ばれるLLMの開発とAPIサービスや企業との協業を通じた社会実装の加速
お客様の価値創出に重点を置いたLLMの活用、新たなLLMの開発とビジネス領域への応用
パネルディスカッション Vol.2
日本の生成AIをリードする企業に学ぶ、革新的アプリケーションの創造
株式会社Algomatic 取締役CTO 南里 勇気氏
株式会社プレイド 執行役員 CTO 牧野 祐己氏
株式会社AI Shift 開発責任者 青野 健利氏
1.株式会社Algomaticの取り組み
複数のカンパニーを持ち、生成AIを使うことを前提に様々な事業を立ち上げるスタートアップスタジオ的なアプローチを取っている。
自社の住宅開発コンサルティング事業では、生成AIを活用することで労働集約的な部分をシステム化し、1人あたりの処理能力を大幅に向上させることを目指している。
競合との差別化ポイントは、スピード、品質、ドメイン知識の3点を重視している。
2.プレイドの取り組み
大規模データエンジニアリングに特化した会社で、顧客のデータを活用し、ユーザー体験の向上を目指している。
差別化ポイントは、LLMが持っていないデータを活用すること、およびUXレイヤーでユーザー側の知識を把握すること。
短期的にはLLMの最新モデルにキャッチアップし、中長期的には追加学習により精度を上げることを目指している。
3.株式会社AIシフトの取り組み
サイバーエージェントの子会社で、コールセンター領域でのAI活用に注力。チャットボット、ボイスボット、自動予約、文字起こしなどのサービスを提供。
原価を抑えつつ、正確性と速度のバランスを追求することが差別化ポイント。
アプリケーション開発では、市場調査よりもプロトタイプを素早く作成し、議論することを重視。コード生成により、プロトタイプ作成のスピードが大幅に向上。
ランチタイムセッション
LLM評価のベストプラクティス
Weights & Biases カスタマーサクセス機械学習エンジニア 鎌田 啓輔氏
LLM評価の目的
モデルの特性を理解すること。これは学術・リサーチ分野で重要。
特定の課題を解決できるかどうかを評価すること。企業での活用に重要。
2.日本語LLMリーダーボード「レミリーダーボード」の特徴
1問1答だけでなく、生成タスクも評価。現在のユースケースに合わせている。
スコアだけでなく、モデルの特性も可視化。
リーダーボードハックを防ぐため、追加するモデルは慎重に審査。
3.レミリーダーボードの影響力
日本で最大級のリーダーボード。経産省のプロジェクト「ジーニアス」でも派生版が使用。
韓国版「ホラニリーダーボード」も蒲田氏が作成。海外からの関心も高い。
4.LLMの新しい評価軸の必要性
安全性、公平性、制御性など、新しい評価軸が求められている。
倫理的な判断が難しいタスクもあり、人間による評価も重要。
5.LLM評価の実装における課題と対策
評価スクリプトの作成、結果の集約・共有、バージョン管理など、実装は大変。
ウイアバスでは、評価を簡単に実行・管理できるツールを提供。
異なるモデルのインターフェースの違いによる問題は、NVIDIAのNeMoなどの技術で解決を目指す。
基調講演
本当に勝てるのか、日本のAI戦略
東京大学 教授 松尾 豊氏
日本のAI戦略の現状
日本はデジタル分野で出遅れており、AI分野でも不利な状況からのスタート。
しかし、2022年11月のChatGPTリリース以降、日本政府はAI分野で積極的な取り組みを進めている。
AI戦略会議の発足、GPU増強への補助金、AIセーフティインスティテュートの設立など、スピード感を持って対応。
2.国際的なAI規制の動向
EUは厳しいAI規制を予定。リスクベースアプローチを採用。
米国は大統領令でAIシステムのテスト基準設定を要求。イノベーション重視の姿勢。
英国はAIセーフティサミットを主催し、国際的な議論をリード。
2.日本の取り組み
広島AIプロセス: G7での議論を主導。開発者向けの行動指針を策定。
AIセーフティインスティテュートを2月に設立。米英に次ぐ3番目の設立。
3.日本の強みと課題
日本企業のDXの遅れは、AIの活用余地が大きいことを意味する。
日本のAIスタートアップは活発。大企業との協業も進んでいる。
海外大手IT企業の日本進出が活発化。日本市場の魅力が高まっている。
医療、ロボティクスなど、日本が強みを持つ分野でのAI活用に期待。
4.今後の方向性
利用、開発、リスク対応のバランスが重要。インフラ整備と活用促進が鍵。
日本企業のDX推進によるAI活用。グローバル展開も視野に。
日本の強みを生かしたAI開発。特にロボティクス分野に注目。
5.シンガポールのAI戦略との比較
シンガポールは東南アジア言語のLLMを開発し、アジアのハブを目指す。
日本はシンガポールと協力し、日本語を含む多言語LLMの開発を進めるべき。
シンガポールのAI予算は日本に比べ小規模。日本の強みを生かせる余地がある。
シェングー氏からのコメント
再現性と限界について
LLMは再現性が高く、触れる人や開発できる人がある程度必要だが、データと計算資源があれば同じようなものが作れる。
画像生成AIでも、DALL-E 2、Stable Diffusion、Midjourney等、今の時代はやっていることがそれほど変わらない。
OpenAIのGPT-4もすごいが、Gemini 1.5やClaude 3も同様にすごく、大きな差はない。
日本でも投資と開発を行えば、少し遅れても再現可能。
2.日本のエンジニアに向いている点
以前は様々なアルゴリズムがあったが、今は収束しつつあり、細かいチューニングや工夫の段階に入っている。
日本はカーレースのドライバーのように、種目が決まると極めて強くなる傾向がある。
現在のAI開発の状況は、日本の技術者がフォーカスして極めるのに適している。
3.ビッグテックへの過度な崇拝は控えるべき
OpenAI、DeepMind、Google、Microsoft、Anthropic等のビッグテックは確かにすごいが、過度に崇めすぎるのは良くない。
技術の特徴をよく理解することが大切。例えば、Gemini 1.5は早くて長距離コンテキストが得意、Claude 3はちゃんとした文章を出力する、など。
メインセッション Vol.1
LLM開発と社会実装の壁
株式会社ABEJA 代表取締役CEO 岡田 陽介氏
1.LLMの開発背景と我が社の取り組み
2017年5月にNVIDIAと資本業務提携し、2018年12月にGoogleから資金調達を行った。
2019年から大規模言語モデルの研究開発を開始し、2022年にNVIDIA A100 GPUを960機使って学習に成功。
2023年5月に「アジェールLLMシリーズ」の商用提供を開始。
2.LLM開発と社会実装の壁
クオリティとコストのトレードオフが課題。具体的には、GPUコストが高く、4年間で20億円の利益を出すようなユースケースでしかLLMを使えない状況。
この壁を乗り越えるために、低コストなポストトレーニングのための基盤モデルと高精度のRAG(Retrieval-Augmented Generation)とエージェントの開発に取り組んでいる。
3.低コストなポストトレーニングのための基盤モデル開発
日本語の生成能力と理解力の高い基盤モデルを開発中。現在はプレトレーニングまで完了し、オープンソースでも高い精度を達成。
今後はポストトレーニングを行い、精度を上げていく予定。ポストトレーニングのコストを低減するための工夫を行っている。
4.高精度のRAGとエージェントの開発
RAGを使って、外部知識を取り込みながら高精度な生成を行うことを目指している。
エージェントを使って、人から情報を収集したり、アプリケーションやAPIと連携したりすることで、より高度な生成を可能にする。
収集した情報をRAGのデータベースに取り込むことで、再利用性を高める。
5.研究開発成果の公開
低コストなポストトレーニングの基盤モデルと高精度のRAGとエージェントの研究開発成果は、オープンソースとして公開する予定。
自社プラットフォームにも搭載し、エンタープライズ向けにサポートを提供するビジネスモデルを採用する。
メインセッション Vol.2
生成 AI の今後のニーズを見据えた Microsoft におけるさまざまな取り組み
日本マイクロソフト株式会社 パートナー事業本部パートナー ソリューション アーキテクト 松崎 剛氏
1.インフラストラクチャー
Azure ML Commons MLPerfでNVIDIAに次ぐ高いスコアを達成
Azure上でNVIDIAとAMDのGPUを大規模に接続し、最適化を行っている
Microsoft独自のAI用アプライアンスモジュール「Maya 100」の開発
2.言語モデル
ファウンデーションモデル「Falcon」の開発
教科書レベルの専用の合成データを使った学習により、パラメータ数の割に高い性能を達成
低コストで高性能な言語モデルの開発を目指している
3.アーキテクチャ
リテンションネットワーク: RNNとアテンションを組み合わせた新しいアーキテクチャ
ビットネット: 1ビット量子化を用いた計算効率の高いアーキテクチャ
4.アプリケーション
Copilotの開発: ExcelやWordなどのMicrosoft製品にAIアシスタント機能を統合
GitHub Copilotによるコーディング支援
JARVIS: マルチエージェントシステムの開発を支援するツール
Microsoftのアプリケーションにおける生成AIの活用事例の紹介(例: Excelでの表の自動生成、企業内情報の検索など)
メインセッション Vol.3
世界の生成AIがもたらすクリエイティブ革命
株式会社OpenFashion 代表取締役CEO 上田 徹氏
1.上田氏が制作した、生成AIを使った約2分間の動画の紹介。
画像生成にはMidjourneyを使用し、プロンプトの生成にはChatGPT3のAPIを利用。
動画生成にはRunwayを使用し、音声・音楽生成にはSonicを使用。
全体の制作にかかった時間は、上田氏自身で約45時間。
2.ファッション業界での生成AIの活用事例の紹介。
ジーンズブランドのGstarが、生成AIを使ってデザインしたジーンズを実際に製品化。
パルコが、2022年のクリスマスキャンペーンで、生成AIを使ったビジュアルを採用し、賞を受賞。
楽天ファッションウィーク東京の2024年秋冬シーズンのプロモーション動画が、生成AIで制作された。
3.生成AIを使った新しいサービスやプラットフォームの登場。
AIを使って服をデザインし、それを実際に製造・販売するサービス「Othership」の事例。
リボーバという米国のアパレルECサイトが、AIファッションウィークで生成AIを使ったデザインを商品化。
4.東京AIファッションウィークの開催と、学生によるAIを使ったデザイン制作の事例。
国際ファッション専門職大学の学生が、生成AIを使ってバッグをデザイン。プロと見間違えるようなクオリティを短期間で実現。
上田氏が主催する東京AIファッションウィークでは、1,900以上の応募作品が集まり、受賞作品の展示が行われた。
メインセッション Vol.4
「知的単純作業」を自動化する、地に足の着いた大規模言語モデル (LLM) の活用
株式会社LayerX 部門執行役員 AI・LLM事業部長 中村 龍矢氏
1.LLMを活用する背景について
過去のブロックチェーン事業やプライバシーテック事業で直面した課題(データやビジネスのフォーマットのばらつき、構造化データの少なさ)をLLMで解決できる可能性を感じた
既存の事業でのAI活用の知見があった
技術が好きな経営文化・事業文化である
2.LLMを活用した知的単純作業の自動化について
銀行の融資審査業務を例に、決算書や事業計画書などの非定型な書類を読み込んで審査書を作成したり、契約書のドラフトを作成したりする作業をLLMで自動化できる
従業員の満足度向上、ヒューマンエラーの削減、レビューの容易化、業務の標準化などのメリットがある
ニッチな業務であっても、LLMを使えば効率化が可能になる
3.LLMのチューニングについて
ドメイン知識を埋め込むことで精度を上げる必要があること。具体的には業務ルールや言葉遣いなどをLLMに学習させる
技術的なチューニング(前処理、検索、処理の分割と構成など)も重要である
チューニングによって70〜80%の精度を目指す
チューニングのパターンを整理し、効率化するためのプラットフォームを構築している
4.LLMを活用するための人材について
アルゴリズムへの理解に加えて、ユーザーとの対話力が重要
ユーザーの業務を理解し、ユーザー目線で精度の評価をする必要がある
遠慮せずにユーザーとコミュニケーションを取ることが大切
パネルディスカッション Vol.3
日本の画像生成AIのこれから
AIHUB株式会社 代表取締役CTO 新井 モノ氏
株式会社AIdeaLab 代表取締役 冨平 準喜氏
Stability AI Japan株式会社 Software engineer 澁井 雄介氏
1.画像生成AIの事業化
AIハブ株式会社は、漫画、アニメ、ファッション、建築など様々な分野に特化した基盤モデルを構築し、大規模なモデルを作るのを支援しながら、ユースケースの開発を進めている。
AIdeaLabは、AIピカソというモバイルアプリケーションを提供し、ユーザーが画像生成を楽しめるようにしている。素材としての利用が多く、パワーポイントの素材などにも使えるようにイラスト屋と提携している。
スタビリティAIは、世界中で使われているStable Diffusionのようなオープンソースのモデルを提供している。まずは画像を作って遊ぶのが好きな人たちが扱い、それが当たり前になっていく中で、ビジネスでの活用が広がっていくと考えている。
2.高精度なモデルの学習と評価
モデルの精度を上げるには、大量の学習データが必要だが、日本では著作権の問題があるため、データを制限しなければならない。クリーンなデータをどう増やすかが重要。
イラストレーターと協力して学習データを作成し、人間が見て評価することが大切。ドメインエキスパートを活用し、彼らの選定プロセスをAIに学習させることで、モデルの性能向上を目指している。
3.安全なAI活用のための法整備と運用
著作権的に使用してはいけないデータを学習に使わないこと、倫理的に問題のある画像生成をフィルタリングすることが重要。
法的な問題をクリアしつつ、クリエイターが心から楽しめるAIを作ることが目標。クリエイターとの協力関係を築き、Win-Winの関係を構築していくことが求められる。
ブロックチェーンを活用し、学習データから生成に至るまでのトレーサビリティを確保することで、透明性のあるAI開発を目指す動きもある。
4.各社の今後の展望
AIハブ株式会社は、コミュニティでモデルの標準化やメタデータの標準化を進め、学習から生成までのトレーサビリティを確保するために、ブロックチェーン技術を活用したWeb3時代のAIの可能性に注目している。
AIdeaLabは、AIピカソを国内外でさらに広げていきたいと考えている。現在は画像生成と動画生成に対応しているが、今後は音楽や音声なども含めた生成AIプラットフォームとして発展させていく予定。日本を代表する画像生成アプリになることを目指している。
スタビリティAIは、画像だけでなく、動画、音楽、LLM、コーディング、3Dなど、様々なモデルをオープンソースとして公開している。これらのモデルをビジネスに組み込んでいくことを支援し、企業とのコラボレーションを通じて生成AIの活用を推進していきたい考え。
5.会場からの質問
学習データのクリーニングや著作権処理について、各社の取り組み方針が問われた。データの利用許諾を得ることや、フィルタリング技術の開発、人間のレビューを取り入れることなどが重要だと認識されている。
生成AIによって創作活動がどう変化するのかについて議論が行われた。AIがクリエイターを補助する役割を担い、創作の幅を広げる可能性がある一方で、クリエイターの権利保護やモチベーションの維持も重要な課題として認識されている。
パネルディスカッション Vol.4
生成AI革命は日本をどう変えるか?
株式会社AVILEN 代表取締役 高橋光太郎氏
株式会社Elithファウンダー&CTO 井上 顧基氏
KINTOテクノロジーズ株式会社 IT/IS部 生成AI活用PJT リーダー 和田 颯馬氏
1.技術的側面や哲学的側面
生成AIの現状として、大規模な言語モデルによる自然言語処理の精度向上や、敵対的生成ネットワーク(GAN)を用いた高品質な画像生成が可能になっている。将来的には、生成AIが自動プログラミングやドラッグ・ディスカバリーなど、より高度な領域に応用されていく可能性がある
生成AIが偽情報の生成や個人情報の不正利用など、社会に悪影響を及ぼすリスクがある。AIに倫理観を持たせることは可能なのか、AIによる意思決定を人間がどこまで制御できるのか。技術の発展と規制のバランスを取る必要がある
2.ビジネスや社会への影響
金融機関での生成AI活用事例として、AIを用いた自動与信審査や不正検知、チャットボットによる顧客対応などがある。これにより、人件費の削減と業務の効率化が実現できる
小売業界での事例として、生成AIを用いた需要予測や在庫最適化、ダイナミックプライシングなどがある。売上増加と機会損失の削減が可能
生成AIを活用した新たなビジネスの可能性として、AIを用いたコンテンツ制作やパーソナライズされたサービスの提供など、様々なアイデアがある
3.日本企業の価値基準やプロセス変革の必要性
日本企業の多くが縦割り組織で、部門間の連携が不足している。生成AIの導入には、部門横断的なデータ活用と意思決定が不可欠であり、組織のフラット化と脱ヒエラルキー化が必要
日本企業の意思決定プロセスが長く、スピード感に欠ける。生成AIを活用するためには、トライ&エラーを繰り返し、素早く改善していくアジャイルな開発手法の導入が必要
日本企業の評価制度が短期的な成果を重視しすぎており、長期的な視点でイノベーションに取り組むインセンティブが働きにくい。生成AIの活用には、失敗を許容し、長期的な投資を評価する文化の醸成が求められる
4.AIコンサルティング企業とAIサービス企業の役割
顧客企業の業務プロセスを可視化し、生成AIの活用シナリオを提示することが重要。その上で、AIの導入だけでなく、組織変革や人材育成までを含めた包括的な支援を行うことが、コンサルティング企業の役割
汎用的なAIサービスを提供するだけでは差別化が難しい。特定の業界や業務に特化し、その領域に最適化されたAIサービスを開発することが重要。例えば、医療分野に特化したAIサービスでは、医療データの特性を理解し、規制にも対応した上で、診断の精度向上や創薬の効率化に貢献できる
5.生成AIの社会実装に向けた課題
生成AIのブラックボックス性の問題。AIの判断根拠が説明できないことで、利用者の信頼を得られない可能性がある。この問題に対応するために、説明可能なAI(XAI)の研究開発を進める必要がある
生成AIの公平性や安全性の確保が重要。学習データに偏りがあると、AIが差別的な判断をする恐れがある。また、AIが生成したコンテンツが違法や有害である可能性もあるため、AIの出力をチェックする仕組みが必要
生成AIの導入が雇用に与える影響についても議論された。AIによる自動化で一部の職種が不要になる可能性がある。一方で、AIを活用した新たな職種も生まれる。労働者のリスキリングや教育システムの改革が必要
6.生成AIの活用を進めるための政策的な支援
生成AIの研究開発を加速するために、政府の支援が必要。基礎研究への投資や、産学連携の促進、AIベンチャーへの資金援助などが求められる
生成AIの社会実装を円滑に進めるために、規制の見直しが必要。例えば、医療分野でのAI活用を進めるために、医療データの利活用ルールの整備や、AIによる診断の法的位置づけの明確化などが求められる
生成AIに関する倫理ガイドラインの策定や、AIリテラシー教育の充実など、AIと社会の健全な関係を築くための施策が必要