
生成AI用語辞典:初心者向け基本用語解説
生成AIの世界は専門用語が多く、生成AIを始めたばかりの人にとって難解で混乱しがちです。
本用語集では、生成AIの基礎から応用までを網羅し、わかりやすい表現で解説します。
各用語は学術的な厳密性を保ちつつ、具体例や比喩を多用することで直感的な理解を促す構成となっています。
基本概念編
生成AI(Generative AI)
人間の創造的なプロセスを模倣し、文章/画像/音楽などの全く新しいコンテンツを生成する技術。
例:ChatGPTが会話文を作成、DALL-Eが架空の風景画を生成。従来のAIが「識別」に特化していたのに対し、0から1を生み出す点が特徴。
プロンプト(Prompt)
AIへの指示文。「桜の咲く城の夜景をアニメ風で」のような具体的な要望を伝える文章。
料理のレシピに例えると、材料(入力データ)と調理法(指示)を指定する役割。
ハルシネーション(Hallucination)
AIが事実と異なる内容を自信満々に生成する現象。
例:存在しない歴史的事実を創作。トレーニングデータ不足や文脈誤解が主原因で、事実確認が必須。
技術基盤編
大規模言語モデル(LLM)
数十億~数兆のパラメータを持つ自然言語処理AI。人間の脳神経網(ニューラルネットワーク)を模倣し、Wikipedia級のテキストデータで学習。ChatGPTの基盤技術。
ディープラーニング
多層ニューラルネットワークによる機械学習手法。
画像認識では物体の輪郭→形状→詳細と、段階的に特徴抽出する様子が「深層」の由来。
トランスフォーマー
Googleが2017年に開発した自然言語処理の革命的技術。文脈を長距離依存関係で捉える「Attention機構」が特徴で、GPTシリーズの基盤。
学習プロセス編
教師あり学習
正解ラベル付きデータで行うトレーニング。
例:犬と猫の画像にタグ付けし判別能力を習得。従来AIの主流手法。
強化学習
試行錯誤を通じ最適行動を学習。ゲームAIが自己対戦で強くなる仕組み。ChatGPTの対話最適化に応用。
ファインチューニング
事前学習モデルを特定用途に最適化。例:医療用LLMを一般モデルから専門調整。
応用技術編
RAG(検索拡張生成)
外部データベースと連動した回答生成。最新情報や社内文書を参照可能にし、ハルシネーション低減。
マルチモーダル
複数メディアを同時処理。GPT-4は画像入力→テキスト出力が可能。視覚障碍者支援など応用範囲広い。
ディープフェイク
AI生成の超リアルな偽映像。俳優の顔を別人に置換する技術など、倫理的課題を包含。
評価指標編
パラメータ数
AIモデルの複雑さを示す指標。GPT-3が1750億個、人間の脳神経(約860億)を上回る。多すぎると過学習リスク。
BLEUスコア
機械翻訳の精度評価基準。人間の翻訳とのn-gram一致率で算出。高得点≠自然な文章の盲点あり。
トークン
AIが処理するテキストの最小単位。英語は単語、日本語は形態素解析で分割。料金計算の基準にも。
倫理・課題編
アルゴリズムバイアス
学習データに起因する偏り。例:職種連想で「CEO→男性」が多発。多様性担保が急務。
説明可能AI(XAI)
判断根拠を可視化する技術。医療診断などで信頼性向上が必須。決定木などの手法開発進む。
サステナビリティ
学習時の電力消費問題。GPT-3訓練で家庭20年分の電力を消費との試算。省エネ型モデル開発が活発化。
主要モデル編
GPTシリーズ
OpenAI開発のテキスト生成モデル。GPT-4はマルチモーダル対応。プロンプト設計が出力品質を左右。
Stable Diffusion
オープンソース画像生成モデル。テキスト→画像変換の代表格。芸術家のスタイル模倣が可能。
BERT
Googleの文脈理解モデル。検索エンジンの精度向上に貢献。双方向の文脈解析が特徴。
開発手法編
プロンプトエンジニアリング
最適な指示文設計の技術。例:「小学生に説明するように」と指定→平易な文章生成。
転移学習
他領域の知識を流用。例:犬猫判別AIを医療画像診断に応用。開発効率向上の鍵。
データ拡張
既存データを加工して増幅。画像の回転/反転、テキストの言い換え等。少データ学習問題の解決策。
社会実装編
AIガバナンス
技術開発と規制のバランス。EU AI法など世界的な法整備進む。企業の倫理綱領策定が急務。
ヒューマンインザループ(HITL)
AI判断に人間が介入。医療診断や採用選考で最終判断を人間に委ねる仕組み。
デジタルツイン
物理的なオブジェクトやシステムをデジタルで再現する技術。IoTデータをリアルタイムで更新し、AIと組み合わせることで、高度なシミュレーションや予測が実現。
未来展望編
AGI(汎用人工知能)
人間レベルの汎用知能。現状のAIは特化型(弱いAI)。倫理的議論と並行開発が課題。
ニューロモーフィックチップ
脳型ハードウェア。省電力・高速処理を実現。従来のノイマン型を超える可能性。
量子機械学習
量子コンピュータ応用。複雑なモデル訓練を高速化。創薬シミュレーションなど期待。
最後に
この用語集は、生成AIの全体像を7つの分野、合計28の項目でわかりやすくまとめました。
技術的な詳細だけでなく、社会での活用方法についても触れており、初心者の方が体系的に理解できるよう工夫しています。
各項目がどのように関連しているかにも注目することで、単なる用語の暗記を超え、実際に役立つ知識を身につけることができるでしょう。
しかし、生成AIの分野は日々進化しているため、最新の動向を追い、この用語集も定期的に更新することをおすすめします。