(用語解説)AI関連の用語が難しい
対話型、画像生成、コード生成、動画生成など生成AIツールがたくさん出てきて盛り上がっていますね。
noteでもたくさんの人が次々と新しいツールについての記事を上げています。しかしながら、最新情報の記事だと、基礎的な知識が当たり前のように語られていることが多いので、
「ツールの使い方だけなんとなくわかったかな?よくわからない部分も多かったけど……」
みたいな気分になることが少なくないと思います。
今回は、、、
AIの歴史を振り返ったりしながら、よく頻出するAI関連の単語について解説できたらなと思います!
1.どういうものをAIと呼ぶのか
一般的には「人間の知能をコンピューターを用いて人工的に再現したもの」という認識が広く共有されていますよね!
言葉としては「人工知能」を指し、英語では「Artificial Intelligence」の略です。
"Artificial"は「人工的な」、"Intelligence"は「知能」や「知性」を意味します。
一般社団法人人工知能学会の設立趣意書では、「大量の知識データに対して、高度な推論を的確に行うことを目指したもの」と表現されています。また、AIの生みの親であるジョン・マッカーシー教授は「知的な機械、特に知的なコンピュータプログラムを作る科学と技術」と定義しています。
2.AIの歴史
AIが誕生したと言えるのは1950年代です。
1950年には、イギリスの数学者アラン・チューリングが「計算する機械と知性」という論文を発表し、機械が人間と同等の知能を持つことが可能かを試すための「チューリングテスト」を提唱しました。
さらに1956年には、ダートマス会議でジョン・マッカーシーが「人工知能(Artificial Intelligence)」という用語を初めて使用しました。
1960年代は、第一次AIブームと呼ばれています。ジョセフ・ワイゼンバウムが最初の対話型AI「ELIZA」を開発したことからそう言われているようですね。
1980年代はエキスパートシステム(※)が商業的に成功し、AI研究が再び活発化します。
※エキスパートシステムとは、特定の分野の専門家(エキスパート)の知識や経験をコンピューターに詰め込んだシステムのこと。これにより、その分野の専門家でない人でも、専門家と同じような判断や助言を得ることができる。
1990年代は、第二次AIブームと呼ばれ、コンピュータの性能向上とともに、AI研究が再び進展しました。特に、ニューラルネットワーク(※)の研究が進んだと言われています。
※ニューラルネットワークとは、人間の脳の神経細胞(ニューロン)とそのつながりを模倣した機械学習モデルのこと。入力層、隠れ層、出力層の3つの層を使って、データを処理し、最終的な結果を出す。
<ニューラルネットワーク>
入力層→隠れ層→出力層
2000年代~2010年代は、第三次AIブームと呼ばれ、ディープラーニング技術(※)の進化により、AIが大きく飛躍しました。画像認識、音声認識、自然言語処理などの分野で実用化が進んだみたいです。
※ニューラルネットワークの隠れ層をたくさん重ねた"深い"二ューラルネットワークを用いた技術のこと。層が増えることで、より複雑なパターンを学習できる。
<ディープラーニング>
入力層 → 隠れ層1 → 隠れ層2 → 隠れ層3 → ... → 隠れ層N → 出力層
そして現在2020年代は、ChatGPTやMidjourneyなどの生成AIが登場し、AIはさらに高度な応用が可能となりました。ChatGPTやMidjourneyなどの最新の生成AIも、基本的にはディープラーニング技術の応用であると言われています。
モデル自体の進化やGPUなどのハードウェアの進歩、そしてインターネットの普及により膨大な学習データを取得できるようになったことから高性能な生成AIを実現できるようになったというイメージですね。
3.ChatGPTなどの対話型AIを利用する際の注意点
ChatGPTを使用する際には、個人情報や機密情報を入力すると機密データが外部に漏れるリスクがあります。企業内での利用には、RAG(Retrieval-Augmented Generation)(※)技術を活用することが推奨されています。
※情報検索(Retrieval)と生成(Generation)を組み合わせたモデルのこと。生成AIが特定の情報を提供する際に、外部の知識ベースやデータベースから情報を引き出して生成する能力を向上させることを目的としている。RAGを用いることで、機密データを企業の管理下にあるサーバーやクラウド環境で保持したまま、外部のLLMサービスと連携することができるため、データの外部流出リスクを低減できる。
また、ChatGPTは時折、実際には存在しない情報を生成します。このことを「ハルシネーション」と呼びます。特に大規模言語モデル(LLM)に関連する現象で、モデルが学習するデータセットに含まれる情報が不完全である場合に特に発生します。
4.LLM(大規模言語モデル)とは?
大規模言語モデル(LLM: Large Language Models)とは、大量のデータとディープラーニング技術を用いて構築された高度な言語モデルです。従来の言語モデルと比較して、データ量、計算量、パラメータ量が大幅に増加しており、これにより精度が格段に向上しています。
基本的な仕組みは以下のとおりです。
まずは、言葉を小さな単位に分けます。
例えば、「こんにちは、元気ですか?」を「こんにちは」「、」「元気」「です」「か」「?」に分けるといった具合です。(これを"トークン化"と呼びます。)
次に文章の中で、それぞれの言葉がどのように関係しているかを考えます。「元気」の後には「です」が来そうだな、「か」の後には「?」が来ることが多いな、みたいなイメージです。
もちろん、文章はもっと大量に与えますので、この言葉の後にはこの言葉が来る確率が高そうだな、次に高いのはこれかな、という様々な選択肢のそれぞれが選ばれる確率を計算してもらう感じですね。
そして最後に一番適切なものを選択してもらいます。
これを繰り返すことでLLMは文章を作成しています。
5.LLMを活用するために
対話型の生成AIをそのまま使う以外の、主な使われ方に業務効率化(今まで手作業でやっていたものが自動に!系)がよくあると思います。
よく使われるのがGPTs(GPT Store)ですね。
特定の分野に詳しくさせたり、特定の目的に特化させたり、カスタマイズができます。通常のChatGPTに聞くにはちょっとニッチな情報も、あるドキュメントを読み込ませた専用のGPTsであれば、答えてくれたりするわけです。社内の規定とか商品の情報とかAIの知識として与えられて無さそうなものを答えるチャットボットとかが一番想像つきやすいかなーと思います。
Plusに加入していれば技術的な知識無しで簡単に作成も可能で、他のユーザーが作成した様々なGPTsも利用することができます。
どのようなGPTsがあるのかは以下の記事などを参照いただければと思います。
他には、DifyやCOZEなどのチャットボットやワークフローをローコード開発できるツールも出てきています。
Difyはクラウドで利用すると月額利用料がかかりますが、ローカルに構築すれば無料で利用することができます。COZEは2024/8/6現在無料で利用できそうです。
これらを活用する時に、LLMのモデルのAPI Keyを取得する必要があったり、GoogleやX(旧Twitter)などの外部ツールを使うためにそれらのAPI Keyを取得する必要があったりします。
APIとは何でしょうか。
Application Programming Interfaceの頭文字をとったもので、あるアプリケーションを別のアプリケーションの中で使いたい時に、APIへリクエストを送るだけでレスポンスが返ってくる仕組みです。
例えば、ECサイトでユーザーがクレジットカードを用いて決済する機能を付与したい場合、ECサイト側でクレジットカードの決済機能を開発するのは大変ですし、決済機能がどう実装されているのかわからない場合どうしようもないですよね。APIを使えば、中身がどうなっているかよくわからなくてもEクレジットカード会社が提供しているAPIへリクエストを送ることで、決済処理が行えるというわけです。
API Keyというのは、APIにアクセスするアプリケーションやユーザーを認証し、許可を与えるために使用される識別子の一種です。これが漏洩すると、無制限に使われてしまう(自分が使っているとサービス提供事業者に思われながら他の人に使われてしまう)パスワードのようなものだと考えていただければと思います。
また、このようなツールと組み合わせれられるものとしてGASがよく登場します。
Google Apps Scriptの頭文字をとったもので、Googleが提供するプログラミング言語およびプラットフォームのことです。
ChromeなどのアプリメニューからGoogle Sheetsを開いて、「拡張機能」>「Apps Script」を選択することで簡単に利用可能です。
簡単な使い方について以下の記事が参考になりました!
ローコードツール内だけでは柔軟性が乏しかったりするので、GASと組み合わせることで、様々な自動化を実現するという動きがトレンドのようですね。生成AIどれから手を付ければいいんだ……となっている方は、これらのローコードツールとGASを使えるようになっておけば、ある一定のことはできそうなので学ぶ価値がありそうです。
ここまで読んでいただきありがとうございました!詳しい方からしたら今更な内容かもですが、何かのお役に立てればとても嬉しいです!
気にいっていただけた方は、💖ボタンをタップしていただけましたら嬉しいです。
Difyについての記事
ブロックチェーン・仮想通貨関連の用語解説記事