結局生成AIは何がいいのか。
乱立する生成AI
仕事で(文章)生成AIを使っているが、最近は色々なAIが乱立していて結局どれを使えばよいか分からない。
ということで、比較してみる。
AIモデルとプラットフォーム
ここでは、ChatGPTやPerplexityなど、AIが使える”場所”を「プラットフォーム」とし、そのプラットフォームがベースにしているもの「AIモデル」ということにする。
つまり「ChatGPTというプラットフォームはGPT-3.5やGPT-4をAIモデルで使用している」といった具合。
まずは最新のAIモデルは何があるか書き出してみる。
GPT-4
OpenAIが開発した最新のモデル。2023年に公開。マルチモーダル機能を持ち、テキストと画像の両方を処理できる
パラメータ数は公開されていないが、GPT-3(175B)を大幅に上回ると推測される
自然言語処理、コンピュータプログラミング、創作など幅広い分野で高い性能を発揮する
LLaMA 3.2
Meta AIが2024年9月に発表した最新のオープンソースモデルテキストと画像の両方に対応するマルチモーダルモデル
1B、3B、11B、90Bなど複数のサイズのモデルが提供されている
90Bモデルは画像認識においてGPT-4oやClaude 3 Haikuを上回る性能を示す
Gemini
GoogleがBARDの後継として開発した新しいモデルで、2023年末に発表テキスト、画像、音声、動画などを扱えるマルチモーダルモデル
Google検索と連携し、リアルタイムの情報にアクセス可能
Mixtral 8x7B
Mistral AIが2023年12月に公開したオープンソースモデル8つの7Bモデルを組み合わせた混合専門家(MoE)アーキテクチャを採用
65Bパラメータのモデルに匹敵する性能を持つ
LLM-jp-3 172B beta1
国立情報学研究所(NII)が2024年9月に公開したプレビュー版モデル約1720億(172B)パラメータを持つGPT-3級の大規模モデル
学習データを含めすべてオープンにしたモデルとしては世界最大規模
日本語処理に特化したモデル
これらのAIモデルが使えるプラットフォームは以下の通り。
GPT-4
ChatGPT Plus (OpenAIの有料サブスクリプションサービス)
OpenAI API (開発者向け)
Microsoft Copilot (旧Bing Chat)
Microsoft 365 Copilot (Microsoft Office製品群に統合)
ChatGPT (GPT-3.5)
ChatGPT (OpenAIの無料/有料Webサービス)
OpenAI API (開発者向け)
LLaMA 3
Meta AI (Metaの研究用プラットフォーム)
Hugging Face (オープンソースAIコミュニティ)
NLP Cloud API (商用利用可能なAPI)
Mixtral 8x7b
Mistral AI Platform (Mistral AIの開発者向けプラットフォーム)
Hugging Face (オープンソースAIコミュニティ)
NLP Cloud API (商用利用可能なAPI)
有名な生成AIとしてはChatGPT、Gemini、Copilotなどだが、ChatGPTとCopilotはGPTをベースとして作られており、GeminiはGoogleが独自のモデルを採用している(らしい)。ちなみにGeminiのAIモデルはGoogleが独自に作っていると主張してるが、何らかのAIモデルをベースにしているのは間違いないだろう。
それぞれの特徴と強み
ではそれぞれの特徴と強みを表にしてみる。
実体験からの感想
ChatGPT、Gemini、Perplexityをしばらく使っての感想としては、ChatGPTが使いやすいと感じる。
ふと疑問に感じたことを訊くときやプロジェクトとしてまとめ上げる仕事をするときなどは、今のところ高水準で出力を期待できる。プログラムを作成するときも、割とまともな答えを出してくれる。
無料版であっても数回はGPT-4で回答するのでライトユーザーにはいいかもしれない。
Geminiに関しては特定のサイトについての調査や、要点をまとめてくれるのには役立つが、肝心の文章作成が上手くいかないことが多い印象。
Perplexityに関しては今pro版を使っているが、色々のことができる印象。ただ、逆言えばそこがデメリット。
pro版ではPerplexity内のAIモデルとして、GPT-4oやClaude 3.5 Sonnetなど様々なモデルが選択できるが、ChatGPTのGPT-4と比べても文章の質がやや劣っているように感じる。
これは多分最適化されてないからではないと推測している。
また、1つの回答に対して画像を生成する機能やいくつかのスレッドをまとめる機能があるものの、大して使用しないものが多い。
求めているものは、より正確でディープな情報とより自然な日本語の回答なので、機能面で優れていても…というのが正直な感想。
まとめ
他のAIモデルやプラットフォームも使って、どれが良いかもう少し考える。
この記事が気に入ったらサポートをしてみませんか?