とりあえずAIを挟んでみよう②<準備編Gemini>
前回の記事で
Chat GPTのAPI(Open AI社)を取得する方法を解説しました
zapierプロセスの修正を行いました
95巻ではRSSからの情報をOPEN AI(Chat GPT)に解析してもらってということで行っていたのですが 抽出が甘いのでGEMINIに変更してみましたところ一気に精度が上がりました。
しかし、これは95巻の訂正は行っておりません。というのはOPEN AIのAPIのほうが情報が多いのと、APIの取得が簡単なので KINDLE出版はITなどが苦手な先生方を対象にしておりますのでややこしくしないほうが良いのでは?と考えるからです。
2024年3月24日時点のOPEN AIとGEMINI(CHAT GPTとGEMINI)
AIのエンジンは日々更新されており、今日の勝者が明日も勝者ではないのであくまで本日時点の比較をAIに聞いてみました
あくまでZAPIERで使うという前提だと
OPEN AIのほうはChat GPT3.5と最新版ではないもの(4が最新)
GOOGLEの方もGemini Proと最新版ではないもの(ULTRAが最新)
との比較にになりますが
【OpenAI GPT-3.5とGemini Proは、どちらも最先端の言語モデルであり、それぞれに強みと弱みがあります。以下では、両モデルの能力差を詳細に比較します。
モデル規模とパラメータ数:
GPT-3.5: 1750億パラメータ
Gemini Pro: 2000億パラメータ
Gemini Proの方が約14%多くのパラメータを持ち、より複雑なタスクを実行できる可能性があります。
学習データ:
GPT-3.5: The Pileと呼ばれる、Web上からスクレイピングされたテキストとコードのデータセット
Gemini Pro: Google AIの内部データセットと、厳選された公開データセット
Gemini Proは、より質の高いデータセットで学習しており、正確性と信頼性が高い可能性があります。
タスク性能:
翻訳: 両モデルとも高い翻訳精度を誇りますが、Gemini Proの方が専門用語や文脈をより正確に翻訳できる傾向があります。
要約: Gemini Proは、より簡潔で読みやすい要約を生成することができます。
質問応答: 両モデルとも幅広い質問に答えられますが、Gemini Proの方が複雑な質問や曖昧な質問を理解し、より正確な回答を提供できる傾向があります。
創作: 両モデルとも詩、小説、コードなど様々な創作コンテンツを生成できますが、Gemini Proの方がより独創的で創造性のある作品を生み出すことができます。
その他の機能:
Gemini Proは、マルチモーダル処理機能を備えており、画像や音声などの情報をテキストと組み合わせて処理することができます。
Gemini Proは、Google AIの最新技術を組み込んでおり、より高速で効率的な処理を実現しています。
結論:
Gemini Proは、GPT-3.5よりも多くのパラメータ、高品質な学習データ、高度なタスク性能、マルチモーダル処理機能、最新の技術を備えており、総合的に優れた能力を持つと言えます。
ただし、以下の点に注意が必要です。
Gemini Proは、まだ開発段階であり、GPT-3.5よりも利用できる情報が少ない。
Gemini Proは、Google AIのサービスとして提供される予定であり、利用には制限がある可能性がある。
最終的にどちらのモデルが優れているかは、利用目的や状況によって異なります。
マルチモーダル対応なのでGeminiもトライしたい
上記の回答で注目はマルチモーダルです。Gemini Proではマルチモーダルとは、テキスト、音声、画像、動画などの複数の種類の情報を組み合わせることができるマルチモーダル対応なのでそちらも試してみたくなったのです
Gemini API
では実際にAPI KEYを取得してみましょう
①検索で「GEMINI API」と調べます。そしてウェブサイトにアクセスします
②「Get API Key in Google AI Studio」をクリックします
③ チェックボックにチェックを入れて<Continue>
④<Get API Key>をクリック
⑤<Create API key>をクリック
⑥<Create API key in new porject>をクリック
⑦KEYをコピーして保存しておきます
今日はここまで
またご意見などありましたら下のリンク先の下方に連絡先がございます