Claud3(クロード3)は Chat-GPT4を超えた,は本当か?[Chat-GPT以外の生成AI①]
最近、「Chat-GPT以外にも色々と生成AIが登場していますが、Chat-GPTよりいいものってあるのですか?」という質問をよく受けます。
先日の記事でも、日本製の大規模言語モデル(LLM)について紹介しました。
そこで、最近評判になっている、Chat-GPT以外の生成AI、その中でも、文章を書いたり、要約したりといった、言葉を扱う生成AI(言語モデル)について書いていこうと思います。
第1回は、「Chat-GPT4を超えたのではないか」と評判になっている「Claude3」(クロード3)です。
Claude3とは
Claude3とはアメリカのAnthropic(アンソロピック)社が提供している大規模言語モデル(LLM)です。Anthropicという会社は、日本ではそれほど有名ではありませんが、2021年にOpenAI社にいた、Dario Amodei氏とDaniela Amodei氏によって設立されました。
このAnthropicが開発したのがClaude3です。元OpenAIの人が開発した言語モデルですので、Chat-GPTの親戚のようなものです。
このClaude3、様々なテストでChat-GPT4を上回ったと評判になりました。
Claude3有料版を3カ月、毎日使ってみた
Claude3には、Opus、Sonnet、Haikuという3つのモデルがあり、一番高性能なのはOpus。これがChat-GPT4を超えていると評判になっています。
ちなみに、この手の、Chat-GPTを上回るという評価シート、よくみかけますが、結構あてになりません(笑)。実際に使ってみると、これがChat-GPT4を超えてるってことないでしょ?というのがほとんどです。
このClaude3のOpusは有料で、Chat-GPT Plus同様に、Pro Planに登録して月額20ドル払う必要がありますが、僕はとりあえず使ってみないと気が済まないので、3月にリリースされてから約3カ月間、Opusを毎日使っています。
先に述べたように、ベンチマークスコアはあてにならないので、実際毎日のように使ってみての、僕の感想をお話ししたいと思います。
Claude3はChat-GPT4を超えているか?
結論から言いますと、文章を生成したり、要約したり、といったことに関しては、現時点において、Claude3のOpusはChat-GPT4を超えていると、僕は思っています。
なぜそう思うのか?ですが、僕の感覚的な評価のため、何ともうまく説明できないため、以下の比較例をお見せします。
Claude3 VS Chat-GPT4①文章要約
2つ、例をあげてみます。
文章の要約の例
Claude3とChat-GPT4は、ともにファイルをアップロードして、そのファイルに書かれていることに関して質問ができます。
最近話題になっている、「2024年4月からライドシェア解禁」というニュース記事を読ませて、「このファイルに書かれていることを説明して」とお願いしてみましょう。
ちなみに記事はこのようなものです。
Claude3の回答
このファイルは、2024年4月から日本で限定的に解禁される予定の「ライドシェア」について、以下の内容を詳しく説明しています。
1.ライドシェアの概要
一般ドライバーが自家用車を使って有料で顧客を運ぶサービス
「配車型」(近くの一般車が利用者を迎えに来る)と「カープール型」(ドライバーと同じ目的地に行く人を乗せる)の2種類がある
2.日本におけるライドシェアの状況
これまでは道路運送法で自家用車の有償運送は禁止されていた
タクシーやバスの運転手不足を背景に限定解禁される
当面はタクシー会社の管理下で、車両不足が深刻な地域・時間帯のみでの運用
3.海外でのライドシェアの普及状況
TNC型(プラットフォーマーが運行管理)とPHV型(国がドライバーに車両・運行管理を義務付け)の2つのタイプがある
アメリカ、イギリス、オーストラリアなどで導入され、タクシーより高い評価を得ている
4.日本の一部地域での先行導入事例
兵庫県養父市や京都府京丹後市などで導入され、過疎地の移動手段として機能している
5.本格解禁に向けての課題
安全性の確保や事故時の補償など、未解決の問題がある
6.ライドシェアの将来性
シェアリングエコノミー市場が拡大する中、ライドシェアも新たな移動手段として市場が拡大する可能性がある
以上が、このファイルの主な内容をわかりやすくまとめたものです。ライドシェアの概要、日本と海外の状況、課題や将来性について、ポイントを絞って説明しています。
Chat-GPT4の回答
ファイルには、「ライドシェア」の2024年4月の限定解禁に関する詳細が記載されています。ライドシェアとは、個人が自家用車を使用して有料で他人を運ぶサービスで、これまで日本では法律により基本的に禁止されていましたが、運転手の不足を背景に一定の条件下で解禁されることになりました。
サービスは「配車型」と「カープール型」の2種類があり、配車型はタクシーのように利用者のもとへ車が来るサービス、カープール型はドライバーが目的地に向かう途中で他の乗客を拾い、費用を共有するスタイルです。
日本国内での導入には、特に地方や観光地でのタクシー不足を解消する目的があり、政府はこれを都市部や観光地での交通網強化の手段と見ています。ただし、全面解禁には安全性や補償の問題が残り、これらがクリアされ次第、より広範な導入が進む可能性があります。
また、国際的にはライドシェアはすでに多くの国で普及しており、アメリカやヨーロッパでは異なる形式で広がっています。この動向が日本国内の政策や市場の発展にどう影響するかが今後の大きな焦点となっています。
どちらも要約はできていますが、僕には、箇条書きを織り交ぜて、簡潔に重要なポイントを説明している、Claude3の説明の方が読みやすいと感じます。いかがでしょうか。
Claude3 VS Chat-GPT4②マンガの概要を問う
では、もう1つ比較してみましょう。僕が良く使う例です(笑)。
「ドラゴンボールについて教えてください。」
Claude3の回答
ドラゴンボールは、鳥山明による日本の人気漫画およびアニメシリーズです。1984年から1995年まで週刊少年ジャンプで連載され、世界中で大ヒットしました。主な登場人物と物語は以下の通りです。
孫悟空(サイヤ人の戦士で、物語の主人公)
ブルマ(冒険家の少女で、ドラゴンボールを探している)
亀仙人(武道の達人で、悟空の師匠)
クリリン(悟空のライバルであり親友)
ピッコロ(当初は敵だったが、後に悟空の味方になる)
ベジータ(サイヤ人の王子で、当初は悟空のライバルだったが、後に仲間になる)
物語は、孫悟空とブルマがドラゴンボールを集める冒険から始まります。ドラゴンボールは7つ集めると、神龍を呼び出し、どんな願いでも叶えてくれるという秘宝です。悟空は旅の途中で、さまざまな敵と戦いながら、強くなっていきます。
物語が進むにつれ、悟空は地球を脅かす強敵たちと戦います。フリーザ、セル、魔人ブウなどが主な敵キャラクターです。悟空は仲間たちと共に、これらの敵に立ち向かい、地球を守ります。
ドラゴンボールは、友情、努力、強さをテーマにした作品で、日本のみならず世界中で愛されています。アニメシリーズは、原作漫画の完結後も続編が制作され、現在も人気を維持しています。
Chat-GPT4の回答
『ドラゴンボール』は、鳥山明によって創作された日本の漫画であり、アニメ化もされています。この作品は1984年から1995年まで「週刊少年ジャンプ」で連載され、非常に高い人気を誇りました。物語は、孫悟空という名前の少年がドラゴンボールと呼ばれる7つの魔球を探し集める冒険を描いています。これらの球を集めると、龍が現れてどんな願いも一つだけ叶えてくれると言われています。
孫悟空は、非常に強い戦闘力を持ち、数々の強敵と戦いながら成長していきます。彼の旅は、友達を作り、武道大会で戦い、宇宙の平和を守るために悪役と戦うことにもつながります。『ドラゴンボール』は、その後の『ドラゴンボールZ』『ドラゴンボールGT』『ドラゴンボール超(スーパー)』といった続編に発展し、各シリーズで悟空や彼の仲間たちの新たな戦いや冒険が展開されます。
この作品は、独特のキャラクターデザイン、戦闘シーンのスタイル、そして心温まるストーリーで国際的にも広く認知され、多くのファンを持っています。また、漫画やアニメだけでなく、映画、ゲーム、各種グッズなど幅広いメディア展開がされていることも特徴です。
いかがでしょうか?
なぜマンガ・アニメについて問うのか
そもそも、僕がなぜこの「ドラゴンボール」について聞くかというと、大概の大規模言語モデルは、日本のアニメに詳しくないため、往々にして作り話をする、いわゆる、ハルシネーションを起こしやすいからです。
「孫悟空は、強くなり、やがて宇宙を制覇するようになった」といった、無茶苦茶な話をでっちあげる言語モデルが過去にありました(笑)。
その点、Claude3もChat-GPT4もハルシネーションを起こしていませんね。これだけでも、両者とも、すごいのですが、比べてみると、Claude3の説明の方が、丁寧でわかりやすいと思いませんか?
感想①Claude3の方が言語能力は高い
僕はChat-GPT4とClaude3の両方を使い、2つのことを感じています。まず、Claude3の方が言語能力は高い。
Claude3は、何か質問するとその回答や説明がとても丁寧でわかりやすい。一方、Chat-GPT4は簡潔に正しく答えるけど、いまいち「気分が伝わってこない」。
そういう意味では、Claude3の方がChat-GPT4よりも、言語能力は上ではないかと、僕は感じてしまいます。
感想②Claude3のほうが「人っぽい」
もう1つ、大きな違いがあります。それは、どことなくですが、Chat-GPT4は「AIっぽい」のですよね(笑)。
どこが?と聞かれると困るのですが、Chat-GPT4は、すごく正確に回答してきます。とても論理的で簡潔。でも、人と話をしていて、こういう回答はしないよな、という感じが時々するのです。人って、普段会話しているとき、ここまで正確性、論理性、をもって話さないですよね?
その点、Claude3の方が、人っぽいのです。文章がとても洗練されていて、わかりやすいし、適度にくだけている。あと、とても説明が丁寧で、適度に長い。
ですので、文章を要約したり、何かを説明したり、文章の下書きなどを書いてもらう場合、僕は、Claude3をよく使うようになりました。
総合力ではChat-GPT4が優る
では、Claude3は、総合力においてもChat-GPT4より優れているか?と聞かれたら、僕はこう答えます。
「文章を扱う能力は超えているけど、総合力ではChat-GPT4の方が上」
生成AIは文章を作成するだけでなく、色々な用途で使われています。
例えば、
発話する、音声で会話する
画像を認識する
画像生成する
特に、画像を生成する能力は、Chat-GPT4はDALL-E 3という画像生成機能を有していて、かつ、画像を対話しながら作ることができます。
加えて、Chat-GPT4には、GTPsという機能があります。そこには、
Web Browsing
Code Interpreter
という2つの機能があります。
「Web Browsing」を使えば、インターネットの最新情報を取ってこれますし、「Code Interpreter」を使えば、pythonというプログラミング技術を用いることで、データ分析したり、グラフが作れたりできます。
ということで、総合力としては、Chat-GPT4の方が上なのです。
そういうわけで、僕は両方使っています。自作のGTPsを使いたい時は、Chat-GPT4、画像生成もChat-GPT4を使いますが、文書作成には、Claude3を使うようになりました。
加えて、Chat-GPT4は、入力が12.8万トークンまでですが、Claude3は20万トークン。大容量ファイルに関して質問する場合は、Claude3の方が絶対に便利です。Chat-GPT4だと読込み中に停止することが多々あります。
AIを無料で試すならClaude3
でも、「画像?作らないなぁ」「データ分析はしないよ」といった、ただチャットをするだけに、生成AIを使いたいなら、僕は、Claude3を現時点でお勧めします。
しかも、無料版のClaude3の「Sonnet」はChat-GPT3.5より言語能力は高いので、チャットだけいいよ、かつ、無料がいいな、という方には、Claude3をお勧めします。最近モバイルアプリも登場しましたしね。
Claude3という、一部機能において、Chat-GPT4を超える言語モデルが登場したことは衝撃的なことです。つい最近まで、Chat-GPT4の独壇場でしたからね。
Claude3以外にも最近言語モデルが多く登場しており、それぞれ個性的で面白いので、次回、また別の言語モデルについて説明します。