見出し画像

GPT4 より性能がいいオープンソースのモデルについて

少し前までは Open AI の GPT4 が支配してた感じがする LLM 界隈も、状況が完全に変わって様々な LLM が跳梁跋扈する戦国時代になっています。

ここではその中でもオープンソースの LLM をメインにして解説してみます


GPT4 よりいいと言われているモデル

以下は GPT4 より性能がいいと言われているモデルです(指標によっては同等以上ということです、GPT4 のバージョンによっても差異がでます)

  • command-r+:Cohere社が提供する LLM モデル。現状の Hugging Face Chat のデフォルトモデル

  • llama-3-70b(以上): Meta が提供している無料の LLM モデル

  • reka-core: Reka社の LLM モデル、マルチモーダル(画像、動画などなど)に強み

GPT3.5 turbo 以上のモデル

  • mixtral-8x22b:よく LLM 改造用に利用されるフランス製、Mistral社の LLM

  • dbrx-instruct: Databricks 社が提供する LLM モデル

オープンソースではないものの GPT4 以上のモデル

Claude 3 Opus: 最近注目されている Anthropic 社のモデル
Gemini Ultra: Google の LLM モデル

どこで試すのがいいのか?

LLM を試せるサービスはかなり大量にあるのですが、参考用に数例出してみます。

DuckDuckGo AI Chat

DuckDuckGoでは GPT-3.5 turbo と Claude Haiku の両方使えます。

UI がなかなかいい感じ。速度も他と比較すると速い印象。

Hugging Face Chat

現在のデフォルトはCohereForAI/c4ai-command-r-plusですが、Llama、Mistral その他色々なモデルが使えます。

公式サイト

公式系のサイト

  • ChatGPT: GPT-3.5 が使えます

  • Bing: GPT-4 + DALL-E-3 が使えます

  • Gemini: Gemini が使えます

  • Anthorpic: Claude3-Sonnet が使えます

LLM とどう向き合うべきか?

正直 現状では ChatGPT の 3.5(or 4.0)より良いモデルを無料で利用できるサービスも多いので、今更 ChatGPT にのみ依存するのはどうかなという印象。

特に ChatGPT3.5 を今更使ってもなあという感じ。 例えば画像、動画、PDF のアップデートといった機能も無料でできるサービスもかなり増えましたし GPT4 の優位性はもうあまりない感じがします。

ただ注意点としては性能が良くても余り日本語に対応していないような LLM も結構あるのでそこら辺は注意が必要です、あと LLM といっても得意分野が結構違うケースがあるのでどういったタスクが必要になるのか見極めたうえで LLM を選択するというのも重要になります。

結局のところ様々な LLM の調査と実験をして臨機応変に対応するのがいいと思います。

あと後発の LLM はやはり Open AI より結構値段が安いという点も特徴的ですね。

この記事が気に入ったらサポートをしてみませんか?