見出し画像

Mistral Small 3 を試す

tl;dr

  • Mistral Small 3 について簡単にまとめたよ

  • Ollama で動かしてみたよ

ささっと行きます、記事のうち重要だと思うところだけピックすると

  • Mistral Small 3 のパラメータ数は 24B

  • Base モデルと Instruct モデルが公開

  • モデルは Apache 2.0 ライセンスで公開

  • Llama 3.3 70B や Qwen 32B、GPT-4o mini と同程度の性能

  • 人手評価や多言語 MMLU など網羅的に評価

  • 同じ GPU で Llama 3.3 70B の三倍の速度(150 tps とあるが最大?)

  • Hugging Face、Ollama、Kaggle、Together AI、Fireworks AI で使える

  • 今後 NVIDIA NIM、Amazon SageMaker、Groq、Databricks、Snowflake で使えるようになる

追記

NVIDIA NIM や Amazon SageMaker にも来ていました!

Ollama で試す

対応がはやいですね。とりあえず動かしてみましょう。まずはモデルをダウンロードします。

ollama pull mistral-small:24b

私の環境(Mac Studio)ではおおよそ 10 分程度でダウンロードが完了しました。

ollama run mistral-small:24b --verbose "OpenAI と Anthropic の違いについて教えてください。"

❯ ollama run mistral-small:24b --verbose "OpenAI と Anthropic の違いについて教えてください。"
OpenAI と Anthropic は、どちらも人工知能(AI)分野で活動している企業ですが、それぞれの目標、アプローチ、および背景にはいくつかの違いがあります。

### OpenAI
**設立:** 2015年
**創設者:** サム・アルトマン(Sam Altman)、イーロン・マスク(Elon Musk)など
**ミッション:** 「安全な人工知能を普及させ、人間の利益に寄与する」こと。
**主要活動:**
- **研究開発:** 大規模言語モデルや他のAI技術の開発。
- **商業化:** ChatGPT などの消費者向け製品を提供。
- **安全性と倫理:** AIの安全性と倫理的な使用に重点を置いている。

### Anthropic
**設立:** 2021年
**創設者:** ダリオ・アモデイ(Dario Amodei)、トム・ブラウンズン(Tom Brown)など
**ミッション:** 「信頼性の高いAIシステムを構築し、人間にとって有益なものを作る」こと。
**主要活動:**
- **研究開発:** 安全で信頼性の高いAIモデルの開発。
- **透明性:** AIの動作と行動を理解しやすくするための取り組み。
- **倫理と安全性:** AIの利用に関する倫理的な問題と安全性に重点を置いている。

### 主要な違い
1. **設立時期と経歴:**
- OpenAI は 2015 年に設立され、長年の研究と開発を行ってきた。
- Anthropic は 2021 年に設立され、比較的新しい企業である。

2. **創設者のバックグラウンド:**
- OpenAI の創設者にはイーロン・マスクやサム・アルトマンなど、テクノロジーとビジネスの分野で有名な人物が含まれる。

- Anthropic の創設者は AI研究者であり、特に安全性と倫理に関する専門知識を持っている。

3. **アプローチ:**
- OpenAI は広範なAI技術の開発に重点を置いており、消費者向け製品や業界内での影響力も大きい。
- Anthropic は特に安全性と信頼性の高いAIシステムの開発に焦点を当てている。

4. **目標:**
- OpenAI の目標は広範なAI技術の普及とその利用の促進である。
- Anthropic の目標は、安全で信頼性の高いAIシステムを構築し、人間にとって有益なものを作ることである。

これらの違いは、それぞれの企業がどのようにAI分野に貢献しているか、そして将来的にどのような影響力を持つかに影響を与えています。

total duration: 20.387872459s
load duration: 17.793792ms
prompt eval count: 16 token(s)
prompt eval duration: 511ms
prompt eval rate: 31.31 tokens/s
eval count: 720 token(s)
eval duration: 19.858s
eval rate: 36.26 tokens/s

なぜかトム・ブラウンがトム・ブラウンズンになっていますが、他に不自然な間違いはなさそうです。24B にしてはかなり日本語の流暢さがあがっているように感じます。

もうひとつ聞いてみます。

ollama run mistral-small:24b --verbose "核融合発電について教えてください。"

❯ ollama run mistral-small:24b --verbose "核融合発電について教えてください。"
核融合発電は、原子核が融合してエネルギーを放出するプロセスを利用した発電方式です。これは太陽や恒星で起こっている自然現象に似ています。主な特徴と利点、そして現在の研究状況について説明します。

### 特徴と利点
1. **無限のエネルギー源**: 核融合反応は非常に多くのエネルジーリソースを提供できます。特に水素同位体である重水素(ドイトリウム)と三重水素(トリチウム)が使用され、これらは地球上で豊富に存在します。

2. **低リスク**: 核融合反応はチェーン反応を起こさないため、原子炉事故や放射性廃棄物の問題が少ないと考えられています。さらに、反応が制御されやすく、安全な操作が可能です。

3. **低排出**: 核融合発電は二酸化炭素(CO₂)をほとんど放出しませんので、環境への負荷が少ないとされています。

### 主な研究プロジェクト
1. **ITER(国際熱核融合実験装置)**:
- ITERはフランス南部のカダラクに建設中であり、世界各国が共同で進める大規模な核融合実験施設です。目標は、2025年にプラズマを点火し、2035年には持続的なエネルギー出力を達成することです。

2. **トカマック**: これは核融合プラズマを閉じた磁場で封じ込める装置の一つで、ITERもトカマック型の反応炉です。このタイプは高温プラズマを安定して維持するための技術が必要です。

3. **スタレラーター**: これは磁場なしでプラズマを閉じ込める方法で、現在も研究が進行中です。ただし、技術的な課題が多く、実用化には時間がかかりそうです。

### 技術的な課題
1. **プラズマの安定維持**: 高温高密度のプラズマを長時間にわたって安定して維持するのは非常に難しいです。磁場の設計やコントロールが重要です。

2. **エネルギー収支**: 現在では、核融合反応で得られるエネルギーよりも多くのエネルギーを消費してしまう状態が続いています。これが解決されることで、実用的な発電装置が可能になります。

3. **材料問題**: 高温プラズマに耐える材料開発が必要です。これにより反応炉の寿命や効率が向上します。

核融合発電はまだ実用化には程遠いですが、その可能性と利点から多くの国が研究を進めている重要なエネルギー源です。将来的には、持続可能で低炭素のエネルギー源として大きな期待がかけられています。

total duration: 22.7436095s
load duration: 554.23225ms
prompt eval count: 15 token(s)
prompt eval duration: 496ms
prompt eval rate: 30.24 tokens/s
eval count: 784 token(s)
eval duration: 21.691s
eval rate: 36.14 tokens/s

ドイトリウムやスタレラーター他、想像以上に間違えました。ただ、間違え方をよく見るとすべてカタカナの間違いで、これは非漢字圏のモデルであればどれも難しいものかなとは思います。

以上です。

自著

いいなと思ったら応援しよう!