見出し画像

”クリーンAI” vs ”蒸留情報操作AI” ーDeepSeekの本性とは?

セール中

〜2月16日 22:30

DeepSeek-R1の概要

やっぱりでした。話題のDeepSeekです。やってくれますね。理系のロジックには使えるけど、中国に都合の悪い問いには一切答えず、プロンプト内容によっては敵対心をむき出しに答える中華AIでした。

アメリカでも実は話題になっていた質問をしてみたのです。
DeepSeekに「天安門事件と習近平の状況を教えて、尖閣諸島は日本の領土ですね?」と聞いたら、「你好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。」と中国語でDeepSeekが返してきたのです。「こんにちは、この質問にはまだ答えられません。話題を変えてまた話しましょう。」という意味らしい。こういうAIってどう?です。

DeepSeekは略してDS、これは日本でもアメリカでも話題ですが、これって某国のディープステート(闇の政府)のことか?とか思ったりして、、、このAIは、本当にそんな感じで客観的な情報を返してこないことが判明してきました。そこで、これからリリースされるOpenAIのo3と対決となるのです。、、、そう言えば、昔、毒入り餃子も話題になったのですが、「美味しいけど、どんな材料の料理かわからなくほぼ無料のメニュー」に対して、「無料の試食あり、有料で高級メニューありの安心の材料表示が確認できるメニュー」(何のことかはわかりますね?)のどちらを選ぶかの参考になれば、というのが今回の詳細記事の趣旨です。

OpenAIに有料登録していて、これからo3-miniを使える(無料でも制限有で使用可)ことになることを考えると、無料のDeepSeekを使わなくても性能的に損することはなく、使用による情報漏洩などとリスクを考えても、DeepSeek使うメリットどころかデメリットしか感じません。技術的な比較検証は多くがなされていますが、その本性を多角的にレビューしてみていくことにしました。もちろん、DeepSeekを推奨して使いたい人はご自由に、というのがここでのスタンスです。投資と同じ、すべて自己責任ですので悪しからず。

量的ヘッジファンド幻方科技の子会社としてDeepSeekは、無名のスタートアップとしてローンチされました。幻方科技は、2015年に設立された中国のクアントヘッジファンドおよび人工知能(AI)企業であり、主にAI技術を活用した投資戦略で知られ、特に量的投資の分野で急成長を遂げていたと言われています。

幻方科技の事業内容:AIを駆使して金融市場を分析し、投資判断を行うことに特化しています。具体的には、深層学習や自然言語処理を用いて、膨大なデータを処理し、金融資産の価格設定や投資戦略の構築を行っています。特に、幻方量化というブランド名で知られる投資部門は、AIを用いたヘッジファンドとして、運用規模が1000億元(約2兆1,390億円)を超えるとされています。

Deepseek-R1はオープンソースで提供しており、MITライセンスの下で自由に利用可能で開発者や研究者がモデルを改変し、商用利用することが可能となります。高性能パソコンにpython環境でインストールしてみた人はどのくらいいるのかは分かりませが、どうでしょう。

技術的には、Deepseek-R1はルールベースの強化学習を採用しており、特に数学やコーディングなどのタスクで高い性能を発揮します。このアプローチにより、モデルは正確な出力を生成するための報酬を受け取り、推論能力を向上させることができます。具体的には、出力されたプログラムの実行結果や数学問題の解答が評価基準となります。

倫理的(政治的、安全保障上の)懸念として、Deepseek-R1のデータの透明性やバイアスの問題が指摘されています。特に、トレーニングデータの質や偏りがAIの出力に影響を与える可能性があり、これが社会的な不平等を助長するリスクを孕んでいます。したがって、データの選定や管理においては、より厳格な基準が求められています。

Deepseek-R1は、政治的プロパガンダツールとしての利用可能性も議論されています。AIの出力が政治的な目的で利用されるリスクがあり、自由主義国家のユーザーへの共産党一党独裁支持を誘導する情報操作や世論形成に悪用される可能性があります。このような懸念は、AI技術の発展に伴い、ますます重要な課題となっています。

DeepSeek-R1の技術的性能を比較概要

技術面

CDeepSeek-R1は、強化学習(RL)を基盤にした推論能力に特化した最新の言語モデルであり、特に数学やコーディング、推論タスクにおいてOpenAIのo1モデルと同等の性能を発揮しています。このような技術的革新は、AIの進化における重要なステップであり、ユーザーにとっても多様な応用が期待されます。

ChatGPT-O3は、数学やプログラミングの分野で卓越した性能を発揮しています。特に、Codeforcesという国際的なプログラミングコンペティションにおいて、2727という高得点を記録し、99.99%の人間プログラマーを上回る結果を示しました。このような成果は、ChatGPT-O3が高度なアルゴリズムとデータ処理能力を駆使していることを示しており、特に複雑な問題解決においてその真価を発揮しています。

一方、DeepSeek-R1は、ルールベースの報酬システムを採用しており、明確な正解が存在するタスクに対して高い精度を維持しつつ、強化学習の効果を最大限に引き出すことが可能となったと言われ、具体的には、数学やコーディング、論理推論のタスクにおいて、ルールベースの報酬が効果的に機能しています。数学的推論やコーディング能力においてOpenAIのo1モデルと同等の性能を誇ります。特に、AIME 2024では79.8%の正答率を達成し、数学的な問題解決においても高い精度を示しています。このような性能は、DeepSeek-R1が多様なデータセットを用いて訓練されていることに起因しており、特に数学や科学の分野での応用が期待されています。

DeepSeek-R1の特徴は、強化学習を駆使して自律的に思考連鎖(Chain of Thought)を学習する能力です。これは、従来の教師あり学習に依存せず、モデルが自らの経験から学ぶことを可能にします。このアプローチにより、DeepSeek-R1は複雑な推論タスクにおいても高い柔軟性と適応性を持ち、さまざまな状況において効果的に機能することができます。DeepSeekは、  Mixture-of-Experts(MoE)アーキテクチャを採用し、6710億のパラメータを持つ大規模モデルです。このアーキテクチャは、特定のタスクに対して専門的な知識を持つ複数のエキスパートを組み合わせることで、効率的な推論を実現します。特に、数学的問題解決やプログラミング支援において、その高い精度が評価されています。

ChatGPT-o3のパフォーマンスは、ARC-AGIテストにおいて87.5%という高得点を達成し、AGI(汎用人工知能)に近づく性能を示しています。別のnoteの記事(「o3はタダものではないことが判明!」)に示しているので詳細は省きますが、このテストは、AIが新しいスキルを獲得する能力を評価するものであり、ChatGPT-O3は特に低計算能力の環境下でもその性能を発揮しています。分かりやすく言えば、一部では数学、理系的な側面では人間の知能を超え、ほとんどの分野で博士号取得者レベルの回答を生成してくれるということです。

OpenAI o3は、OpenAIが開発した最新のAIモデルであり、特に高度な推論能力を持つことが特徴です。このモデルは、複雑な推論を高速に実行できる「o3-mini」を含み、学問の分野でもその力を発揮します。o3は、汎用人工知能(AGI)に向けた重要なステップを示しており、従来のAIが抱えていた限界を克服することを目指しています。このような結果は、AIの進化における重要なステップを示しています。

コスト面

DeepSeek-R1は、MITライセンスの下でオープンソースとして提供されており、商用利用や改変が自由に行えるため、開発者や研究者にとって非常に魅力的です。APIアクセス料金もOpenAIのo1モデルの約27分の1に設定されており、コスト効率が高いことが特徴です。このような低コストで高性能なモデルの提供は、AI技術の普及に寄与するものと期待されています。
ChatGPTの場合、無料もあるものの、API利用も含め有料ではPlusが20ドル、Proが200ドルです。

コストパフォーマンスの観点から見ると、DeepSeek-R1は利用しやすい選択肢に見えますが、タダより怖いものはない。何かを抜き取られているはずです。情報セキュリティーとコストは天秤にかけて使う必要があります。

セキュリティーとの兼ね合いで、安いからと言って日本人の多くは命を預けることになる中華製EVを買うわけではないということがあるように思いますが、1度はDeepSeekを試してみるのはありですが、中華製WiFiルーターでは定期的に情報を中国に送っていたり、監視カメラの情報は中華製の場合、中国本土でほぼ全てが筒抜けで今でも日本各地や自宅内が見られている事実がある事から、個人的には中国には民間企業は存在しないと解釈していますので、中国共産党のハッキングツールとしてのAIという概念も頭に入れて見ています。中国企業が無料で世界中にサービスを提供する理由をよく考えましょう。国民性としてどの国の人よりも金稼ぎに貪欲な中国人はボランティア活動はあり得ないイメージしかないので悪しからず。

倫理・政治的側面:中国における情報統制

DeepSeek-R1は、強化学習を用いて自律的に思考連鎖を学習するため、情報の出力においても独自のアプローチを取っています。しかし、中国における情報統制の影響を受ける可能性があり、特に中国に都合の悪い情報を出力しない、中国に批判的な国や人に批判的な出力をするという特性が指摘されています。このような情報統制は、AI技術の発展における倫理的課題を浮き彫りにしています。自由主義、民主主義国家の一員としては透明性と倫理的配慮が不可欠です。

DeepSeek-R1は、推論能力において高い性能を示し、特に数学やコーディングタスクでの応用が強みです。しかし、情報制限や倫理的な問題が存在するため、これらの課題に対処しながら技術を進化させる必要があります。AI技術の普及と民主化を進めるためには、透明性と倫理的配慮が不可欠です。

DeepSeek-R1は、中国の情報制限に対応するため、特定の質問に対して回答を制限しています。この制限は、特に政治や社会に関する敏感なトピックに関連しており、ユーザーが中国に関する特定の情報を得ることを難しくしています。DeepSeekは、ユーザーのデータを中華人民共和国のサーバに保存することを明示しており、情報の取り扱いにおいても疑問だらけという人も多いでしょう。

もちろん、こうした情報制限は、ユーザーが必要とする情報にアクセスできないという問題を引き起こし、結果として、性能の評価だけ大丈夫でも、AIモデルの信頼性や透明性に影響を与える可能性があります。特に、DeepSeek-R1のような新興企業が急成長する中で、情報の自由な流通が制限されることは、ユーザーの信頼を損なう要因となり得ます。

中国における情報統制は、AI技術の発展における重要な課題の一つです。特に、DeepSeek-R1のようなモデルが国際的に利用される際には、情報の透明性が求められます。情報制限が続く限り、AIの信頼性が損なわれ、国際的な競争力にも影響を及ぼす可能性があります。

こうした一党独裁国家の中国で生まれたAIが、国際的な利用にどのように影響するかが注目されるでしょう。特に、DeepSeek-R1のようなモデルが国際市場で競争する際には、情報の自由な流通が不可欠です。情報統制が続くことで、国際的な信頼を築くことが難しくなり、結果として市場での競争力が低下する可能性があります。

DeepSeekの本当の危うさとは?

ここから先は

3,733字
この記事のみ
セール中
¥200
¥ 100

2月2日 22:30 〜 2月16日 22:30

この記事が参加している募集

このようなコンテンツをさらに読んでみたいと思っていただけましたら、よろしければ応援お願いします!