見出し画像

AI業界の大転換:オープン・ソースとオープン・アーキテクチャの全貌

 オープン・ソースとは、プログラムのソースコードが誰でも見ることができ、変更したり、再配布したりすることが可能な状態になっているソフトウェアの開発、利用形態のことです。
 
 一方、オープン・アーキテクチャとは、コンピューターシステムの設計に関する情報が公開されている状態を指します。これにより、他の人々や会社がそのシステムと互換性のあるソフトウェアやハードウェアを開発することが容易になります。
 
 日本の先駆的なオープン・アーキテクチャ・プロジェクトとしては、1984年から坂村健教授がプロジェクトリーダーとして取り組んだTRONプロジェクトを挙げることができます。 

 オープン・ソースオープン・アーキテクチャの中には有料のものもありますが、その大半が無料で公開してあり、コンピュータを有効活用したり、新しいソフトウェアの開発期間を短縮したり、多くの開発者がチェックすることで、バグなどの問題点を発見し易い特徴があります。

 これらの概念は、共有とコラボレーションを通じて技術が進歩するという考え方に基づいています。そして、その結果、我々はより多くの選択肢を持ち、より良いソフトウェアやシステムを利用することができます。

 個人でオープン開発をしている人の大半は、誰からも給料をもらうことなく、自らのスキルアップやキャリアアップを目的にプロジェクトに参加しています。中にはプログラムを作ることが好きで、趣味で参加している人もいますが、このような無償でプログラムの製造という労働を提供している人々は、Wikipediaに貴重な情報をアップロードしている人たちがいるのに似ていると言えるかもしれません。

 世の中にはプログラマーになってヒット商品を出してIT成金になることを目指す人は多いですが、金儲けよりもプログラムを開発することそのものに対する関心が高い人や、自分が作ったシステムが世の中の役に立つことに満足感を見出す人も少なくありません。

 近年話題となっているNLPやLLMと呼ばれている自然言語処理AIの大半は、元々、企業だけでなく大学や個人を含む世界中の技術者がオープン・ソースやオープン・アーキテクチャで開発してきたAIをベースとして開発されています。

 オープン・ソースやオープン・アーキテクチャ手法は、AIやアプリケーションに限らず、OSの世界でも主流となっており、そのOSの代表的なものに、UNIXに類似したLinuxがあります。Linuxは様々なコンピュータOSの中核をなしていて、Linuxにはフォークと呼ばれる派生版が多数存在しています。Linuxのフォークで最も有名なのはUbuntuで、その他にもDebianFedoraも有名です。
 
 Red Hat社が開発したCentOSは、有償版の企業向け(Red Hat Enterprise Linux:RHEL)の無償版であり、多くの企業や個人が安定したサーバー用のLinux系OSとして普及していました。ところが、Red HatがCentOS 8のサポートを2021年12月に中止してしまったので、多くのデータセンターが、有償版のRHELに移行するか、その他のOracle Linux 8や、RockyLinuxや、AlmaLinuxに乗り換えるか、そのままCentOSを使い続けるかで、混乱していました。これらのRHEL系Linuxはどれも互換性があるので、ユーザが気にしているのは、セキュリティ対策を含めたユーザ・サポートがどうなるかという問題が中心です。

 セキュリティ対策会社は多数あるので、CentOSを使い続けることにした企業も少なくありませんが、OSにとって一番重要なのはバグの修正とセキュリティ対応です。そのため、セキュリティ対策とサポート体制がしっかりしているOSに移行する企業も多いです。

 オープン・ソースとオープン・アーキテクチャは、開発者の視点からすると新しい技術を学び、自身のスキルを向上させる絶好の機会です。また、ビジネスの視点からすると、開発コストを下げ、製品の質を上げ、競争力を保つための重要な手段です。このような利点から、これらの概念はAI開発の主流となり、さまざまな産業や製品に対して大きな影響を与えています。
 
 Linuxをベースに作られているOSは、サーバーやパソコンだけでなく、スーパーコンピューターや、スマートフォン用OSの中核となっていることも多いです。

 Androidは、Googleが開発したモバイルOSで、主にスマートフォンやタブレットで使用されています。AndroidはLinuxカーネルを基に開発されており、オープン・ソースの要素が多いですが、Googleがプロプライエタリ(独占的)なアプリケーションやサービスを提供している部分もあります。
 
 iOSはAppleが開発したモバイルOSで、iPhoneやiPadなどのApple製品で使用されています。iOSはUNIXベースのシステムであり、そのセキュリティ、ユーザー体験の一貫性、独自のエコシステムが評価されています。iOSはプロプライエタリソフトウェアで、そのソースコードは公開されていません。
 
 Harmony OSは、中国のHuaweiが開発したOSです。元々はスマートデバイス(スマートテレビやウェアラブルデバイスなど)向けに開発されましたが、2020年以降はモバイルデバイスにも対応しています。Huaweiが米国政府との問題でAndroidのアップデートを受けられなくなったことから、独自のOSとして開発が進められました。Harmony OSはオープン・ソースで、IoTデバイス間のシームレスな接続を目指しています。筆者の評価では現時点では、HarmonyOS 4.0が最も汎用性に優れたLinux系OSです。

 このように殆どの情報通信機器のOSは、UNIXやLinuxをベースに作られているので、オープン・ソースを活用すると、筆者レベルの技術者が数名プロジェクトマネージャーとして参加するだけで、数ヵ月もあれば独自のOSを製造することが可能です。
 
 オープン・ソースやオープン・アーキテクチャを用いて高度なAIを製作するアプローチには、幾つかの典型的なメリットとデメリットがあります。

メリット

コラボレーション:オープン・ソースアーキテクチャは、世界中のエンジニアと研究者が共同で作業し、新たなアイデアや技術を共有することを可能にします。
 
透明性:ソースコードが公開されていることで、AIの動作原理や意思決定プロセスを理解しやすくなり、AIの倫理性、公正性、信頼性が向上します。
 
カスタマイズ:オープン・ソースAIはユーザーが自分のニーズや要件に合わせてカスタマイズできます。独自の機能を追加したり、既存の機能を修正したりすることができます。
 
コスト効率:多くのオープン・ソースAIプロジェクトは無料で使用できます。これにより、企業はAI技術へのアクセスが容易になり、AIの普及が促進されます。
 
イノベーション:オープン・ソースのアプローチは、新たな技術やアイデアが迅速に展開・適応される環境を提供します。

デメリット

セキュリティ:ソースコードが公開されていると、悪意を持った者がそのコードを悪用する可能性があります。また、オープン・ソースプロジェクトは零細企業のようにセキュリティ対策に大きなリソースを投入することが難しい場合があります。一方で、オープン開発には、多くのプログラマーがセキュリティーの脆弱性を早期に発見して、迅速に問題点を修正できる利点もあるので、全てがデメリットという意味ではないです。
 
サポート:オープン・ソースプロジェクトは、商用ソフトウェアのように専門的なサポートを提供していない場合があります。問題が発生した際には自己解決するか、コミュニティの助けを借りる必要があります。参加人数が多い大規模なプロジェクトでは、このような問題は生じにくいです。
 
 ところが、ハートブリード問題として有名な致命的なセキュリティー問題が発生したときは、この問題に取り組んでいた中心人物が一名だけで、このセキュリティーを利用していた企業の多くが、積極的にこのプロジェクトを支援しなかったことから、世界のサーバーの役2/3が深刻なセキュリティリスクにさらされ、ネット史上最悪の脆弱性問題として極めて有名です。あまりにも問題が大き過ぎたので、各社とも誰かが問題を解決するだとうと考えて、当事者意識が希薄だったことから問題解決には長い期間を要しました。

不確実性:オープン・ソースプロジェクトはコミュニティによる支援が不可欠であり、その継続性や将来性が保証されていません。プロジェクトが突然終了すると、ユーザーはサポートを失ったり、別の解決策を探さなければならなくなることがあります。冒頭で述べたRed HatがCentOSのサポートを行き成り中断して、有償版のRHEL(CentOSはRHELをクローンしたもの)のみを継続したようなケースが相当します。

不完全なドキュメンテーション:多くのオープン・ソースプロジェクトでは、ドキュメンテーションが不完全であったり、更新が遅れがちであることが問題となることがあります。これにより、ユーザーがシステムを理解したり、問題を解決したりするのが難しくなることがあります。

AI開発におけるオープン・ソースと、オープン・アーキテクチャ

 オープン・ソースとオープン・アーキテクチャのアプローチは、AIの開発と普及においても重要な役割を果たしています。その利点と欠点を理解し、適切に活用することで、AIのポテンシャルを最大限に引き出すことができます。

 2023年のChatGPTの爆発的な普及以降、世界中で生成AIの開発競争が激化しましたが、各社が数か月後には、ChatGPTと同等か、それ以上の性能を持つNLPや、生成AIをリリースすることができたのは、各社ともAIのオープン・ソースやオープン・アーキテクチャのことを熟知しており、それらのコアの部分に自社独自の特色を出せるプログラムが用意できていたからです。
 
 世界の情報通信産業のトップクラスの企業の生成AI技術には、それほど大きな実力の差はありません。OpenAI以外の企業は、これまで企業を相手に有償で提供していたサービスを、一般ユーザに無料で提供してこなかったというだけの話です。技術的な問題よりも、AI倫理問題の検討、マーケティング戦略、収益モデルの構築などに掛かっていた時間の方が長かったほどです。

 OpenAIは、まともな収益モデルも確立できていないにも関わらず、捜査や規制の対象となっており、赤字から脱却できる目途すら立っていない会社です。OpenAIと他の情報通信産業とのAI技術の差は技術力ではなく、ビジネスモデル、収益性、企業相手のサービスを一般ユーザ向けに安価(あるいは無料)で提供してしまう影響をどこまで熟慮しているかの違いに過ぎません。 

 技術を持っていてもリスクや日本政府の支援ばかり考えて何もしない日本の大企業病も問題ですが、情報倫理、AI倫理、著作権問題、セキュリティー問題や、社会に与え得る悪影響を熟慮せずに、サービスをリリースしてしまうベンチャー企業にも問題があります。

 GAFAMのようにAI部門の暴走を食い止める役目のAI倫理部門を解散したり、AI論理チームリーダーを解雇したりして、歯止めの利かない状態で、OpenAIとのチキンレースに参画した企業の浅はかさは、更なる問題です。

 そしてそれに輪をかけて大問題なのが、AIの先端技術など日本を含めて世界中にあるのに、ChatGPTに一点張りして、株主総会でAIに関して大法螺を吹いて、株主や消費者を錯誤させた企業と御用学者です。

 筆者は高性能なAIを核兵器に例えることが多いですが、(1) 核兵器を作る材料や技術を持っているかどうかと、(2) 実際に核兵器を製造して配備するかどうかと、(3) 配備した核兵器を実戦で使用するかどうかは、それぞれ別問題です。

rinna、日英バイリンガルの大規模言語モデルをオープン・ソースで公開
2023-07-31
東大発スタートアップ、67億パラメーターの日本語LLMをOSSで公開
2023年07月25日 12時56分更新

東京大学発のスタートアップ企業であるLightblue(ライトブルー)は、公開モデルとしては国内最大規模の67億パラメーターの日本語大規模言語モデルを開発し、オープン・ソース・ソフトウェアとして公開した。ライセンスはApache 2.0。

東京大学発のスタートアップ企業であるLightblue(ライトブルー)は、公開モデルとしては国内最大規模の67億パラメーターの日本語大規模言語モデルを開発し、オープン・ソース・ソフトウェアとして公開した。ライセンスはApache 2.0。 この言語モデルは、米モザイクML(MosaicML)が公開した多言語大規模言語モデル「MPT-7B」を基にしたもの。グーグルが開発した多言語データセット「MC4」をアレン人工知能研究所(Allen Institute for AI)がそれぞれの言語ごとに利用可能にしたサブセットの日本語部分を使って追加学習した。Lightblueは、今回公開したモデルを法人向けに提供する。業界用語や部署特有の専門用語、慣習などに合わせて訓練・調整することで、企業や部署によって異なる要望に応じるという。加えて、自社サービスの提供も予定しているとのことだ。

KADOKAWA ASCII Research Laboratories, Inc. 2023

Meta、商用利用可能なオープン・ソースLLM「Llama 2」を提供開始 「MPT」や「Falcon」を上回る成績
MicrosoftがLlama 2の優先パートナーに
Metaは、次世代のオープン・ソース大規模言語モデル「Llama 2」を提供開始した。研究および商用に無料で利用できる。
2023年07月21日 08時00分 公開
 
Metaは2023年7月18日(米国時間)、次世代のオープン・ソース大規模言語モデル(LLM)「Llama 2」の提供開始を発表した。研究および商用向けに無償で提供されている。

ITmedia

ChatGPT(3.5)に匹敵する「Llama 2」をローカルPCで動かしてみた
2023年07月31日 09時00分 公開
(中略)
このLlama 2、GPT-3.5の3月1日時点のモデルに匹敵する性能を持っているというのがウリです。GPT-3.5といえば、無料版のChatGPTで使われているモデルです。それがオープン・ソースとして公開されたのですから、衝撃的です。

ITmedia NEWS

いいなと思ったら応援しよう!

この記事が参加している募集