見出し画像

ハーバード大学 100万冊の書籍AIデータセット公開を予定

ハーバード大学のデータセット公開とエボックスの取り組み

修正済みの文章を以下に再掲します。


ハーバード大学は、マイクロソフトやOpenAIからの資金提供を受け、新たに設立されたInstitutional Data Initiative(IDI)を通じて、約100万冊のパブリックドメイン書籍からなる高品質なデータセットを公開する、との記事が出ました。
Harvard Is Releasing a Massive Free AI Training Dataset Funded by OpenAI and Microsoft | WIRED

データセットには、シェイクスピアやダンテなどの古典作品から、チェコの数学教科書やウェールズ語のポケット辞書まで、多岐にわたるジャンル、時代、言語の書籍を含み、AI開発でのデータアクセスの民主化の推進、小規模な開発者や個人研究者への高品質なデータの提供をすることで、公平な競争環境を整えることを目的としている、とのことです。

エボックス合同会社(以下、当社)は、AIを活用したコーチングサービス「CoachMET」を提供しています。このサービスは、大規模言語モデル(LLM)とRAG(Retrieval-Augmented Generation)機能を組み合わせ、ユーザーにパーソナライズされたコーチング体験を提供するものです。今回のハーバード大学のデータセット公開は、当社のサービスに以下のようなポジティブな影響をもたらすと考えています。

知識ベースの拡充

公開予定のデータセットを活用することで、CoachMETの知識ベースを拡充し、より多様で深いコーチング内容の提供が可能となります。これにより、ユーザーは幅広いトピックに対応した質の高いコーチングを受けられるようになります。

AIモデルの精度向上

豊富なデータセットをトレーニングに利用することで、CoachMETのAIモデルの精度が向上し、ユーザーの個別ニーズにより適切に対応できるようになります。これにより、ユーザーの質問や要望に対して、迅速かつ的確な応答を提供できるようになることが期待されます。

当社は、「本質的な変化を呼び起こす」という理念を掲げ、人々が自らの可能性を最大限に発揮できるよう支援することを目指しています。

今後、公開されるデータセットを活用し、CoachMETの機能改善や新機能の開発をさらに推進することで、ユーザーの成長や課題解決をより効果的にサポートする質の高いコーチング体験を提供できるよう、引き続きチャレンジを続けてまいります。