見出し画像

特許・論文データ連携で進化するLLM搭載「AI検索エンジン」開発の裏側、ちょっと覗いてみませんか?

最近、マジですごい進化を見せてるLLM(大規模言語モデル)を使ったAI検索エンジン。FeloとかPerplexityとか、名前を聞いたことがある人もいるんじゃないでしょうか?
でもね、現状ってウェブの情報を探すのがメインで、もっと専門的な知識が欲しい!って人には、ちょっと物足りない部分もあったりするんですよね。

今回のは、そんな現状を打破すべく、オープンソースの力で次世代AI検索エンジンを作っちゃおう!っていうプロジェクトの会議の内容を公開してます。
特許データとか論文APIとか、専門的な情報源をどうやって活用して、他のAI検索エンジンと差をつけるのか? その戦略と開発内容を、ざっくばらんに語っちゃいます!


1. 最新進捗:レポート形式出力と専門データ連携がハンパない!

まずは最新情報から!
開発チームから、ユーザーの質問に合わせて答えの形を自由に変えられる機能がパワーアップしたって報告がありました。
しかも、今まではウェブ情報だけだったのが、特許データ・論文データとも連携できるようになったらしいんですよ!
これって、AI検索エンジンが提供できる知識のレベルがグンと上がるってことですよね。ワクワクしません?

検証内容では、「機械学習を使って悪意のあるコードを検出する方法について教えてください。」って質問をAIにぶつけてみたらしいんですけど、出てきた答えがマジで本格的!
概要はもちろん、関連する特許情報とか論文、さらには実際の活用例や今後の展望まで、レポート形式でズラッと出てきたんです。
それぞれの項目には、どこの情報源から引っ張ってきたのかもちゃんと書いてあって、信頼性もバッチリ。これは期待できそう!

2. 精度爆上がりだけど、まだまだ面白くなる予感!

今回の進化には、チームメンバーも大興奮! 特に、前回のバージョンと比べると、答えの精度が格段に上がったってみんな言ってるんです。

ただね、もちろん課題も見えてきてるんです。例えば、概要文がちょっとフワッとしすぎてる、みたいな意見も。
特許のすごいところとか、論文の主張をもっとギュッと凝縮して伝えられるようにできたら、さらに良くなるよね!って話で盛り上がりました

そこで出たアイデアが、それぞれの情報源(特許とか論文とかウェブの情報とか)から得られた内容を、いい感じに混ぜ合わせて概要を作るっていう作戦。これ、実現したらマジですごそうじゃないですか? このあたりはプロンプトをもっと工夫して検討を進めてみたいと思います。今後の開発がますます楽しみになってきました!

3. フロントエンド開発に革命?:コード生成AIでどこまでイケるのか試してみた

次に話題になったのが、AI検索エンジンの見た目、つまりユーザーインターフェース(UI)をどうするか?って話。ここで注目されたのが、コード生成AIっていう魔法の道具! 今回、出力したレポートがマークダウン形式で出力できるってことで、「もしかして、コード生成AIを使えば、チャット形式の画面もサクッと作れちゃうんじゃない?」って話になったんです。

コード生成AIって、プログラミングの専門知識がなくても、自然言語で入力するだけで、Webサイトとかアプリが作れちゃうスグレモノ。これを使えば、開発期間も短縮できるし、コストも抑えられるかもしれない! 早速、試してみるしかないですね!
コード生成AIは、v0を試してみようと思ってます。次回の報告をぜひお楽しみに。

4. 技術的深掘り:バックエンドAPI化とデータ基盤、裏側の工夫

ここからは、ちょっとマニアックな話。AI検索エンジンの裏側、つまりバックエンドをどう作るか?って議論です。特に、特許データをどこにどうやって保管するかっていうのが重要テーマ。

AWSなど使うと実現できるのですが、PoCなので極力無償で実現したいのが正直な気持ち…

一方で、無料で使えるのは魅力的だけど、安定性とか、将来的にアクセスが集中しても大丈夫か?っていうのも考えないといけないですからね。ここは、色々な選択肢を比較検討していくことになりそうです。

私は、あまり勉強できていないのですが、supabaseあたりがもしかしたら使えるかも?調査をして検討してみたいと思います。

5. 開発ロードマップと未来への期待

会議の最後には、直近の開発計画をすり合わせました。

  • 科研費APIとの連携で、さらに情報源を増やす!

  • コード生成AIで、チャット形式のフロントエンドUIを作る!

  • 無料で使える特許データ基盤を構築する!

中でも注目は、AIがコードを自動生成してくれるツールを活用して、フロントエンド開発を効率化するっていうアイデア。これ、うまくいけば開発スピードがグンと上がりそう!

6. おわりに

今回の会議を覗き見して、LLMを活用したAI検索エンジンの開発が、想像以上に面白いことになってるって思ってもらえると嬉しいです。
専門的な知識とAIの力が組み合わさることで、今までアクセスできなかった情報に、もっと簡単にアクセスできるようになるかもしれない。

次回のブログでは、もしかしたら、実際に動くAI検索エンジンのデモが見れるかも!? 乞うご期待!


いいなと思ったら応援しよう!

Sumi(スミ)2020@SaaSプロダクト・PdM、新規事業・事業開発
よろしければ応援お願いします! いただいたチップはプロダクト開発の開発費に使わせていただきます!