見出し画像

RAGシステムの失敗パターンを社内規程に例えてもらう

こんにちは。aliceです。
久しぶりのnoteではないのですが、サムネの変え方がわからず焦りました。

RAGを作りたいなぁと思っていたときに教えてもらった「RAGシステムの失敗7パターン」


ChatGPTに翻訳してもらったのですが、さっぱりわからなかったので、社内規程バージョンにしてもらいました。

どこに書いてあるかわからなくなりそうなので、noteにメモします📝


RAGシステムの失敗点

1.インデックスの失敗

適切なチャンク化ってどのくらいだろう??


2.クエリ処理の失敗

これを自分でやるって結構しんどくないですか?
自動でできないのかな?


3.文書再ランキングの失敗

再ランキングアルゴリズム??


4.コンソリデータの失敗

コンソリデータ?

どうやって作るの?
というか、もう、人ってすごいなぁと思います。


5.回答生成の失敗

ノイズのフィルタリング、どうやってするんだろう?


6.システムのテストと監視の失敗

やっぱテストって大事なんだなぁ。



7.運用中の検証の失敗

これを読んでフィードバックって大事だなと思って、入れてみました。
でもフィードバックになっているのかがわからない。


教訓と今後の研究方向

1.チャンク化と埋め込み

適切なチャンク化ってどのくらいだろう??(2回目)
これを数値で表したりするってどういうことだろう??



2.RAG vs ファインチューニング

ファインチューニングしたら重くなるよなぁ…。


3.RAGシステムのテストと監視

やっぱり何をするにしてもチェック⇒反映は必要なんですね。
そんな気がしてきました。


いつかこのメモを活かす日がきたらいいなぁ。



この記事が気に入ったらサポートをしてみませんか?