財務分析とRAGチャットボット開発への挑戦 - Day 1
こんにちは!経営管理、予算統制のかたわら、データ集計・分析・考察の作成等をしている中で、毎日の分析作業をもっと効率化できないかと考えています。特に、財務データを簡単に分析できる仕組みがあれば...という思いから、RAGチャットボットの開発に挑戦することにしました。
この25日間、私の学習過程や試行錯誤を記録として残していければと思います。同じように財務データの分析に興味がある方や、AI技術を実務に活かしたい方の参考になれば嬉しいです。
なぜRAGチャットボットなのか?
以前から、AIによる対応ケースでよく聞く質問パターンがあります。
「去年の同じ時期と比べて、この数字はどう変化してる?」
「この支出の異常値、過去に似たようなケースあった?」
「部門別の予実差異を教えて」
これらの質問に対して、いちいちSQLを書いて、Excelで加工して...という作業を繰り返すのは非効率だなと感じていました。そこで、チャットボット形式で財務データを分析できるツールを作れば、生産性が上がるんじゃないかと考えています。
これから必要になりそうな技術
これらを進めるにあたって、以下の技術を学ぶ必要がありそうです。
データ取得・処理
Python(久しぶりなので復習必要)
SQLSERVER/BigQuery(会計データベースを扱うため)
Pandas(データ加工用)
AI関連
LLM(OpenAIのAPI使ってみたい)
RAG(会計データと組み合わせるため)
ベクトルデータベース(まだよく分かってない)
チャットボット開発
LangChain(フレームワーク)
Streamlit(デモインターフェース用)
クラウド環境でのデプロイと管理
開発環境の準備
とりあえず今日は、開発環境の準備までやりました。
✅ Python 3.13をインストール
✅ VS Codeのセットアップ
✅ 必要なライブラリのリスト作成
明日は実際にSQLSERVERからデータを取得するところから始めてみようと思います。データベースの認証周りで少しハマりそうな予感...😅
これからの学習計画
以下の流れで進めていく予定です。
Week 1: データ取得と分析基盤の構築
開発環境のセットアップ
データベース連携
基本的なデータフレーム操作
可視化の基礎
Week 2: 財務分析と自動化技術
部門別データの集計処理
予実差異の自動計算
トレンド分析
異常値検知の実装
Week 3: LLM技術とRAGの基礎
Hugging Face Transformersの基礎
OpenAI APIの活用
LangChainの基本操作
ベクトル検索の実装
Week 4: チャットボット開発と実用化
チャットボットの設計
コンテキスト管理の実装
デモインターフェース構築
デプロイと運用設計
正直なところ、RAGやベクトルデータベースはまだ雲をつかむような感じですが、一つずつ理解していければと思います。同じような課題を持つ方々と、この25日間の学習を通じて一緒に成長できたら嬉しいです。
質問やアドバイスがあればぜひコメントください!明日は実際にコードを書き始める予定なので、少し緊張していますが楽しみです。