kaku

BizDev

kaku

BizDev

最近の記事

[Python]OpenAIの「Function calling」を使ってデータの抽出・構造化してみた

本日はOpenAI APIの新機能を活用して、ビジネスサイドの人でも役立ちそうな使い方を試してみましたので、共有してみます。 営業企画的な業務の中ではデータクレンジング、構造化作業をすることは多く、それなりに工数を払ってきましたが、8割ほどの削減になりそうな予感です。 OpenAIのFunction callingとはOpenAIのFunction callingは、自身で定義した関数に準拠したJSONでの応答を得られる新機能です。この機能による各種GPTモデルから構造化

    • [Python]音声ファイルから無音除去、話者分離、文字起こし(WhisperAPI/Pydub/Pyannote)

      はじめに先日のWhisperAPIの続きです! 本記事では以下のコードを解説しています。 音声ファイルから無音部分を除去 話者ごとに音声を分離 発話ごとに音声をテキストに変換 話者分離の精度はまあまあといったところですが、ChatGPTに投げて要約させる際に若干精度が上がる感じがするのと、なにより「文字起こし」らしい雰囲気が出るので好きです。 コード解説必要なライブラリのインポート まず、必要なライブラリをインポートします。これらのライブラリは、音声処理や話者分

      • [Python]OpenAIのWhisperAPIを使用して文字起こし/25MB制限対応済

        はじめに普段はビジネスサイドでBizDev、なんでも屋をやっています。 Whisper使ってみたかったのでAPIに触ってみたんですが、サイズ制限とか少しつまづくことがあったので共有がてら記事にしました。 ちなみに、ローカルでやれば無料なんですが、GPU使わないと結構時間かかるのに対して、APIはほんの数秒〜数分で返してもらえるので良いです(1分1円未満ですし) OpenAIのWhisperとはOpenAIのWhisperは、音声認識モデルの1つで、様々な環境での音声の自然さ

      • [Python]OpenAIの「Function calling」を使ってデータの抽出・構造化してみた

      • [Python]音声ファイルから無音除去、話者分離、文字起こし(WhisperAPI/Pydub/Pyannote)

      • [Python]OpenAIのWhisperAPIを使用して文字起こし/25MB制限対応済