【読了】面倒なことはChatGPTにやらせよう
生成AIによって、プログラミングができなくてもチャットでデータ分析できるようになった
(データ分析用のソースコードを生成してくれるようになった)
はじめに
サポートサイト
【Part1 基礎知識】
1章 ChatGPTの基礎知識
1.1 ChatGPTの概要
Generative:生成する
Pretrained:学習済み
Transformer:自然言語処理用の機械学習アルゴリズム
1.2 拡張機能の紹介
Browsing:web検索
Advanced Data Analysis (Code Interpretor):データ処理、計算処理(GPT3.5だけだと間違える)
DALL-E:画像生成
GPT-4V:画像認識
1.3 ChatGPTの便利なところ
略
1.4 ChatGPTを使うときの注意点
・最新データでは学習されてない
・使用回数に制限がある
・ハルシネーション(Hallucination):確率的に尤もらしい文書を生成しているだけ
・生成結果の著作権
・秘密情報の漏洩:ChatGPTのトレーニングに使われてしまうため
ChatGPTサービスのステータス確認
2章 ChatGPTの基本的な使い方
2.1 基本的な使い方
略
2.2 効果的なプロンプトの書き方とコミュニケーションのヒント
・簡潔に、具体的に
・気にいる出力が出るまで何度か繰り返す
次の要求を伝えるメールを送りたい。内容をドラフトして。
ただし、以下を満たして。
・1文20文字以内、合計5文で。
・ビジネスメールの言葉遣いで。
・相手は忙しいので、気遣う文章も含めて。
・中国語で。
・要求:恐れ入りますが、この依頼を完了させるには2週間と60万円かかります。着手しますか。
2.3 カスタム指示
略
3章 ChatGPT Plusのセットアップ
3.1 拡張機能を使うためには
略
3.2 ChatGPTの拡張機能の動作確認
略
4章 ファイルのアップロードとダウンロード
4.1 アップロード・ダウンロード
略
4.2 扱うことができるファイル
.pyファイルをADA上で実行することも可能
ADAではSQLite3環境があるため、.sqlファイルも読み込める
.zipファイルも読み込める
【Part2 日常業務に活用する】
5章 繰り返し作業を一瞬で
5.1 文字列操作
以下の文章のうち、検索文字列を指定した色でハイライトして、HTMLファイルを出力して。
・文章:””
・検索文字列:猫(赤色)、犬(青色)
以下の2つの文章を、pythonのdifflibモジュールを使って比較して。異なる部分を色付けして、HTMLファイルを出力して。
・文章A:彼女は猫が好き。私は嫌い。
・文章B:彼女は犬が好き、私も好き。
5.2 正規表現でのパターンマッチ
正規表現を使って、以下の文章からメールアドレスを抽出して。
5.3 ファイルの一括操作
インプットしたい情報がファイルにまとまっているなら、ファイル丸ごと渡した方が便利
以下の処理を実行して。
①このzipファイルを解凍
②中の全てのファイル名を変更
例:1.csv→001.csv
③zip化して出力
5.4 QRコード作成
略
6章 画像の多彩な生成・加工
6.1 基本的な画像処理
画像処理:ADA
・リサイズ
・拡張子変更
・モノクロ化
・ドット絵化
画像生成:DALL-E
画像認識:GPT-4V
6.2 画像生成
著作権に注意
6.3 画像認識
この画像から、dlibを使って顔を検出して、モザイク処理して。
この画像に部品が何個あるか数えて。
部品の位置を赤枠で囲って。
この画像について説明して。
この画像から文字を検出して、Excelファイルとして出力して。
6.4 高度な画像処理
日本語フォントは、例えばGoogleが公開しているNoto Sans Japaneseをダウンロードして読み込ませればOK
OpenCVを使って
という指示を含めるとうまくいくことが多い
7章 手軽に音声ファイル処理
7.1 音声ファイルの読み込み
略
7.2 音声ファイルの可視化
この音声ファイルの波形を可視化して。
この音声ファイルの最初の10秒間を、SciPyを使ってスペクトログラムにして。
7.3 音声ファイルの編集
この音声ファイルから無音部分をカットして保存して。
この音声ファイルをピッチシフトして。上に3度。
この音声ファイルをタイムストレッチして。2倍の長さに。
8章 丸投げ! PowerPointスライド作成
8.1 スライドの作成
〇〇の特徴を1枚のPowerPointスライドにまとめたい。Pythonを使って書き出して。
このpptファイルのうち「XXX」の項目を更に詳細化して、2スライド目にまとめて。
このpptファイルから目次のスライドを作成して、最後のスライドに追加して。
このpptファイルを読み込んで、追加した方が良い画像を提案して。
8.2 Webサイトを要約してスライドにする
このサイトの内容を要約して.pptファイルを作成したい。まず各スライドのタイトルとキーメッセージを提案して。
9章 マニュアル不要でExcel操作
9.1 Excelファイルの読み込みとデータの確認
このExcelファイルの内容を説明して。
9.2 行と列の操作
略
9.3 グラフを描く
openpyxlライブラリを使うように指示しないと、他のpythonライブラリを使ってグラフ描画してしまうので注意
このExcelファイルの金額を月毎に集計した棒グラフを作成して。openpyxlを使って、Excelファイルに埋め込んで。グラフは日本語を使って。
9.4 関数の入力
Excelに関数を自動生成してもらうことも可能だが、テストは自分で行う必要あり
10章 WordファイルとPDFファイルの便利技
10.1 テキストデータの読み込みとWordファイルの生成
略
10.2 PDFファイルの読み込み
日本語のPDFファイルを読み込む場合、以下のようにライブラリを指定する方が良い
これは日本語で書かれたPDFファイル。PDFMinerを使って読み込んで、テキストファイルとして出力して。
10.3 PDFファイルの内容を要約する
略
10.4 PDFファイルのページの結合、削除、回転
略
【Part3 データ分析に活用する】
11章 データからかんたんグラフ作成
11.1 データの可視化の重要性
ひとまず可視化してみる
可視化したほうが人間にとって解釈しやすい
解釈しやすい方が意思決定に使いやすい
11.2 基本的なデータ可視化技術
ChatGPT標準ではグラフに日本語が使えないため、以下のライブラリを使ってMatplotlibを日本語化する
japanize-matplotlib-master.zip
このファイルを展開して、このコードを実行して。
このExcelファイルを使って、金額を月毎に集計して棒グラフにして。グラフは青色で。合計金額をグラフ上に表示して。
11.3 さまざまな可視化技術
ChatGPTで使える可視化ライブラリ
・Matplotlib
・seaborn
ChatGPTで描けるグラフの種類を教えて。
このExcelファイルを使って、データを可視化したい。どんな可視化が良いですか?
・分析の目的:xxxx
正弦波のアニメgifを作成して。
11.4 表形式のデータ
合計金額についてのヒストグラムを作って。
11.5 センサデータ
このファイルをグラフ化して。
このデータを詳しく分析して。
11.6 世界地図・日本地図へのデータの可視化
GeoPandasライブラリが使える
日本地図を使いたい場合、japanmapライブラリのインストールが必要
11.7 ワークアウトデータ
日本の詳細な区域の地図を使いたい場合、Foliumライブラリをインストールが必要
11.8 時系列データ
Pillowライブラリを使うと時系列データをgifアニメにできる
12章 データからビジネスに役立つヒントを得る
データを読み込ませる時は、以下も併記する
分析観点が思い浮かばない場合は「インサイトを得たい」程度でOK
どんな観点が良いかをChatGPTに質問してみても良い
このデータを分析して、インサイトを得たい。どんな切り口で分析すれば良いか?
・データの概要説明:弊社の東京都内店舗の2023年の売上データ
12.1 売上データ
各店舗の時間帯による売上の推移がわかるように可視化して。
このデータを追加して分析を進めて。
・データの概要説明:2023年の天気と気温のデータ
12.2 X(旧Twitter)データ
略
12.3 金融データ(ビットコインの価格分析)
ビットコインの価格について分析したい。どんな分析ができる?
ボリンジャーバンドによる視覚化もできる
【Part4 さらに応用する】
13章 業務を効率化する
13.1 Excelデータからグループ分けし、メール文を自動生成する
略
13.2 Excelデータを別シートに集計し、分析結果をスライドにまとめる
このデータを可視化して、PowerPointファイルに出力して。
13.3 条件を満たしたシフト表をつくる
略
13.4 マインドマップを自動生成する
ChatGPTプラグイン「AI Diagram」を使う
PlantUML形式ファイルを作成できる
13.5 論文をガイドしてもらい読む
略
14章 ゲームで遊ぶ
14.1 国あてゲーム
略
14.2 推理ゲーム
略
15章 ブラウザアプリを作る
15.1 時計アプリケーション
略
15.2 ポモドーロアプリ
略
16章 PythonをChatGPTと勉強する
16.1 ChatGPTにPythonを教えてもらう
xxの初学者が勉強するためのカリキュラムを考えて。
カリキュラムの各トピックについて、練習問題と、それに対する3個の模範解答を作成して。
この回答を添削して、アドバイスを教えて。
16.2 コードをアップし解説・実行をしてもらう
ADA環境があるので、実行してもらうと理解が捗るかも
このソースコードの仕様書を作成して。以下を含んで。
・概要
・機能
・実行方法
・注意事項
16.3 コードを改善してもらう
このコードについて、改善点を教えて。
17章 アドバンスな活用法にチャレンジ
17.1 GPTsで自分専用のGPTを作る
GPTsやGoogle Colaboratoryを使うことで、自分専用のGPTを作れる
17.2 無料で使えるPython実行環境:Google Colaboratory
ADA環境で動かせない場合、ソースコードの自動生成だけしてもらって、実行はGoogle Colaboratory上で行う
Google Colaboratoryでは高度なライブラリも使えるため(LightGBMなど)
17.3 日本語での自然言語処理:ツイートの分析
日本語文書からワードクラウドを生成したい場合、「分かち書き」処理を事前にしておく必要あり(ADAではできない処理のため)
あとがき
略