見出し画像

【情報Ⅰ】 ChatGPTの新機能「Code Interpreter」で問題作成がはかどる話 -Part2-


※ 2023年9月21日追記
「Code Interpreter」は、現在は「Advanced Data Analysis」という名称に変更されています。


こんにちは!ライフイズテックのサービス開発部でカリキュラム制作を担当しているないとうさおりです。

前回の記事では、ChatGPT の GPT-3.5 や GPT-4 だけでは難しかった情報 Ⅰ の計算問題の作成を、「Code Interpreter」を利用して簡単に実現できたことをご紹介しました。

Code Interpreter で作成した動画のデータ量の計算問題



今回は、引き続き Code Interpreter を使い、「データの活用」分野の擬似データと問題の作成にチャレンジします!

散布図の擬似データを作成

「データの活用」分野の重要な学習事項の一つに、相関関係・散布図があります。
大学入試センターが公表している試作問題(2022年11月)、サンプル問題(2021年3月)のいずれも、散布図の読み取り問題が出題されていますね。

この散布図、ゼロから擬似データを作ろうと思うとなかなか手が掛かります。
乱数を使って適当なデータを作ったら、相関係数と散布図とにらめっこしながら出題したい内容にあわせて値を調整しつつ、不自然な分布にならないように気を配り……。

表計算ソフトで地道に作った擬似データ

このような擬似データを含む練習問題を簡単に作成できれば、かなりの省力化ができそうです。
はじめに与えたプロンプトはこちら。

## todo
次の手順に従って、情報1の練習問題を作成する

## 手順
1. 相関関係について高校生が理解すべきことを具体的にまとめる。
2. 1を踏まえて練習問題を3問作る。その際、必要に応じて擬似データを作成して図を示す。

## 練習問題のフォーマット
- 問題文:
- 選択肢:
1.
2.
3.
4.
- 正答:

問題を作成する前に、要点をまとめさせるのが最近のお気に入りです。
この手順を踏むことで、ポイントを押さえた問題が作られる確率が高くなる気がします。

出力結果はこんな感じ。

作成した練習問題3題

1題ずつチェックして、ブラッシュアップしていきます。

練習問題1は、相関関係の基礎的な理解を問う問題として成立しているものの、理科のデータだけ200点満点だったり、相関がきれいに出過ぎていたりするのを調整したいところです。

やりとりを長く続けると、最初の方で示した指示や条件が通らなくなることが多いので、ここでは元データをCSV形式で出力したら、New Chat を開きます。

作成したデータをCSV形式のファイルに出力

New Chat で与えたプロンプト。

## todo
次の手順に従って、情報1の練習問題をブラッシュアップする。ただし、問題中の散布図は、score.csvをもとに作成する。

## 手順
1. score.csvのデータを修正する
・数学のテストスコアと理科のテストスコアはいずれも0以上100以下の整数値にする
・相関係数が0.6以上0.8以下になるようにする
2. 修正したデータをもとに、再度練習問題を表示する

## 練習問題
- 問題文:以下の散布図は、あるクラスの数学のテストスコアと理科のテストスコアを示しています。この散布図から、数学のスコアと理科のスコアの間の相関関係を判断してください。
(散布図を示す)
- 選択肢:
1. 正の相関がある
2. 負の相関がある
3. 相関関係がない
4. 因果関係がある
- 正答: 1. 正の相関がある

出力結果はこちら。

練習問題1のブラッシュアップ

面倒なデータの加工が数秒で完了しました!
ダウンロードしたCSVデータを表計算ソフトに貼り付けて、お好みの書式で散布図を作成すれば、できあがり。

もちろん散布図の画像自体もダウンロード可能ですが、日本語フォントには対応していないようです。


次の問題に移ります。
練習問題2は、そこまで修正が必要な箇所がなさそうので、これでOK。
練習問題3は、回帰分析の考え方を遠回しに問うているのがしっくりこないため、回帰分析の問題を改めて作り直すことにしました。

練習問題2・3(再掲)

回帰分析の練習問題を作成

回帰分析の練習問題を作るため、次のプロンプトを与えます。

## todo
次の手順に従って、情報1の練習問題を作成する

## 手順
1. 回帰分析について高校生が理解すべきことを具体的にまとめる。
2. 回帰分析を行う題材として、高校生にとって身近で理解しやすいものを3つ提案する。
3. 1,2をもとに、回帰直線をもとに未来の値を予測する問題を3案作る。その際、擬似データを作成して図を示す。

## 練習問題のフォーマット
- 問題文:
- 選択肢:
1.
2.
3.
4.
- 正答:

3つの題材で問題が作成されました。

回帰分析の練習問題

先ほどと同じ、気温とアイスクリームの売上の問題も作られました。
これをブラッシュアップしていくことにします。

回帰分析の問題をブラッシュアップ

データの調整はさくさくと完了。検算と推敲・校正もやってみます。

検算と推敲・校正

文体や指示文の統一については、問題を作成する段階であらかじめ例を示しておけば、後から修正する必要はなくなりそうです。

最後に修正を加えた説明不足の箇所や、概数に「約」が付いていない箇所も、できれば Chat GPT 自身で発見してもらいたいところ。
校正のプロンプトの与え方については、もう少し研究が必要そうです。

今回もCSV形式でファイルを出力して、回帰分析の問題もひとまず作成完了!

最後に、さらに複雑な擬似データの作成もできるのか実験してみます。

グループ別散布図の擬似データを作成

散布図の中に2つのグループを含み、グループによって異なる傾向がみられるデータを作ってみます。
まずは題材のアイディア出しから。

擬似データの題材案

題材5が高校生にとって身近な題材で、グループごとの傾向の違いも自然でよさそうです。
この題材で、いくつか条件を与えてデータを作成します。

グループ別散布図の擬似データ

指定した条件通り、簡単に擬似データを作成することができました。

今回作成した散布図だけでなく、箱ひげ図や度数分布表・ヒストグラム、シミュレーションの元データなどさまざまな場面に応用ができそうです。

おわりに

このように、AI を使って擬似データや練習問題の作成が圧倒的なスピードでできるようになりつつある今、あらためて問題制作のプロセスを1つひとつ言語化していくことの大切さと難しさを感じている毎日です。

・教科を通じて身に付けたい知識や技能、思考力の具体的な中身は?
・それらが身についているか測るには、どんな問いが必要?
・問題の題材やテーマを決める基準は何?
・誤答の選択肢はどのような手順と基準で作る?

前回・今回の記事は、ざっくり「やってみた!」のご紹介でしたが、このあと実際のプロダクトに載せられるレベルの品質をどのように担保していくのかについても、今後発信していければと思います。


ご案内
ライフイズテック サービス開発部では、気軽にご参加いただけるカジュアルなイベントを実施しております。

イベントの開催予定は connpass のグループ にてご案内しておりますので、興味をお持ちいただけたましたら、ぜひ、ご参加いただけると嬉しいです!


この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?