中学生の「税についての作文」
年に数回、確定申告とかで、税務署に行く機会がある。
そこで目にするのが、中学生の「税についての作文」
見るたびに、優等生な作文で、ムズムズする。
もちろん、審査をするのが国税庁なので、プロットは決まり切っているんだと思う。
内閣総理大臣賞
中学3年生の文章・・・すごい・・・
前々から、この共通点は何だろうか?
と思っていた。
そこで、WEBサイトから、文章を抽出して、これをGPTに読ませて、それっぽい作文を書いてもらおうと思いました。
データの準備1_対象リンクの取得
データの準備2_google colab
最小のアドレスはすべてコピー可能なPDFだったので、google colabでリンク先のデータを取得した文字を、C列に格納する
from google.colab import auth
from google.auth import default
import gspread
import requests
from io import BytesIO
!pip install PyMuPDF
auth.authenticate_user()
creds, _ = default(scopes=['https://www.googleapis.com/auth/spreadsheets', 'https://www.googleapis.com/auth/drive'])
gc = gspread.authorize(creds)
spreadsheet_id = 'スプレッドシートid'
worksheet = gc.open_by_key(spreadsheet_id).worksheet('Sheet1')
urls = worksheet.col_values(2)
import fitz
def extract_text_from_pdf(url):
try:
response = requests.get(url)
doc = fitz.open(stream=BytesIO(response.content), filetype="pdf")
text = ""
for page in doc:
text += page.get_text()
doc.close()
return text
except Exception as e:
print(f"Error processing {url}: {e}")
return "テキストの抽出に失敗しました。"
for i, url in enumerate(urls, start=1):
if url:
text = extract_text_from_pdf(url)
worksheet.update_cell(i, 3, text)
格納した結果がこちら・・・
なんと、130個もあった・・・
データの準備3_ダウンロード
データの準備4_GPTにアップロード
文章を読んで、共通点を教えてね
共通のことば
共通のワードを解析してくれた。
なるほど・・・
優等生は、こういう言葉を使うのか。
いや、国税庁の審査員の方は、こういう言葉が、好きなのか・・・
作文をしてください
1.優等生な作文
それでは、上記を踏まえて、文章を作成してもらった。
いやー、さすがです。これです。これ。
国税庁さんはこういう こういう文章を求めているんですよね。
いや、だけど、色がない。
まったく印象に残らない。
プレーンもプレーンだ。
・・・ので、脚色をすることにします。
2.リアリティーのある作文
下記の項目を織り込んで作文を1000文字以内で作成してください
ぐっと、リアリティーが増してきていい感じになりました。
これ、もう入賞できそうなレベルです。
さすが、130個の文章を学習した上で抽出された文章です。
3.自民党の裏金の作文
自民党の裏金問題を含めて、作文をしてもらった。
下記の項目を織り込んで作文を1000文字以内で作成してください
裏金を「還付金」と言い張り続ける自民党
説明ができないお金
所得になる
推定無罪
国会は法律を決めるところ
襟を正すべき
3000万円までは無税なのか
公平な社会の実現
↓ こちら
素晴らしい!
これは中学生っぽい感じを装いつつ、ぎりぎりに踏み込んでいる。
無垢を装って、切り込んでいる!
そして、「自民党」と言わずに「ある政党」に変換している!
この配慮は、もう大人だ!
今年も、国税庁が実施する「税について考える」作文が開催されるはず・・・
自民党、、いやある政党の問題について書かれたものがないはずがない・・・