![見出し画像](https://assets.st-note.com/production/uploads/images/150656160/rectangle_large_type_2_2bd56686b201b3fcecc103582324f53f.png?width=1200)
統計検定2級問題集アプリ(7月活動記録)
どうも。こんにちは。
ケミカルエンジニアのこーしです。
少し遅くなってしまいましたが、7月の活動記録を書いていきます。
巷ではオリンピックで盛り上がっていたようですが、我が家にはテレビがないのでほとんど見れませんでした。。
しかし、そのおかげか「統計検定2級問題集アプリ」をリリースすることができました!
また先月は、データサイエンス関係の活動に注力できたので、その活動記録もまとめたいと思います!
1.所感
(1)可処分時間の捻出
これまで私は「いかに可処分時間を捻出するか」を試行錯誤してきました。
その中で最も効果が大きいと感じたのは、テレビの撤去と新聞購読の中止でした。
だらっと見るテレビほど時間の無駄はないと常々感じており、テレビの撤去は大きくQOL(生活の質)を改善してくれました。
また新聞は、入社以来ずっと日経新聞(紙)を購読してきまして、一時期はかなりの時間を費やしていました。
しかし、一番大切なのは「課題をもって自ら調べる」ことだと実感し、購読をやめてしまいました。
ただし、自ら調べた結果、新聞の有料記事にぶち当たることは日常茶飯事でして、もしお金の余裕ができたら再購読しても良いと考えています(電子版)
(2)活動記録
毎度のことですが、年初に掲げた目標の進捗確認をしてみます。
✅2024年の目標(仮)
— こーし⚡️ケミカルエンジニア (@mimikousi) January 1, 2024
今年の目標はこれでいこう!
方針:化学・化学工学×データサイエンスで社会貢献
テーマ:統計学、キャリア(専門性)、DX、LLM、化学業界、ソフトセンサー、異常検知、制御
【積み上げ目標】
①ブログ100記事到達(+29記事)
②note +20記事
③X +300ポスト
④読書 30冊
すでに7ヶ月経ちましたので、目標の進捗率は7/12 = 58.3%です。
では、見ていきましょう!
①ブログ100記事到達 +29記事 11/29 = 37.9% ×
②note +20記事 この記事含め 8/20 = 40.0% ×
③X +300ポスト 99/300 = 33.3% ×(2024/8/11 23:30時点)
④読書 30冊 26/30 = 86.7% ◎
かなり頑張っているつもりですが、進捗が思わしくないですね。。
こんなに進捗が悪いと目標の見直しが必要です。。
試行錯誤しながら、より良い方法を探していきたいと思います。
2.気になるニュース
(1)ラウンドアップ(除草剤)
とある方が、ラウンドアップはベトナム戦争で使われた枯れ葉剤であると事実と異なることを言って炎上していました。
ラウンドアップを製造している日産化学の公式アカウントが怒っています。
(ラウンドアップは、2002年にモンサント社から日産化学に事業移管)
~お知らせ~
— 【公式】ラウンドアップマックスロード製品の安全性 (@nissanchem_rup) March 13, 2024
当社および当社製品に対する誹謗中傷、根拠のない誤った情報の流布をX上の投稿で確認したため、発信者情報開示請求をはじめとする法的手段を含めた検討を開始しました。
適宜、弁護士とも相談しながら対応して参ります。
上記のような行為は直ちにお止め頂けますよう、お願い致します。
ただ、この話は「ラウンドアップは枯れ葉剤ではない」という結論で済む話なのでしょうか。化学メーカーに勤めている私でも、日産化学を手放しで応援することができず何か嫌な予感がします。
ラウンドアップを開発したモンサント社は、ベトナム戦争で使われた枯れ葉剤を製造しましたが、ラウンドアップと枯れ葉剤は別物です。
しかし、モンサント社は「ラウンドアップ」により、支配者的なあくどいビジネスを展開しようとし、一部の環境活動家たちから「モンサタン(悪魔)」と呼ばれていました。
①ラウンドアップ・レディーという悪魔
モンサント社は「ラウンドアップ・レディー」というラウンドアップ(除草剤)に耐性のある農作物を開発(遺伝子組み換え)し、除草剤をまいても目的の農産物は枯れずに雑草だけを枯らすことができるようになりました。
一見、優れた製品だと思いますが、この「ラウンドアップ・レディー」の耐性は1代限りであり、継続的にラウンドアップを使用するためにはモンサント社から毎回農作物の種や苗を買わなければいけないのです。
安全保障の観点で、食料を支配されることは何よりも恐怖であり、各国でモンサント社への批判が高まり、こんな映画まで製作されました。
時間を見つけて観てみたいと思います。
②人体への害だけを考えてないか?
さらに、ラウンドアップの害については未だに議論が巻き起こる状態です。
低濃度であれば安全であると言われていますが、仮に人体への害は無いとしても、昆虫や細菌など目に見えない部分への影響はどうなのでしょうか。
自然環境は、想像もできないほど大きなスケールで循環しており、人体への害だけで判断してしまうと、巡り巡って人類を危機に追い込む可能性があります。
あまり上手い例ではありませんが、アスベストやフロン、ダイオキシンなど、人類は何度も過ちを犯しています。
少なくとも「人体への影響が無いから使おう」という自分本位の考えではなく、昆虫、細菌などのことも考えながら、化学製品を開発していかないといけないなと強く感じました。
技術者倫理の話ですね。
(2)ラーニングコミュニティ(旭化成)
4年連続DX銘柄として選ばれている旭化成が「ラーニングコミュニティ」を導入したようです。
日本人は、社会人になった途端に学ばなくなることで有名であり、それが今の日本経済の停滞の引き金となっている可能性すらあります。
旭化成のラーニングコミュニティの取り組みは、上の記事の内容の体現であり、とても良い取り組みだと思います。
旭化成のラーニングコミュニティ「新卒学部」は、マジで良い取り組みだと思う!
— こーし⚡️ケミカルエンジニア (@mimikousi) August 13, 2024
自分は一人でコツコツ勉強してきたけど、勉強しながら人と繋がれるのはとても重要(Xでも仲間はできるけど)
4年連続でDX銘柄に選ばれた旭化成。
他社より進んだ取り組みをどんどん始めている!https://t.co/3aKiUN8zVs pic.twitter.com/AjSQ3Ta9cL
3.データサイエンス勉強記録
(1)統計検定2級問題集アプリ
カマキリさん(@t_kun_kamakiri)に誘っていただき、6月頃から統計検定2級問題集アプリを制作しており、先日無事リリースできました。
カマキリさんとは、エコおじいさん(@ally_of_earth)が立ち上げた「製造業ブロガーの集い」で知り合いまして、要はX(Twitter)で繋がったご縁です。
発信活動をしているうちに、このような人脈を得ることができ、Xやブログには感謝しかないです。また、そこで出会えたカマキリさん、エコおじいさんにも本当に感謝です!
ついに!!
— こーし⚡️ケミカルエンジニア (@mimikousi) August 9, 2024
「統計検定2級問題集アプリ」をリリースしました!
まずは、8月限定で700円にします!
さらに20問くらい追加した後、値上げする予定です(安すぎるので)。
これを機に統計検定に挑戦するのはいかがでしょうか!?https://t.co/KlmLsPsQsR#統計検定2級#問題集アプリ pic.twitter.com/eJgrmR6liG
(2)Streamlit Share(python)
pythonのStreamlitライブラリを用いて、時間遅れ変数(ラグ特徴量)の相関関係を可視化するダッシュボードを作成しました。
Streamlitは、簡単にダッシュボードを構築できるだけでなく、GitHubのリポジトリを紐付けることでStreamlit Share上にWebアプリを公開することができます。
時系列データのトレンド比較(Streamlit Shareリンク)
誰でもアクセスできますので、ぜひ触ってみてください。
化学プラントの時系列データを解析する際は、時間遅れ(ラグ特徴量)を考慮する必要がある。
— こーし⚡️ケミカルエンジニア (@mimikousi) July 11, 2024
例えば、反応器前後のデータでは、反応器の滞留時間分、時間をズラすと良い。
そこで、時間遅れ変数の相関関係を可視化するダッシュボードを作ってみた!
Streamlitなら簡単かも!https://t.co/gACgo3VZN9 pic.twitter.com/C5h6Um5cL6
また、データセットの特徴を把握したり、異常値を見つける際に重宝する主成分分析(PCA)とt-SNE(非線形)の可視化ダッシュボードも作成しました。
PCAとt-SNEの可視化(Streamlit Shareリンク)
データ解析でおなじみの「主成分分析」の可視化アプリを作りました!
— こーし⚡️ケミカルエンジニア (@mimikousi) July 18, 2024
非線形の可視化手法「t-SNE」も追加してます。
Streamlit Shareではt-SNEはやや重たいようです。。
多変数データセットでもこんな感じで可視化することで、異常値などの特徴が見えてくることがありますね!https://t.co/bYqWN1wFqG pic.twitter.com/Giw1W29Qiz
このように「何がしたいか」さえイメージできていれば、ChatGPTに細かく指示することでPythonコードはほとんど書いてくれます。
ChatGPT片手に、今後も色々なダッシュボードを作ってみたいと思います!
ChatGPTなどの生成AIのおかげでプログラミング能力が不要になってきており、統計学の理論(何ができるのか)に注力できるようになりました。本当に有り難い時代ですね。
数年前までは、統計学を勉強してもプログラミングができないと高度なデータ解析はできなかった。
— こーし⚡️ケミカルエンジニア (@mimikousi) August 6, 2024
しかし、今は生成AIに「何がしたいか」を指示すれば、"ほぼ"正確にプログラムを書いてくれる。
よって今は「統計学を使って何ができるのか」を学ぶ好機であり「統計検定」の重要性も増してきていると思う
(3)ブログ2記事執筆
上記の内容についてブログ記事にまとめました。
化学プロセスの時系列データにおける回帰モデル構築では、説明変数の時間遅れ(ラグ特徴量)を考慮する必要があります。
ダッシュボードでラグ特徴量の相関係数を可視化しながら(可視化しなくても良いですが。。)、最も相関係数(の絶対値)の大きいラグ特徴量を変数選択に活用することで予測精度を向上させることができました。
(4)今後の勉強予定
①ブログ執筆予定
ブログにまとめたいと考えているテーマは下記の通りです。
主成分分析(PCA)、t-SNE
LASSO(変数選択)
定量下限の話
誤差の話
その他、変数選択の比較や回帰モデルの比較についても記事を書けたら良いですね。
②勉強テーマ
今後は、下記について勉強したいと考えています。
①ガウス過程回帰
②適応型モデル
③異常検知
④深層学習
⑤モデル予測制御
ガウス過程回帰の実装はできるようになったので、あとは理論分野の深掘りをしたいです。
また、ソフトセンサーの実装においては、流量計のスケーリングなどのモデルの劣化が確実に起きるので、適応型モデルを実装できるようになりたいです。
やりたいことがたくさんありますが、コツコツ一つずつ取り組んでいきたいと思います!