統計検定2級問題集アプリ(7月活動記録)
どうも。こんにちは。
ケミカルエンジニアのこーしです。
少し遅くなってしまいましたが、7月の活動記録を書いていきます。
巷ではオリンピックで盛り上がっていたようですが、我が家にはテレビがないのでほとんど見れませんでした。。
しかし、そのおかげか「統計検定2級問題集アプリ」をリリースすることができました!
また先月は、データサイエンス関係の活動に注力できたので、その活動記録もまとめたいと思います!
1.所感
(1)可処分時間の捻出
これまで私は「いかに可処分時間を捻出するか」を試行錯誤してきました。
その中で最も効果が大きいと感じたのは、テレビの撤去と新聞購読の中止でした。
だらっと見るテレビほど時間の無駄はないと常々感じており、テレビの撤去は大きくQOL(生活の質)を改善してくれました。
また新聞は、入社以来ずっと日経新聞(紙)を購読してきまして、一時期はかなりの時間を費やしていました。
しかし、一番大切なのは「課題をもって自ら調べる」ことだと実感し、購読をやめてしまいました。
ただし、自ら調べた結果、新聞の有料記事にぶち当たることは日常茶飯事でして、もしお金の余裕ができたら再購読しても良いと考えています(電子版)
(2)活動記録
毎度のことですが、年初に掲げた目標の進捗確認をしてみます。
すでに7ヶ月経ちましたので、目標の進捗率は7/12 = 58.3%です。
では、見ていきましょう!
①ブログ100記事到達 +29記事 11/29 = 37.9% ×
②note +20記事 この記事含め 8/20 = 40.0% ×
③X +300ポスト 99/300 = 33.3% ×(2024/8/11 23:30時点)
④読書 30冊 26/30 = 86.7% ◎
かなり頑張っているつもりですが、進捗が思わしくないですね。。
こんなに進捗が悪いと目標の見直しが必要です。。
試行錯誤しながら、より良い方法を探していきたいと思います。
2.気になるニュース
(1)ラウンドアップ(除草剤)
とある方が、ラウンドアップはベトナム戦争で使われた枯れ葉剤であると事実と異なることを言って炎上していました。
ラウンドアップを製造している日産化学の公式アカウントが怒っています。
(ラウンドアップは、2002年にモンサント社から日産化学に事業移管)
ただ、この話は「ラウンドアップは枯れ葉剤ではない」という結論で済む話なのでしょうか。化学メーカーに勤めている私でも、日産化学を手放しで応援することができず何か嫌な予感がします。
ラウンドアップを開発したモンサント社は、ベトナム戦争で使われた枯れ葉剤を製造しましたが、ラウンドアップと枯れ葉剤は別物です。
しかし、モンサント社は「ラウンドアップ」により、支配者的なあくどいビジネスを展開しようとし、一部の環境活動家たちから「モンサタン(悪魔)」と呼ばれていました。
①ラウンドアップ・レディーという悪魔
モンサント社は「ラウンドアップ・レディー」というラウンドアップ(除草剤)に耐性のある農作物を開発(遺伝子組み換え)し、除草剤をまいても目的の農産物は枯れずに雑草だけを枯らすことができるようになりました。
一見、優れた製品だと思いますが、この「ラウンドアップ・レディー」の耐性は1代限りであり、継続的にラウンドアップを使用するためにはモンサント社から毎回農作物の種や苗を買わなければいけないのです。
安全保障の観点で、食料を支配されることは何よりも恐怖であり、各国でモンサント社への批判が高まり、こんな映画まで製作されました。
時間を見つけて観てみたいと思います。
②人体への害だけを考えてないか?
さらに、ラウンドアップの害については未だに議論が巻き起こる状態です。
低濃度であれば安全であると言われていますが、仮に人体への害は無いとしても、昆虫や細菌など目に見えない部分への影響はどうなのでしょうか。
自然環境は、想像もできないほど大きなスケールで循環しており、人体への害だけで判断してしまうと、巡り巡って人類を危機に追い込む可能性があります。
あまり上手い例ではありませんが、アスベストやフロン、ダイオキシンなど、人類は何度も過ちを犯しています。
少なくとも「人体への影響が無いから使おう」という自分本位の考えではなく、昆虫、細菌などのことも考えながら、化学製品を開発していかないといけないなと強く感じました。
技術者倫理の話ですね。
(2)ラーニングコミュニティ(旭化成)
4年連続DX銘柄として選ばれている旭化成が「ラーニングコミュニティ」を導入したようです。
日本人は、社会人になった途端に学ばなくなることで有名であり、それが今の日本経済の停滞の引き金となっている可能性すらあります。
旭化成のラーニングコミュニティの取り組みは、上の記事の内容の体現であり、とても良い取り組みだと思います。
3.データサイエンス勉強記録
(1)統計検定2級問題集アプリ
カマキリさん(@t_kun_kamakiri)に誘っていただき、6月頃から統計検定2級問題集アプリを制作しており、先日無事リリースできました。
カマキリさんとは、エコおじいさん(@ally_of_earth)が立ち上げた「製造業ブロガーの集い」で知り合いまして、要はX(Twitter)で繋がったご縁です。
発信活動をしているうちに、このような人脈を得ることができ、Xやブログには感謝しかないです。また、そこで出会えたカマキリさん、エコおじいさんにも本当に感謝です!
(2)Streamlit Share(python)
pythonのStreamlitライブラリを用いて、時間遅れ変数(ラグ特徴量)の相関関係を可視化するダッシュボードを作成しました。
Streamlitは、簡単にダッシュボードを構築できるだけでなく、GitHubのリポジトリを紐付けることでStreamlit Share上にWebアプリを公開することができます。
時系列データのトレンド比較(Streamlit Shareリンク)
誰でもアクセスできますので、ぜひ触ってみてください。
また、データセットの特徴を把握したり、異常値を見つける際に重宝する主成分分析(PCA)とt-SNE(非線形)の可視化ダッシュボードも作成しました。
PCAとt-SNEの可視化(Streamlit Shareリンク)
このように「何がしたいか」さえイメージできていれば、ChatGPTに細かく指示することでPythonコードはほとんど書いてくれます。
ChatGPT片手に、今後も色々なダッシュボードを作ってみたいと思います!
ChatGPTなどの生成AIのおかげでプログラミング能力が不要になってきており、統計学の理論(何ができるのか)に注力できるようになりました。本当に有り難い時代ですね。
(3)ブログ2記事執筆
上記の内容についてブログ記事にまとめました。
化学プロセスの時系列データにおける回帰モデル構築では、説明変数の時間遅れ(ラグ特徴量)を考慮する必要があります。
ダッシュボードでラグ特徴量の相関係数を可視化しながら(可視化しなくても良いですが。。)、最も相関係数(の絶対値)の大きいラグ特徴量を変数選択に活用することで予測精度を向上させることができました。
(4)今後の勉強予定
①ブログ執筆予定
ブログにまとめたいと考えているテーマは下記の通りです。
主成分分析(PCA)、t-SNE
LASSO(変数選択)
定量下限の話
誤差の話
その他、変数選択の比較や回帰モデルの比較についても記事を書けたら良いですね。
②勉強テーマ
今後は、下記について勉強したいと考えています。
ガウス過程回帰の実装はできるようになったので、あとは理論分野の深掘りをしたいです。
また、ソフトセンサーの実装においては、流量計のスケーリングなどのモデルの劣化が確実に起きるので、適応型モデルを実装できるようになりたいです。
やりたいことがたくさんありますが、コツコツ一つずつ取り組んでいきたいと思います!