実践ケモインフォマティクスの記事一覧

 実践ケモインフォマティクスというブログにて、ケモインフォマティクス、マテリアルズインフォマティクス、データ分析に関する記事を書いています。
 主に自分自身の勉強・備忘録用の記事ですが、同じような勉強・仕事・研究をされている方の参考になれば幸いです。
 「クリエイターを応援する」で応援していただけると、勉強や記事を書く励みになります。もし記事が参考になったと思えましたら応援くださると嬉しいです。よろしくお願いします。

以下、記事一覧(11月12日更新)

データ

スクレイピングで化合物データを試薬サイトから収集する
pubchem から化合物情報を一気に取得する
外部データベースのまとめ(ケモインフォマティクス )

データ分析

変数選択・前処理
Borutaによる変数選択
カテゴリ変数のエンコーディングについて
変数のクラスタリングとデンドログラム作成

可視化など
主成分分析の概要とpython実装
相関係数の計算と可視化
bokeh入門(インタラクティブなグラフ作成)

回帰・分類手法
重回帰分析の概要とpython 実装
ロジスティック回帰の概要とpythonでの実装
XGBoostについて(ハイパーパラメータ最適化)
XGBoostについて(概要と実装)
lightGBMの使い方とハイパーパラメータについて
catBoostの概要と使い方

その他
Optunaを使ったXGBoostのハイパーパラメータ最適化

メモ
テーブルデータ分析コンペに参加して(メモ)

実践

実践
化合物の溶解度予測(予測の信頼性も評価する)
化合物の溶解度予測(基本編)

技術レポート再現
技術レポート再現(フィンガープリントによる化合物の予測根拠可視化 | 三井化学)
MI関連技術レポート再現(AIを用いたポリマー設計・検証サイクルの試行回数大幅低減 | 昭和電工)

統計

検定
ウィルコクソンの符号順位和検定(概要とpython実装)
ウェルチのt検定(概要とpython実装)
スチューデントのt検定(概要とpython実装)
対応のあるt検定(概要とpython実装)
正規性の検定(概要とpython実装)
F検定(概要とpython実装)
マン・ホイットニーのU検定(概要とpython実装)
無相関検定(概要とpython実装)
多重検定問題を回避した変数選択(Bonferroni法)
多重検定問題を回避した変数選択(ホルム法|Holm法)

その他

誤差について(メモ)

化学

化学
ハンセン溶解度パラメーターと溶解パラメーター(SP値)について
ポリマーのガラス転移温度について

RDkit 関連
RDkit を用いた分子の骨格変換
RDkit を用いた分子構造の描画
RDkitを用いた3D構造の最適化
RDkitを用いた分子操作(分子のフラグメント化)
RDkitを用いた分子構造生成1(A-B型)
RDkitを用いた分子構造生成2(A-B-C型)
rdMolDraw2Dモジュールを使って構造式描画をカスタマイズ
分子記述子への各原子の寄与率を可視化する
化合物の記述子化まとめ
BRICSBuildによる分子構造生成
Fingerprintの可視化について

量子化学関連
Pythonで量子化学計算(Psi4)

メモ

メモ
Matplotlibで3次元の散布図を描画する
matplotlibを日本語表示対応にする方法
クロスバリデーションでの分割数の目安
XGBoost, lightGBM, Catboost をGoogle ColaboratoryのGPUで実行する方法

読書メモ

「分析者のためのデータ解釈学入門」第一部
「分析者のためのデータ解釈学入門」第三部
「分析者のためのデータ解釈学入門」第二部
「統計解析と機械学習:要因分析からの考察」を読んで

まとめ記事

参考HP
参考書籍
無料で閲覧できる資料まとめ
ケモインフォマティクス関連の要素技術まとめ



いいなと思ったら応援しよう!