【W8の目的】
KNIME版のTeachOpenCADDのW8は上記までを扱います。
一方、Python版のT8はより発展的です。
今回からはデモデータを使ってW8のStep1の設定を見てみます。
【Uniplot ID】
Step1ではUniplot IDを用いて、特定のたんぱく質のPDBデータを検索します。
検索するクエリタンパク質の選択
さて構造生物学に関する情報のデータベースであるPDBについてはmagattacaさんの上記の記事に詳しかったので割愛しますが、Uniplot IDが初出の単語かと思います。
Magattacaさんがすごいのはタンパク質配列データベースであるUniplotについても別途解説して下さっていることです。最後までご覧になると楽しいです。
あるいはこちらも良い教材かと思いました。
ともあれUniplotでのIDを使って検索対象のタンパク質を特定できると言うことです。
【PDB Connector Query Builder】
そして検索の絞り込み条件はPDB Connector Query Builderで設定します。
日本語化されたノードディスクリプションを見てみましょう。
上図では今回のクエリの一部をウェブUIでも設定してみた例です。
一方で、PDB Connector Query Builderノードでのクエリすなわち検索式の設定方法もディスクリプションに詳しく記載されています。
文章だけだとわかりにくいかもしれませんので、デモデータのクエリを見てみましょう。
5つの条件がANDで繋がっています。
① Uniplot IDがP00533で
② 実験方法はX線回折で
③ データの解像度は3.0Å以下で
④ リガンドとの共結晶で
⑤ リガンドの分子量が100.0以上
のデータを検索します。
実は先に紹介したウェブUIでは➃と⑤の検索式が入れられないです。
Vernalisノードの特別仕様ということかと思います。便利でしょうね。
ところが実は、2022年7月現在は私のKNIME AP (ver.4.4.1)環境でPDB Connector Query Builderに➃と⑤を設定すると、PDB Connector Query Executorでエラーが出てしまいます。最新バージョンでは解消されているのかな。
すでに2000字ほどになってしまったので続きは次回に。検索結果を見つつ、おまけで上記エラーの回避策も紹介します。
謝辞:
【Vernalisへの謝意】
ノードディスクリプションにはもう一つ重要な情報が記載されています。
もはやKNIMEのケモインフォマティクス技術の代表格でもあるVernalisのノード群、
TeachOpenCADD-KNIMEを開いている皆さんは当然インストール済と思います。
皆さんは既に下記の論文もお読みになっているかもしれません。
"Five Years of the KNIME Vernalis Cheminformatics Community Contribution."
Curr Med Chem. 2020;27(38):6495-6522. doi:10.2174/0929867325666180904113616
Abst.だけDeepL翻訳して引用させていただきます。
Vernalis社の皆さんの素晴らしい取り組みに感謝しつつ、この論文をすべて訳したい気持ちにすらなります。
私が好きなのはMMPのworkflowです。これはまたいつか取り上げようと思っています。
最大限の感謝と敬意とともに。