【W3】部分構造による化合物フィルタリング_03_Step2_BRENK編
【本パート(W3)の目的】
いくつか私たちのスクリーニングライブラリーに含めたくない部分構造があります。このトークトリアルでは、そのような好ましくない部分構造の様々なタイプを学び、そしてRDKitを使ってそれらの部分構造を見つけ、ハイライトする方法を学びます。
上記はPython版のT3の説明ですが、W3の目的も同じです。
前回はPAINSフィルターを使いました。
今回はBRENKを試用します。
【BRENKフィルター】
Step2の上部ではBrenkらの忌避構造リストを用いてフィルタリングします。
Step1で紹介したRDKit Molecule Catalog FilterノードはBRENKフィルターもかけることができます。
Brenkらは顧みられない病気の治療のための化合物の探索に使用するスクリーニングライブラリーをフィルタリングするため、好ましくない部分構造のリストを作成しました(Chem. Med. Chem. (2008), 3,435-444)。好ましくない特徴の例として、ニトロ基(変異原性の問題)、スルホン酸基とリン酸基(薬物動態学的特性が好ましくない可能性が高い)、2-ハロピリジンとチオール基(反応性の問題)、といったものが挙げられます。
(magattacaさんのブログより)
設定:
技術的には新たにコメントすることはないです。
結果:
入力はStep1の時と同じく4510化合物ですが、BRENKフィルター後は2161化合物しか残りませんでした。
【Good molecules】
【Bad molecules】
2349化合物がBRENKフィルターにかかってしまいました。
【好ましくない部分構造について】
化合物の部分構造でのフィルタリングに関して、magattacaさんのコメントを引用します。
今回の記事では医薬品として好ましくない部分構造を検索し、データセットから取り除く方法が取り上げられています。一方で、好ましくない部分構造が状況によって変わりうるののだ、ということも指摘されています。例えば冒頭で好ましくない部分構造の例としてニトロ基や2-ハロピリジンといったものが指摘されています。ではこれらの構造が「絶対に医薬品としてありえないか?」というとその答えはNOです。
ニトロ基を有する医薬品の例として高血圧・狭心症治療剤のニフェジピン、より最近の承認薬としては大塚製薬の肺結核治療薬デラマニドが挙げられます。
また、2-ハロピリジンそのものではありませんが現在話題のファビピラル(アビガン)も類似の部分構造を有しています。ピラジン骨格ですがN横の脱離基(ハロゲン)としては反応性が高い構造かもしれません。「部分構造をどの範囲までとるか?」という基準で議論が分かれそうです。ぜひ専門家の皆様のご意見を伺いたいところです。
玄人は部分構造をどの範囲までとるかをカスタマイズしてより納得のいくフィルタリングを実装します。次回はその体験をしてみます。
おまけ:
【BRENKの結果を解析してみよう】
今回のデモデータの半数以上が好ましくないと判定されたので、さすがに内訳が知りたくなりました。ちょっとworkflowを編集してみます。
RDKit Molecule Catalog Filterノードの下のポート” Bad molecules”から
リストの分解に使う
【Ungroup】
と、すでにおなじみかと思いますが
【GroupBy】
を上図のように繋いで利用します。
設定:
Ungroup:
GroupByのGroupsタブ:
GroupByのManual Aggregationタブ:
とすることで、どの忌避構造が何回ヒットしたかを探ってみます。
結果:
GroupByノードを実行後の出力を数の多い順に並べ替えると下図のようになります。あと、フォントサイズも大きめにしました。
Magattacaさんの言及されたニトロ基や2-ハロピリジン(紫色四角でマーク)以外にも緑色の四角で囲った官能基に関して少しだけ。
マイケルアクセプター:
奇遇にもデモデータがEGFR阻害剤を扱っているので、
アファチニブについては下記を引用しておきます。
カテコール:
ヨウ素:
以前にbRo5について紹介しましたが、創薬においての定石って次々と塗り替えられてきているように思います。
新薬が必要とされる疾病にどんな設計思想で挑むかによって、化合物のフィルタリングの仕方も変わる好例ではないかと思いました。
ひいては今後も創薬化学者の皆さんが新たなドラッグライクネスとは何かを示していくのではないかと思います。その手があったかとまた驚く時が楽しみです。