SigPrimedNet: A Signaling-Informed Neural Network for scRNA-seq Annotation of Known and Unknown Cell Types

シングルセルデータは、これまでにない解像度で細胞のダイナミクスを研究することを可能にしました。細胞レベルでのトランスクリプトームデータを用いた解析では、細胞種と機能のアノテーションが極めて重要である。この2つのアノテーションは、コミュニケーション機構の背後にある複雑な生物学的プロセスを理解するための基礎となる。我々は、パスウェイデータベースに蓄積された知識を取り入れ、シグナル伝達の機能的要約を学習しながら細胞を識別するデータ駆動型ソリューションであるSigPrimedNetを提案します。そのために、各シグナル伝達経路を、最小限の機能単位として機能する正準エフェクター回路に分解する。これらの回路は、細胞タイプ分類ニューラルネットワークモデルの設計に役立ち、与えられた細胞のシグナル伝達活性の代理として機能する意味のある特徴を抽出することを可能にする。さらに、推測された活動に対して教師なし異常検知アルゴリズムを学習させることで、未知の細胞を識別することができるようになった。提案モデルの性能を示すために、一般に公開されているデータを用いた一連の実験を行い、細胞タイプのアノテーション、未知の細胞タイプの識別、クラスタリングといったすべてのタスクにおいて有望な結果を得た。最後に、本モデルが学習したシグナル伝達活性の生物学的な豊かさを紹介する。

概要
シングルセルRNAシーケンスは、個々の細胞のレベルで複雑な細胞タイプの景観に関する前例のない詳細を提供することにより、複雑な組織または器官の挙動に関する我々の理解を深めています。細胞タイプの定義と機能的アノテーションは、基礎となる細胞コミュニケーション機械の背後にある分子プロセスを理解するための重要なステップです。しかし、scRNA-seqデータの急激な増加により、この技術の比類ない解像度だけでなく、データの異質性がますます高まっているため、手作業で細胞をアノテーションする作業は実行不可能なものとなっています。細胞を自動的にアノテーションするために、多くの教師あり、教師なし手法が提案されてきた。未知の細胞種が存在する場合を除き、教師ありの細胞種アノテーション手法は教師なしの手法を凌駕する。本論文では、SigPrimedNetを紹介する。SigPrimedNetは、(i)スパース性を誘導する信号回路情報層による効率的な学習、(ii)教師あり学習による特徴表現学習、(iii)学習表現に異常検出法を適用することによる未知細胞タイプの特定、を活用する人工ニューラルネットワーク手法だ。SigPrimedNetは、一般に公開されているデータセットにおいて、未知の細胞に対して低い偽陽性率を維持しながら、既知の細胞タイプを効率的にアノテーションできることを示す。さらに、学習された表現は、シグナル伝達回路の活動計測の代理として機能し、細胞の機能性を推定するのに有用である。

この記事が気に入ったらサポートをしてみませんか?