scPipe: An extended preprocessing pipeline for comprehensive single-cell ATAC-Seq data integration in R/Bioconductor
https://www.biorxiv.org/content/10.1101/2023.09.25.559230v1
本研究の学術的背景、研究課題の核心をなす学術的「問い」は?
本研究の学術的背景は、シングルセルRNA-Seqデータのプラットフォームに依存しない分析を行うための柔軟性のあるR/BioconductorパッケージであるscPipeに関連しています。この研究の核心となる学術的な問いは、scPipeを拡張してシングルセルATAC-Seqおよびマルチモーダル(RNA-SeqおよびATAC-Seq)データを処理することができるようにすることです。
本研究の目的および学術的独自性と創造性は?
本研究の目的は、scPipeを使用してシングルセルATAC-Seqデータの前処理を行い、解析のためのSingleCellExperimentオブジェクトを生成することです。これにより、ユーザーはscPipeを使用してデータの品質管理の閾値を微調整しながら、「真の」細胞を効率的に特定することができます。また、scPipeはBioconductorで利用可能なさまざまなシングルセルツールを使用して、次元削減、クラスタリング、モチーフの豊富さ、異なる可視性、およびシスレギュレータリーネットワーク解析など、scATAC-Seqデータのさらなる分析を行うことができます。
本研究の学術的な独自性と創造性は、scPipeがシングルセルATAC-Seqデータの処理を可能にし、生物学者がRで完全なシングルセルATAC-SeqおよびRNA-Seqデータ解析パイプラインを構築できるようにすることにあります。また、scPipeはシングルセルデータ構造であるSingleCellExperimentオブジェクトとの互換性があり、簡単にscATAC-Seqデータを格納することができるため、これまでのツールとは異なる柔軟性を提供しています。
本研究の着想に至った経緯や、関連する国内外の研究動向と本研究の位置づけは?
本研究は、シングルセルATAC-Seqデータを効率的かつ効果的に前処理するための分析ツールの開発が求められているという背景に基づいています。現在、scATAC-Seqデータを前処理できるツールは14種類ありますが、そのうち多くは特定のデータ構造を必要とし、互換性が制限されています。また、複数の技術(ドロップレットベースおよびプレートベース)からのデータを扱うことができないツールも多いです。
本研究では、これらの制限を解決するために、scPipeを拡張し、シングルセルATAC-Seqデータを処理し、R/Bioconductorで利用可能な下流の解析ツールとの互換性のあるSCEオブジェクトを生成するようにしました。そのため、本研究は国内外の研究動向の中で、シングルセルATAC-Seqデータ分析の効率的な前処理に関する重要な位置づけを持っています。
本研究で何をどのように、どこまで明らかにした?
本研究では、scPipeを使用してシングルセルATAC-Seqデータの前処理プロセスを詳細に説明しました。データのクリーニング手順を実行し、重複したリード、低頻度の特徴、品質の低い細胞を除去し、興味のある特徴を行に、細胞を列に持つスパースなカウント行列を含むSingleCellExperimentオブジェクトが作成されます。品質管理情報や関連する特徴の注釈などのメタデータも保存されます。
本研究の有効性はどのように検証した?
本研究では、scPipeを使用してシングルセルATAC-Seqデータを前処理し、生成されたSCEオブジェクトを使用してさまざまな下流の解析ツールを実行しました。これにより、データの次元削減、クラスタリング、モチーフの豊富さ、異なる可視性、およびシスレギュレータリーネットワーク解析などのさまざまな解析が行われました。これにより、scPipeがシングルセルATAC-SeqおよびRNA-Seqデータ解析のための有効で柔軟なツールであることが検証されました。