Recent BioRxiv on Bioinformatics: June 18, 2024
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 1: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
分子プロファイリング技術を通じて得られたデータに基づいて予測モデリングを行うために、分子分析学ではますます機械学習(ML)が利用されています。しかし、生理学的な表現型を正確に捉える堅牢なモデルを開発することは、生物学的システム固有のダイナミクス、分析手順から生じる変動性、十分に代表的なデータセットを得るためのリソース集約的な性質といった多くの要因によって困難に直面しています。
新規性:
この文脈において、我々は新しい方法「Contextual Out-of-Distribution Integration(CODI)」を提案し、評価しました。CODIは実験観察に基づいて、実際のアプリケーションで遭遇する未表現の変動源を既存の分子フィンガープリントデータセットに統合する合成データを生成します。データセットに分布外の変動を追加することで、CODIはMLモデルが初期のトレーニングデータを超えたサンプルに対してより一般化するのに役立ちます。
方法:
3つの独立した縦断的臨床研究と1つの症例対照研究を使用して、人間の血液の振動分光法に関わるいくつかの分類シナリオにCODIの適用を実証しました。我々のアプローチは、複数年にわたる縦断的分子モニタリングのための個別化フィンガープリントを可能にし、疾患検出のために訓練されたMLモデルの堅牢性を向上させる能力を示しました。比較分析では、分類ワークフローにCODIを組み込むことで、一貫して分類精度が大幅に向上し、広範な実験観察を集める必要性を最小限に抑えることができることが示されました。
CODI: Enhancing machine learning-based molecular profiling through contextual out-of-distribution integration
Eissa, T., Huber, M., Obermayer-Pietsch, B., Linkohr, B., Peters, A., Fleischmann, F., Zigman, M. 2024-06-17 http://biorxiv.org/cgi/content/short/2024.06.15.598503v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 2: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
現在、薬物開発の分野では動物モデルから人間の病気への研究成果の翻訳が重要な部分を占めています。しかしながら、動物での有望な前臨床試験結果が人間の病理生理学に翻訳される例はごく少数です。これは、特定の目的に最も適した動物モデルを正確に評価し、種間の翻訳可能性を保証するための新しいデータ分析戦略の必要性を強調しています。
新規性:
このニーズに応えるために、我々はIn Silico Treatment (IST)という計算方法を提示します。これは、動物モデルと人間との間で疾患関連の分子表現パターンの翻訳を評価するためのものです。動物で観察された変化を人間にシミュレートすることにより、ISTは動物モデルが人間の病気の主要な側面をどの程度再現しているか、または治療が病原表現パターンを健康なものに変えるかの全体像を提供します。さらに、ISTは病態形成の分子特徴や薬物の作用モードに影響を与える特定の遺伝子を浮き彫りにします。
方法:
ISTの可能性を示すために、我々はバルクトランスクリプトミクスデータを使用した3つのアプリケーションで潜在性を実証しました。第一に、特発性肺線維症(IPF)の二つのマウスモデルを評価しました。一つはチューブ内ブレオマイシン露出による損傷を伴うモデル、もう一つはアデノ関連ウイルスによって誘導されるTGFβ1媒介組織変換(AAV6.2-TGFβ1)モデルです。これらのモデルは、人間のIPFにおける細胞外マトリックスの乱れに類似した遺伝子発現パターンを示しましたが、VEGFによる血管新生において違いが観察されました。第二に、非アルコール性脂肪肝炎(NASH)のマウスモデルの既知の特徴を確認しました。これには、コリン欠乏、Lアミノ酸定義食(CDAA)、四塩化炭素肝毒性損傷(CCl4)、胆管結紮手術(BDL)が含まれます。全体的に、これら三つのマウスモデルは人間のNASHにおける線維化に関連する発現変化を再現しましたが、脂質代謝、炎症、アポトーシスにおいてモデル固有の違いが見られました。第三に、NASHの実験的治療であるElafibranorの強力な抗線維化シグネチャーとPPARシグナリングの誘導をCDAAモデルで再現しました。IPFとNASHのアプリケーションでISTで行った発見に寄与する既知の病気関連遺伝子の貢献を検証しました。データセットを統合し比較するためのインタラクティブアプリを含む完全なデータ統合ISTフレームワークは、オープンソースのRパッケージとして提供されています。
In Silico Treatment: a computational framework for animal model selection and drug assessment
Picart-Armada, S., Becker, K., Kaestle, M., Krenkel, O., Simon, E., Tenbaum, S., Strobel, B., Geillinger-Kaestle, K., Fundel-Clemens, K., Matera, D., Lincoln, K., Hill, J., Viollet, C., Streicher, R., Thomas, M., Jensen, J. N., Haslinger, C., Klein, H., Werner, M., Huber, H., Broermann, A., Fernandez-Albert, F. 2024-06-17 http://biorxiv.org/cgi/content/short/2024.06.17.599264v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 3: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
この最新の研究論文の内容を、背景、新規性、方法などに分けて詳しく説明します。
背景:
単一細胞トランスクリプトーム学は、細胞の異質性を理解するための強力な手段を提供しています。複数の生物学的サンプルを含む大規模研究は、標的集団のより良い特徴付けを通じて、より高い信頼性を持つ差異発現バイオマーカーの発見の可能性を秘めています。しかし、これらの実験の階層的な性質は、下流の統計解析にとって大きな課題となっています。実際、多数の差異発現方法が存在するにも関わらず、単一細胞の発現プロファイルの患者内相関を正確に扱うことができるものはほんの一握りです。さらに、これらの方法のいくつかに関連する高い計算コストのため、実用性には限界があります。
新規性:
本稿では、多標本scRNA-seqデータにおける階層的相関構造に対処するさまざまな戦略の包括的評価を行います。最小限の仮定で元の相関構造を保持しつつ、シミュレーターから生成された合成データを使用し、方法の性能をベンチマークするための堅牢なプラットフォームを提供します。我々の分析により、患者内相関を無視することが第一種の過誤(type I error)の制御を危険にさらすことが示されました。
方法:
我々は、以前の報告と一致し、他の報告とは対照的に、ポアソン一般化推定方程式(Poisson Generalized Estimation Equations, GEEs)がこれらの問題に対処するための有用で柔軟な枠組みを提供することを示します。また、擬似バルクアプローチが一貫して単一細胞レベルの方法よりも優れていることを示します。本研究では、GEEの有用性と、擬似バルクアプローチとの相対的な性能に関する矛盾する結果を解決します。したがって、我々は遺伝子発現モデリングの複雑な風景を航行する研究者にとって貴重なガイドラインを提供し、データセットの特定の構造と設計に基づいて最も適切な方法を選択するための洞察を提供します。
Strategies for addressing pseudoreplication in multi-patient scRNA-seq data
Malfait, M., Gilis, J., Van den Berge, K., Assefa, A. T., Verbist, B., Clement, L. 2024-06-17 http://biorxiv.org/cgi/content/short/2024.06.15.599144v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 4: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
従来のデ・ノボ薬物発見は高コストで時間がかかり、失敗率も高いという課題があります。これに対し、薬物の再利用(Drug Repurposing, DR)は、これらの課題に対する解決策を提供する可能性があります。既存の薬物が新たな病気に対して効果があるかもしれないという発見は、開発プロセスを加速し、コストを削減することができます。
新規性:
本研究では、DR3E-Netという新しいin-silico薬物再利用フレームワークを導入しています。このフレームワークは、薬物によって影響を受ける遺伝子発現の埋め込みベクトル、疾患に関連する差異発現遺伝子(Differentially Expressed Genes, DEGs)、および薬物副作用情報を統合しています。DR3E-Netは、薬物の機能的な類似性を予測するとともに、患者の疾患関連DEGsと薬物副作用情報を考慮に入れることを目的として開発されました。
方法:
DR3E-Netは、LINCS L1000データセットを利用しており、前処理後に680,909のサンプル、3,820の薬物、そして977の遺伝子を含んでいます。このデータセット上で深層埋め込みモデルを訓練し、977次元ベクトルを32次元の単位超球面埋め込みに変換します(ステップ1)。その後、これらの埋め込み間のコサイン類似度(Cosine Similarity, CS)を計算します。さらに、疾患(本研究ではアルツハイマー病)にリンクされたDEGに対するアゴニスト薬物をステップ1の結果と統合します(ステップ2)。最後に、SIDERおよびSAEDR/DRIPデータベースをステップ2の統合結果と組み合わせます(ステップ3)。アルツハイマー病の薬物であるドネペジル、ガランタミン、メマンチンに対する潜在的な代替薬候補を予測するためにDR3E-Netが利用されました。深層埋め込みモデルによって予測された薬物(ステップ1)はCRTAP遺伝子に対するアゴニスト薬物と組み合わされ、それぞれ111、86、96の薬物となりました(ステップ2)。最後に、前述の薬物結果に薬物副作用情報を組み入れることで、それぞれ21、15、18の薬物が得られました(ステップ3)。
DR3E-Net: Drug Repurposing Network Framework Based on Deep Embedding, Differentially Expressed Genes, and Drug Side Effects
Bhak, Y. 2024-06-17 http://biorxiv.org/cgi/content/short/2024.06.15.599138v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 5: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
スライドタグ法(Slide-tags method)はRussellらによって開発された技術で、空間的なタグを細胞核に転送することで、細胞の位置情報を得ることができます。従来の空間シークエンシング技術は、予めインデックス付けされたアレイに基づいており、光学的な手法を必要としていました。
新規性:
再分析によって、スライドタグ法による核への空間タグの転送中に形成される、隠された空間情報を持つネットワークが発見されました。このネットワークの構造から、空間インデックスのグラウンドトゥルース(基準情報)がなくても細胞の位置を推測することができることが分かりました。これは、従来の技術とは根本的に異なる新しい世代の光学を用いないネットワークベースのイメージング・バイ・シークエンシングアプローチに位置づけられます。
方法:
スライドタグ法のデータを再分析することで、これまで見過ごされていたネットワークの存在を明らかにしました。このネットワークは、細胞の空間的配置を示す情報を含んでおり、新しいタイプのシークエンシング技術の一つとして機能します。具体的な方法論についての詳細は、与えられた文脈からは読み取れませんが、従来の空間シークエンシングと比較して、光学的なデバイスに依存しない点が特徴です。
この再分析から、スライドタグ法が、空間情報を持つネットワークを形成し、細胞の位置情報を推定する上で新たな可能性を秘めていることが示唆されています。これにより、細胞の空間的な理解を深めることができるとともに、新しい生物学的洞察を得る道が開かれることになります。
Hidden network preserved in Slide-tags data allows reference-free spatial reconstruction
Dahlberg, S. K., Bonet, D. F., Franzen, L., Stahl, P. L., Hoffecker, I. T. 2024-06-17 http://biorxiv.org/cgi/content/short/2024.06.16.598614v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 6: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
生物学的な複雑な現象を解明するためには、分子間の相互作用ネットワークを推測することが重要です。これらのネットワークは、さまざまなデータソースから、また異なる解像度で構築することができ、生物学的状態の変化に伴う遺伝子間の相互作用パターンの変化など、グラフレベルでの違いを比較する機会を提供します。このグラフ比較問題の重要性を踏まえ、意味のある違いを識別できる堅牢でスケーラブルな方法への需要が高まっています。
新規性:
本論文では、グラフ差分解析のための新しい方法であるnode2vec2rank(n2v2r)を紹介しています。この方法は、共同潜在埋め込み空間におけるノードの表現の違いに基づいてノードをランク付けします。従来のバッグオブフィーチャーズアプローチを改善し、機械学習と統計学の最近の進歩を利用して、より高次の構造でグラフを比較し、データ駆動型の方法で行います。
方法:
n2v2rは、マルチレイヤースペクトル埋め込みアルゴリズムとして定式化されており、計算効率が高く、安定性を重要な特徴として取り入れています。また、実際のデータサイエンスの原則に従い、グラフ間の違いの正しいランキングを証明可能に同定する全体的な手順を提供します。データにより適応することで、node2vec2rankは複雑な違いを見つける際に、一般的に使用されるノードの次数よりも優れた性能を示しました。
実世界での応用例として、乳がんサブタイプの特徴付け、単一細胞データにおける細胞周期の分析、肺腺癌における性差の検索などがあります。node2vec2rankはこれらの応用において、治療候補に関する仮説生成を可能にする意味のある生物学的違いを見つけました。本論文で紹介された解析に使用されたソフトウェアおよび解析パイプラインは、一般に公開されています。
node2vec2rank: Large Scale and Stable Graph Differential Analysis via Multi-Layer Node Embeddings and Ranking
Mandros, P., Gallagher, I., Fanfani, V., Chen, C., Fischer, J., Ismail, A., Hsu, L., Saha, E., DeConti, D. K., Quackenbush, J. 2024-06-17 http://biorxiv.org/cgi/content/short/2024.06.16.599201v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 7: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
現代の生物学において、細胞の状態を完全に把握するためには、ゲノム、エピゲノム、トランスクリプトーム、プロテオームなど、様々なオミクスデータを総合的に分析する必要があります。これらのデータは複雑で、時には矛盾する測定結果を含むことがあります。疾患の分析においては、異なるオミクスデータタイプを横断的に観察することで、予期しない患者グルーピングが明らかになり、臨床成績や治療法に情報を提供する可能性があります。
新規性:
我々が提案する「Multi-omic Pathway Analysis of Cancer(MPAC)」は、多層オミクスデータを生物学的経路からの事前知識を通じて解釈する計算フレームワークです。MPACは、経路内でエンコードされたネットワーク関係を因子グラフを用いて利用し、多層オミクスデータからタンパク質と関連経路エンティティのコンセンサス活性レベルを推測します。これにより、臨床的に関連する可能性のあるタンパク質を優先するために、生物学的サンプルを経路活性によってグルーピングします。
方法:
MPACは、まず多層オミクスデータからタンパク質と関連経路エンティティの活性レベルを推測します。次に、偽の活性予測を排除するために順列検定を実行します。そして、経路活性に基づいて生物学的サンプルをグルーピングし、臨床的に関連する可能性があるタンパク質を特定します。頭頸部扁平上皮癌患者のDNAコピー数変化とRNAシーケンスデータを例に、MPACがどちらのオミクスデータタイプを単独で分析した場合には同定されなかった免疫応答に関連する患者サブグループを予測することを示しました。このサブグループを通じて同定されたキープロテインは、臨床成績や免疫細胞構成と関連する経路活性を持っています。MPACのRパッケージは、https://bioconductor.org/packages/MPAC で入手可能であり、新しいデータセットに対する同様の多層オミクス分析を可能にします。
MPAC: a computational framework for inferring cancer pathway activities from multi-omic data
Liu, P., Page, D., Ahlquist, P., Ong, I. M., Gitter, A. 2024-06-17 http://biorxiv.org/cgi/content/short/2024.06.15.599113v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 8: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
この最新論文では、高分解能質量分析を用いた非標的メタボロミクスにおける化合物の同定方法に関する研究が行われています。
背景:
非標的メタボロミクスでは、試料中の多くの代謝物質を同時に分析します。この分析には、高分解能質量分析が用いられ、得られた生成イオンスペクトル(product ion spectra)の網羅的な注釈付け(アノテーション)が行われます。これまで、様々なデータベース検索手法が用いられてきましたが、偽陽性(false positives)の問題があります。すなわち、データベースに照合した結果が実際には存在しない化合物である可能性があるため、偽発見率(FDR)を制御する方法が求められています。
新規性:
本研究では、FDRを制御する2つの新しい方法を提案しています。1つ目の「擬似ターゲットデコイ法」では、正のイオンモードスペクトルをターゲットとして扱い、負のイオンモードスペクトルをデコイに変換することで、別途デコイデータベースを作成することなくFDRを推定します。2つ目の「セカンドランク法」では、化合物検索から得られたセカンドランクヒットのスコア分布を、トップランクヒットの偽陽性分布の近似として使用します。
方法:
これらの方法の性能は、MassBankからの生成イオンスペクトルをSIRIUS 5 CSI:Finger IDスコアリング方法を用いてアノテーションすることで評価されました。結果として、セカンドランク法は実際のFDR 0.05により近いことが示されました。4つのヒトメタボロミクスデータセットに適用した場合、セカンドランク法は擬似ターゲットデコイ法よりも保守的な結果を提供しました。
まとめ:
この研究は、非標的メタボロミクスにおけるFDR制御のためのこれらのシンプルな方法の有用性を示しており、より信頼性の高い化合物同定と新規代謝物質の発見の可能性を促進しています。
Data processing of product ion spectra: Methods to control false discovery rate in compound search results for non-targeted metabolomics
Matsuda, F. 2024-06-17 http://biorxiv.org/cgi/content/short/2024.06.16.599235v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 9: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
微生物群集動態を理解するためには、メタゲノム配列内のバクテリオファージ(ファージ)を特定することが不可欠です。トランスフォーマーベースのファウンデーションモデルは、様々な生物学的課題に対処するために成功裏に用いられてきました。しかしながら、これらのモデルは通常、ラベルの変動を事前学習データに考慮せずに自己教師ありタスクで事前学習されます。これは、バクテリアとファージのデータが混合された状態での事前学習において、バクテリアとファージのサンプル間の不均衡による情報バイアスを生じる可能性があるため、ファージ特定の課題を提示します。
新規性:
本研究では、事前学習中にラベルを組み込む新しい条件付きBERTフレームワークを提案しました。ラベル制約を組み込んだ修正された言語モデリングタスクを用いて、ラベルデータの事前学習のための条件付きBERTモデルを開発するアプローチを提案しています。このアプローチにより、モデルはラベル条件付きのシーケンス表現を獲得することができます。さらに、条件付きBERTをファインチューニング段階で分類器として利用する解決策も提案しました。
方法:
この条件付きBERTフレームワークを用いて、新しいファインチューニング戦略「PharaCon」を導入し、ファージの特定に応用しました。PharaConは、シミュレートされたシーケンスデータセットと実際のメタゲノムコンティグデータセットの両方において、既存のいくつかの方法と比較して評価されました。その結果、PharaConはファージ特定のための効果的かつ効率的な方法である可能性を示し、混合シーケンスデータの事前学習中にラベル特異的な表現を学習するための解決策としての条件付きBERTの有効性を強調しました。
PharaCon: A new framework for identifying bacteriophages via conditional representation learning
Bai, Z., Zhang, Y.-z., Pang, Y., Imoto, S. 2024-06-17 http://biorxiv.org/cgi/content/short/2024.06.16.599237v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 10: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
ショットガンメタゲノムシーケンシングの技術は、多くの環境モニタリングタスクに適応されていますが、糞便起源追跡(Fecal Source Tracking, FST)研究においては、糞便に由来する微生物集団の起源特異性に関する知識が不足しているため、源泉帰属には不向きです。レクリエーション水域のFST研究でよく問題となる広範囲および狭範囲の源泉カテゴリー(例えば、猫、犬、牛、カモメ、鶏、豚、鳥類、反芻動物、人間の糞便、下水)から糞便に由来する原核生物種を代表する大規模なゲノムコレクション(n=26,018)を体系的にレビューし、キュレートしました。
新規性:
これらのデータは、メタゲノムおよび分離ベースの研究から回収されたゲノムシーケンスを含んでおり、源泉カテゴリー間での傾向を特徴づけるために比較ゲノミクスのアプローチを広範囲にわたって検討しました。これにより、各源泉カテゴリーに対する最終的なゲノムデータベースを作成し、オンライン上で利用可能にしました(n=12,730)。これらの源泉から回収されたゲノムの総数は、カモメではゼロから豚では9,085まで大きく異なります。利用可能なデータによると、種レベルの集団を代表するゲノムの平均81%は単一の源泉内でのみ発生します。
方法:
糞便スラリーを用いて、各源泉データベースのパフォーマンスをテストし、糞便源のアルファ多様性およびデータベースサイズに応じて変化するリードキャプチャ率を報告しました。最後に、牛やその他の反芻動物のルーメンシステムには広範な研究が行われているにもかかわらず、これらの動物の糞便における原核生物のゲノム特性評価が不足していることに言及しています。
期待される影響:
このリソースがFST関連の目的、ワンヘルス研究、および世界的な衛生努力に役立つことが期待されています。
Advancing source tracking: systematic review and source-specific genome database curation of fecally shed prokaryotes
Lindner, B. G., Choudhury, R. A., Pinamang, P., Bingham, L., D'Amico, I., Hatt, J. K., Konstantinidis, K. T., Graham, K. E. 2024-06-17 http://biorxiv.org/cgi/content/short/2024.06.14.598882v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 11: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
Porto-sinusoidal vascular disease (PSVD)は、肝硬変の欠如、ポータル高血圧の有無、組織学的病変の有無によって特徴付けられる複雑で稀な肝臓疾患です。この疾患の病因は未だに明らかではなく、そのメカニズムに関する知識には大きなギャップがあります。そこで、PSVDの患者における予後、診断、治療オプションの改善を促進するために、オミクスベースのアプローチを用いて、PSVDに関連する経路をさらに解明しました。
新規性:
この研究では、PSVDの病理メカニズムを理解するため、遺伝子発現プロファイリングとネットワーク分析を組み合わせた新しいアプローチを採用しました。特に、遺伝子共発現ネットワークを用いて、PSVDの診断に関連する遺伝子の相互関係を明らかにし、これらの遺伝子が関わる生物学的プロセスを特定しました。
方法:
本研究では、11個の組織学的に正常な肝生検サンプルと18個のPSVD肝生検サンプルを含むマイクロアレイデータセット(GEO:GSE77627)を使用しました。まず、差異遺伝子発現解析を行い、次に遺伝子セットエンリッチメント解析を用いて、濃縮された生物学的経路を同定しました。加えて、診断に関連する遺伝子の相互接続モジュールを同定するために、重み付き遺伝子共発現分析というネットワークベースのアプローチが実施されました。これらのモジュールで濃縮された経路をさらに研究することで、PSVDに関与するメカニズムを説明するプロセスの同定が可能となり、また、遺伝子ネットワークはプロセス間の接続を理解するためにも使用されました。
結果:
差異遺伝子発現の遺伝子セットエンリッチメントでは、シグナリングおよび細胞周期に関連するプロセスの増加と、代謝に関連するプロセスの減少が示されました。共発現ネットワークとモジュール解析により、これらの結果がさらに検証され、GPCRシグナリング、エネルギー代謝、細胞移動に関連するプロセス間の接続が明らかにされました。さらに、フィブリン凝固形成プロセス、炎症および免疫応答、細胞周期および呼吸プロセス間の追加的な接続も同定されました。
結論:
PSVD患者では、シグナリングおよび代謝に関連するプロセスが乱れています。さらに、二つの三角形の接続(GPCRシグナリング-エネルギー代謝-細胞移動とフィブリン凝固形成-炎症と免疫応答-細胞周期と呼吸)が、PSVDの病因に関与するユニークな未知の接続を明らかにしました。
GSEA and co-expression network approach to identify molecular processes affected in Porto-sinusoidal Vascular Disease
Iyer, A., Kutmon, M., Evelo, C., Doornbos, C., Ehrhart, F. 2024-06-17 http://biorxiv.org/cgi/content/short/2024.06.14.599028v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 20: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
黄色ブドウ球菌(Staphylococcus aureus)は、半世紀にわたり新しい抗生物質が導入されるたびに耐性を発達させてきた病原体であり、特にmecA遺伝子の獲得によって顕著です。このバクテリアの抗生物質耐性は、大きな公衆衛生上の問題を表しています。現在、アクセサリー遺伝子(agr)の調節性クオラム検出システムを標的とした薬剤やワクチンの設計といった新たな革命が進行中です。S. aureusの病原性や抗生物質耐性は、このシステムの介入によって調節可能であることが示されています。
新規性:
本研究では、植物のmiRNAがヒトのトランスクリプトを横断して調節するという最近の研究成果に基づき、S. aureusのagrシステムおよびmecA遺伝子を標的とする植物由来のmiRNAを同定するためのin silico(コンピュータ上のシミュレーション)研究に基づいた新しい治療法の設計を提案しています。全20643種類の成熟植物miRNAの中から、選択基準である最小自由エネルギー(MFE)が-25kcal/mol以上のものとして、S. aureusの選択された遺伝子を標的とする可能性のある29種類のmiRNAが同定されました。そのうち、熱力学的安定性に基づいて15種が選ばれました。
方法:
興味深いことに、ポプラス・トリコカルパ(Populus trichocarpa)の種子から得られたptc-miR171gおよびptc-miR171hは、ほぼ同じ成熟miRNA配列を持ち、RNAIII遺伝子のUCCC領域を標的としていることがわかりました。植物由来のmiRNAがS. aureusを標的とすることは、将来的な代替療法として開発される可能性を秘めています。私たちの知る限り、これは病原性バクテリアを標的とする植物由来のmiRNAをin silicoで同定することによる将来の治療代替法としては初めての試みです。
Plant miRNAs Anti-Staphylococcus aureus: Therapeutic Perspective
Gharsallah, C. 2024-06-15 http://biorxiv.org/cgi/content/short/2024.06.13.598803v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 21: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
この研究では、cis-またはtrans-調節メカニズムによって主に影響を受けるスプライシングイベントを区別するための計算手法であるisoLASERを紹介しています。この手法は、長いリードのRNAシークエンスデータを利用しており、ハプロタイプとエキソンセグメント間の調整済み相互情報を計算し、アレル特異的なスプライシングイベントを感度良く同定します。これにより、ヒトデータで2,047個、マウスデータで4,679個のユニークなエキソン領域がcis-指向のスプライシングを示していることを特定しました。さらに、isoLASERは少数のサンプルを共同で使用することで、以前の関連研究で大規模なサンプルコホートを使用してのみ特定可能であったスプライシング関連変異を明らかにします。特に、isoLASERは長いリードのRNAシークエンスデータのみを使用してHLAタイピングを可能にし、HLA遺伝子のアレル特異的スプライシングを明らかにしました。脳組織では、MAPT、BIN1、MS4A6Aなどのアルツハイマー病関連遺伝子にリンクした変異を同定しました。この研究は、限られたサンプルサイズのコホートにおいても、遺伝的および非遺伝的に駆動されるスプライシングおよび関連する変異を特定するための枠組みを確立しています。
背景:
スプライシングイベントの遺伝的基盤を解明するためには、cis-指向のスプライシングイベントを同定することが重要です。これまでの研究では、大規模なサンプルコホートを必要としていましたが、新しい手法を用いることで少数のサンプルでも効率的にスプライシング関連変異を特定することが可能になります。
新規性:
isoLASERは、長いリードのRNAシークエンスデータを利用する新しい計算手法であり、アレル特異的なスプライシングイベントを感度良く同定する能力を持っています。これにより、従来のトランスクリプトレベルのアプローチでは同定できなかったスプライシングイベントを識別できます。
方法:
isoLASERはハプロタイプとエキソンセグメント間の調整済み相互情報を計算し、cis-またはtrans-調節メカニズムによって影響を受けるスプライシングイベントを区別します。この方法を用いて、ヒトとマウスのデータからcis-指向のスプライシングを示すユニークなエキソン領域を大量に特定しました。また、HLA遺伝子のアレル特異的スプライシングを含む、スプライシング関連変異を明らかにすることができます。
Long-read RNA-seq demarcates cis- and trans-directed alternative RNA splicing
Quinones-Valdez, G., Amoah, K., Xiao, X. 2024-06-14 http://biorxiv.org/cgi/content/short/2024.06.14.599101v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 22: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
遺伝子変異の影響を評価するために開発された計算ツールであるVariant effect predictors (VEPs)は、変異の病原性の可能性を評価するために様々なアルゴリズムとトレーニングデータを使用します。これらのツールは、病原性と考えられる良性のミスセンス変異を区別する能力について、多くの場合、異なるパフォーマンスを示します。
新規性:
本研究では、35のVEPツールのパフォーマンスを963のヒトのタンパク質コーディング遺伝子にわたって評価し、受信者操作特性曲線(receiver operating characteristic curve, AUROC)という広く使用されるメトリックを用いて、遺伝子レベルでの異質性がかなりあることを明らかにしました。これまでの研究では、VEPのパフォーマンスに関する遺伝子レベルでの予測可能性や異質性の起源についてはあまり注目されていませんでした。
方法:
研究者たちは、各VEPの遺伝子レベルでのAUROCを予測するためにランダムフォレストモデルをトレーニングしました。その結果、AUROCによって測定されるパフォーマンスは、遺伝子の機能、タンパク質の構造、進化的保存状態などの要因に関連していることがわかりました。特に、タンパク質の内在的無秩序は、弱く保存された考えられる良性変異の富化によってAUROC値が過大評価されることが多い、明らかなVEPパフォーマンスに影響を与える重要な要因として浮かび上がりました。
結論:
本研究の結果は、VEP予測の信頼性が高いか低いかを識別するために、遺伝子レベルの特徴が有用である可能性を示唆しています。しかし同時に、異なる遺伝子間でのVEPパフォーマンスを比較する際のAUROCの限界も浮き彫りにしています。
Understanding the heterogeneous performance of variant effect predictors across human protein-coding genes
Fawzy, M., Marsh, J. A. 2024-06-14 http://biorxiv.org/cgi/content/short/2024.06.12.598724v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 23: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
RNAの3D構造予測は、分野の進歩にもかかわらず、依然として大きな挑戦です。たんぱく質に対してAlphaFoldが成功を収めたものの、RNA構造予測は、たんぱく質とRNAの基本的な違いにより、直接適応することが困難です。AlphaFoldの最新版であるAlphaFold~3は、DNA、リガンド、RNAなど、さまざまな分子に対応する範囲を広げました。この記事では、最後のCASP-RNAデータセットの結果について議論していますが、RNAに対するパフォーマンスと制限は不明確です。本稿では、RNA 3D構造の予測におけるAlphaFold~3のパフォーマンスについてレビューします。4つの異なるテストセットにわたる広範なベンチマークを通じて、AlphaFold~3のパフォーマンスと制限について議論します。また、既存の最先端のアブイニシオ法、テンプレートベースのアプローチ、およびディープラーニングアプローチ10種とのパフォーマンスを比較します。私たちの結果はEvryRNAプラットフォームで自由に利用可能です:https://evryrna.ibisc.univ-evry.fr/evryrna/alphafold3。
背景:
RNAの3D構造予測は、RNA分子の機能理解に不可欠であるにも関わらず、その予測は複雑で難しい問題です。AlphaFoldはたんぱく質の構造予測において革命的な進歩を遂げましたが、RNAはたんぱく質とは異なる特性を持つため、同様の手法を適用するのが難しいです。
新規性:
AlphaFold~3は、たんぱく質だけでなく、RNAやDNA、リガンドなど複数の分子に対する構造予測を可能にしました。この研究では、新たにAlphaFold~3を用いてRNAの3D構造を予測し、その結果を既存の最先端技術と比較することで、RNA構造予測におけるAlphaFold~3の有効性を評価しています。
方法:
研究では、4つの異なるテストセットを用いてAlphaFold~3のベンチマークを実施し、そのパフォーマンスと制約を詳細に分析しました。さらに、アブイニシオ法、テンプレートベースのアプローチ、ディープラーニングアプローチを含む10の既存の最先端技術との比較を行いました。これにより、RNA構造予測の分野におけるAlphaFold~3の立ち位置を明確にしました。
以上の内容をまとめると、この論文はRNAの3D構造予測におけるAlphaFold~3の性能を詳細に検証し、他の先進的な手法との比較を通じてその新規性と有効性を示しています。また、EvryRNAプラットフォームを通じて結果を公開することで、研究コミュニティに対する透明性を高め、今後の研究の基盤を築いています。
Has AlphaFold~3 reached its success for RNAs?
Bernard, C., Postic, G., Ghannay, S., Tahi, F. 2024-06-14 http://biorxiv.org/cgi/content/short/2024.06.13.598780v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 24: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
パンゲノムは、特定の分類群に属するすべてのメンバーに共通するコア遺伝子と、一部のメンバーにのみ存在するアクセサリー遺伝子から構成されています。これは進化の理解を進める鍵であり、医学的な課題に対処するための重要な要素です。バクテリアの遺伝子間にはゲノム内で強い相関関係があることがわかっています。
新規性:
本研究では、大腸菌(Escherichia coli)、リステリア・モノサイトゲネス(Listeria monocytogenes)、黄色ブドウ球菌(Staphylococcus aureus)、カンピロバクター・ジェジュニ(Campylobacter jejuni)のそれぞれにおいて、ゲノム内のバクテリア遺伝子間に強い相関関係があることを発見しました。畳み込みニューラルネットワークを用いたコアゲノムノックアウトシミュレーションにより、20個未満の高変動性コア遺伝子の異なる組み合わせが、完全なコアゲノムによって分類された亜種タイプを95%以上の精度で復元できることを見出しました。
方法:
この観察結果に基づき、52,000以上のアセンブリを含む各種のデータセットにおいて、高変動性コア遺伝子の組み合わせが、同一ゲノム内の他のコア遺伝子の配列変異を予測する(平均精度94%以上)ことができるかどうかを検証しました。また、これらの遺伝子の組み合わせは、アクセサリー遺伝子の配列変異(平均精度91%以上)や存在(平均AUROC >0.91)を予測することもできました。さらに、高変動性コア遺伝子の組み合わせは、大腸菌、黄色ブドウ球菌、結核菌(Mycobacterium tuberculosis)の公開データセットにおける複数の抗生物質耐性(AUROC >0.80)も予測することができました。
結論:
これらの結果から、同一ゲノム内の遺伝子間には強い相関関係が存在することが示唆されます。したがって、菌株の系統分類や他の遺伝子の状態は、高変動性コア遺伝子の組み合わせによって一様に表現可能であり、これによって体外耐性を含む特定の表現型を代表することができると提案されています。
Intra-genomic genes-to-genes correlation enables genome representaion
Chen, J., Ma, X., He, J., Wang, Y., Ren, Y., Qi, L., Song, L., Ruan, L., Fan, C., Jiang, J., Bap, Y., Huang, T., Cheng, J., Liu, X., Chen, F., Huang, Y., Zhao, N., Guo, C. 2024-06-14 http://biorxiv.org/cgi/content/short/2024.06.12.598634v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 25: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
限定プロテオリシスと質量分析(LiP-MS)は、細胞内の広範囲なタンパク質の構造変化を調べる手法です。この技術は、タンパク質がどのように変化するかをin situ(生体内の状態で)で観察することを可能にします。しかし、LiP-MSによって得られる信号には、タンパク質の構造変化だけでなく、タンパク質の存在量の変化など他の要因からの信号も含まれており、これらを区別することは難しい課題でした。
新規性:
本論文では、タンパク質の構造効果によるものではないLiP信号の望ましくない変動を除去する第一ステップと、その後で関心のある変数の効果を残りの信号に推定する第二ステップという、二段階アプローチを提案しています。これにより、LiP-MS信号を解読し、タンパク質の構造変化を推定するための強力な手法を提供することができます。
方法:
この研究では、三種類の生物種におけるLiP-MSデータを使用し、提案されたフレームワークがLiP-MS信号を解読し、タンパク質の構造変化を推定するのに有効であることを実証しています。まず、LiP信号からタンパク質の構造変化に起因しない変動を取り除きます。次に、残された信号に対して、関心のある変数の効果を推定することで、タンパク質の構造変化をより正確に理解することができます。
このアプローチは、従来のLiP-MS分析に比べて、タンパク質の構造変化のみに焦点を当てたより精密な情報を提供することが期待されます。また、プロテオームワイドスケールでの構造的洞察を提供することで、生物学的なプロセスの理解を深めることに寄与する可能性があります。
Enhancing the biological insight from limited proteolysis-coupled mass spectrometry
Nagel, L., Grossbach, J., Cappelletti, V., Doerig, C., Picotti, P., Beyer, A. 2024-06-14 http://biorxiv.org/cgi/content/short/2024.06.12.598633v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 26: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
適応免疫受容体レパートリー配列解析(Adaptive Immune Receptor Repertoire sequencing, AIRR-seq)は、健康と病気の状態における適応免疫システムのダイナミクスを理解するために重要です。AIRR-seqデータの信頼性のある分析には、正確な免疫グロブリン(Immunoglobulin, Ig)配列のアライメントが不可欠です。様々なIg配列アライナーが存在しますが、AIRR-seqデータの複雑さを表現する統一されたベンチマーク基準がなく、タスク間でのアライナーの客観的な比較が困難です。
新規性:
本論文では、GenAIRRという効率的なシミュレーションフレームワークを紹介します。GenAIRRは、V(D)J組換え、体細胞超突然変異、および様々なシーケンスの破損など、Ig配列の複雑さを現実的にシミュレートすることができます。これにより、Ig配列とそのグラウンドトゥルース(基準真値)を生成することが可能になります。
方法:
GenAIRRを用いて生成されたデータセットを使用し、著名なIg配列アライナーを様々な指標を通じて包括的に評価しました。これにより、各アライナーのユニークなパフォーマンス特性が明らかになりました。提案された厳格な評価基準と組み合わせることで、免疫遺伝学の計算ツールの偏りのないベンチマーキングのための確固たる基盤が確立されました。
結論:
この研究は、Ig配列アライメントという重要なタスクのさらなる改善のための基盤を築き、適応免疫に対する私たちの理解を高めることに貢献します。GenAIRRによって生成されたデータセットは、Ig配列アライナーの能力を公平に比較するための新しいスタンダードを提供することになります。
An unbiased comparison of immunoglobulin sequence aligners
Konstantinovsky, T., Peres, A., Polak, P., Yaari, G. 2024-06-14 http://biorxiv.org/cgi/content/short/2024.06.12.598680v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 27: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
トポロジカルにアソシエーティングドメイン(TADs)は、3次元(3D)ゲノム構造の基本単位として認識され、遺伝子の調節において重要な役割を果たしています。しかし、希薄なクロマチン接触マップからTADsを正確に識別すること、およびTAD内の構造的および機能的要素を探求することは困難です。
新規性:
この研究では、TADGATE(Graph Attention Auto-Encoder)という新しいモデルを開発しました。このモデルは、非常に希薄な接触マップからもTADsを正確に識別することができ、基盤となるトポロジカル構造を保持または強化しながら、推測されたマップを生成することができます。TADGATEは、TAD内における異なる特徴を持つ2種類の単位に特有の注意パターンを捉える能力を持っています。
方法:
TADGATEはグラフアテンションメカニズムを用いており、クロマチンコンパートメント化とTADの組織が密接に関連していることを発見しました。異なるコンパートメント環境におけるTAD境界は、異なる生物学的特性を示します。また、2層の隠れマルコフモデルを使用してTADおよびその内部領域に機能的注釈を付け、TADの全体的な特性と内部の構造的・機能的要素の分布を明らかにしています。
さらに、21種類の人間の組織や細胞株から得られた高度に希薄で雑音の多いHi-C接触マップにTADGATEを適用し、TAD構造の明瞭さを高め、保存された境界と細胞タイプ固有の境界の性質を調査し、トポロジカルドメインに関連する細胞タイプ固有の転写調節メカニズムを明らかにしています。
Uncovering topologically associating domains from three-dimensional genome maps with TADGATE
Dang, D., Zhang, S.-W., Dong, K., Duan, R., Zhang, S. 2024-06-14 http://biorxiv.org/cgi/content/short/2024.06.12.598668v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 28: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
Therapeutics Data Commons (tdcommons.ai)は、治療法のモダリティや薬剤開発の各段階にわたる研究を支援するための統一されたデータセット、AIモデル、ベンチマークを提供するオープンサイエンスイニシアティブです。薬物の発見と開発プロセスにおいて、多様なデータや計算モデルの利用が増加していますが、これらを統合し、多様なデータソースを活用するための共通のフレームワークが求められていました。
新規性:
Commons 2.0 (TDC-2)は、Therapeutic Data Commonsを大幅に改善し、疾病の単一細胞生物学、分子の生化学、薬物の効果を統合した多モーダルデータセット、AIによるAPIエンドポイント、新しい多モーダルタスクとモデルフレームワーク、包括的なベンチマークを通じて、薬物発見のための多モーダルモデル研究を加速します。TDC-2は、約8500万個の細胞にまたがる1000以上の多モーダルデータセット、5つの最先端単一細胞モデルからの事前計算された埋め込み、および生物医学的ナレッジグラフを導入しました。
方法:
TDC-2は、モデルビューコントローラーパラダイムを使用したAPIファースト設計による多モーダルデータアクセスを導入しました。これにより、研究者はAPIを通じてデータセットにアクセスし、モデルを実装・評価することが可能になります。また、TDC-2は、細かい生物学的文脈を持つ7つの新しい機械学習タスクを導入しています。これには、文脈化された薬物-標的同定、単一細胞化学/遺伝的摂動応答予測、タンパク質-ペプチド結合親和性予測タスク、臨床試験結果予測タスクなどが含まれ、抗原処理経路特異的、細胞型特異的、ペプチド特異的、患者特異的な生物学的文脈が導入されています。さらに、15以上の最先端モデルを5つ以上の新しい学習タスクで評価するベンチマークをリリースし、多様な生物学的文脈とサンプリングアプローチでモデルを評価しています。
TDC-2は、文脈特異的学習のための初めてのベンチマークを提供しており、また、タンパク質-ペプチド結合相互作用ベンチマークを導入した最初の例でもあります。これにより、薬剤開発プロセスにおけるAIの活用と、多様な生物学的文脈におけるモデルの有効性を評価するための新たな基盤が整いました。
TDC-2: Multimodal Foundation for Therapeutic Science
Velez-Arce, A., Huang, K., Li, M., Lin, X., Gao, W., Fu, T., Kellis, M., Pentelute, B. L., Zitnik, M. 2024-06-14 http://biorxiv.org/cgi/content/short/2024.06.12.598655v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 29: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
多細胞生物における発生過程や臓器形成には、細胞の空間的配置が重要です。空間オミクスデータを用いたディープラーニングモデルは、高次元空間における細胞、遺伝子、タンパク質間の複雑なパターンや関係を解き明かし、生物学的プロセスや疾患に対する新たな洞察を提供します。特に、ヘマトキシリンとエオシン(H&E)で染色された組織の組織学的画像を用いて、細胞の異質性を特徴づける最先端のインシリコ空間多細胞遺伝子発現手法が注目されています。これらの計算手法は、大量の空間データをスケーラブルかつ自動化された方法で分析する利点を提供し、科学的発見を加速し、より正確な医療診断と治療を可能にします。
新規性:
本研究では、組織学的シグネチャを空間的単一細胞トランスクリプトームシグネチャにマッピングするためのビジョントランスフォーマー(ViT)フレームワークを開発しました。これを「SPiRiT(Spatial Omics Prediction and Reproducibility integrated Transformer)」と名付けています。このフレームワークは、ハイパーパラメータチューニング中のクロスバリデーションとモデル解釈を統合することで強化されています。SPiRiTは、人間の乳がんおよび全身のマウスにおけるマッチした組織病理画像タイルを使用して、単一細胞空間遺伝子発現を予測します。これはXenium(10x Genomics)のデータセットを用いて評価されています。さらに、ViTモデル解釈は、侵襲性がん細胞(FASN)、間質細胞(POSTN)、リンパ球(IL7R)のマーカー遺伝子を含む、ViTモデルが遺伝子発現を予測するために使用する高解像度、高注意領域(HAR)を明らかにしています。人間の乳がんVisium(10x Genomics)データセットを使用したST-Net畳み込みニューラルネットワークアルゴリズムとのリンゴ対リンゴの比較では、SPiRiTは予測精度を40%向上させました。がんバイオマーカー遺伝子の予測と発現レベルは、腫瘍領域のアノテーションと高い一致を示しています。
方法:
この研究で開発されたSPiRiTフレームワークは、組織の形態を用いて空間的単一細胞遺伝子発現を推測する可能性を示しています。これは、人間およびマウスという複数の種、およびマウスの全身形態という複数の臓器にわたっています。モデル解釈とビジョントランスフォーマーを組み込むことは、空間トランスクリプトミクスのための汎用フレームワークとして機能することが期待されています。
Inferring single-cell spatial gene expression with tissue morphology via explainable deep learning
Zhao, Y., Alizadeh, E., Liu, Y., Xu, M., Mahoney, J. M., Li, S. 2024-06-14 http://biorxiv.org/cgi/content/short/2024.06.12.598686v1
下記の文章は論文アブストラクトをもとに Retrieval-Augmented Language Modeling (RALM) により生成された文章であり、正確性は保証しません。
Question 30: 文脈として与えられた最新論文の内容を、背景、新規性、方法などに分けて、詳しく説明してください。
背景:
代謝は遺伝子型と表現型をつなぐ重要なインターフェースとして機能します。遺伝子発現データから代謝物質のレベルを予測する様々な方法がありますが、その効果はまだ十分ではありません。代謝物質のレベルを推測するためには、より効率的で適応性の高いアルゴリズムが求められています。
新規性:
我々は、Multiple Graph-based Flux Estimation Analysis(MGFEA)と呼ばれる新しいアルゴリズムを開発しました。このアルゴリズムは、単一細胞および空間的トランスクリプトームデータを活用することで、代謝物質のレベルを推論することが可能です。さらに、MGFEAは追加のメタボロームデータを利用することで、これらの推論の精度を改善することができます。
方法:
MGFEAは、複数のグラフを基にしたフラックス推定を行うことで、代謝物質のレベルを推測します。単一細胞や空間的トランスクリプトームデータから得られる遺伝子発現情報を利用し、代謝ネットワーク内での各代謝物質の流れ(フラックス)を計算します。また、既存のメタボロームデータを組み込むことで、予測の正確性をさらに向上させることができるという特徴を持っています。これにより、遺伝子発現データだけではなく、実際の代謝物質のプロファイルを考慮に入れたより詳細な代謝状態の解析が可能になります。
Inferring metabolite states from spatial transcriptomes using multiple graph neural
Sun, W., Daosheng, A., Jiaxu, L. 2024-06-14 http://biorxiv.org/cgi/content/short/2024.06.12.598759v1