
バイオインフォマティクスツールリンク集
バイオインフォマティクス解析等で個人的に扱うものをまとめました。
特に普段はwet研究を行っていてdry解析がメインでない人向けにブラウザ上で扱えるものやフリーソフトをまとめています。参考にどうぞ。
データベース
文献検索
Google Scholar
学術論文検索用のサーチエンジン。学問分野はとくに限られていない。
PubMed
生物学・医学の文献を中心とした学術論文検索エンジン。
bioRxiv
生物学のプレプリントリポジトリ。bioRxivが提供する論文は査読されていない。
バイオデータベース
National Center for Biotechnology Information (nih.gov)
塩基配列やアミノ酸配列を含む多数の生命科学・バイオインフォマティクス研究に用いられる多数のデータベースを統合するポータルサイト。
SIB Swiss Institute of Bioinformatics | Expasy
ゲノミクス、プロテオミクス、構造生物学から、進化・系統学、システム生物学、医化学に至るまで、ライフサイエンスと臨床研究のさまざまな領域をサポートする、SIBグループによって開発された160以上のデータベースとソフトウェアツールへのアクセスを提供する、拡張可能で統合的なポータルサイト。
Galaxy
プログラミング (コンピュータ)やシステムアドミニストレータ分野が未経験の研究者を対象とした、計算生物学の理解に役立つデジタルアーカイブプラットフォーム。遺伝子発現、配列アセンブリング、プロテオーム解析、トランスクリプトーム解析などなど様々な解析をブラウザ上で実行することができる。
KEGG
遺伝子や タンパク質 、代謝 、シグナル伝達 などの分子間ネットワークに関する情報を統合した データベース。
RCSB PDB: Homepage
タンパク質、核酸、糖鎖など生体高分子の3次元構造の原子座標(立体配座)を蓄積している国際的な公共のデータベース。
UniProt
タンパク質のアミノ酸配列とその機能情報を掲載しているデータベース。
EzBioCloud.net | Search about Bacteria or Archaea
細菌の同定、ゲノミクス、マイクロバイオームに関する包括的なリソースを提供している。
PubChem
低分子を中心とするが生化学に関連する高分子も含む。化学構造、化学物理的特性、生物学的活性、など多くの情報を提供している。
AlphaFold Protein Structure Database (ebi.ac.uk)
AlphaFold2で予測された2億以上のタンパク質予測構造のデータベース。
CAZy
糖質関連酵素の分類を行っているデータベース。データベース内で未知配列に対して分類を行うこともできる。
シアノ関連
気になる人は確認してください。
Carotenoid Database (carotenoiddb.jp)
cyanobase (microbedb.jp)
CyanoCyc Cyanobacterial Pathway/Genome Databases
CyanoPhyChe (uohyd.ac.in)
CyanoOmicsDB
光合成関連の知識学習系↓
光合成事典 - 光合成事典 (photosyn.jp)
光合成の森
ツールリンクサイト(おまけ)
バイオインフォマティクス解析ツール リンク集 | バイオインフォマティクス ポータル (yokohama-cu.ac.jp)
生物の研究に役立つデータベース (u-tokyo.ac.jp)
bioinformatics | バイオインフォマティクス | 生物情報科学 (biopapyrus.jp)
データ解析サイト・ツール (mie-u.ac.jp)
おすすめサイト (hokudai.ac.jp)
ツール習得支援
自分でどんどんツールを利用していきたいという方向け
TogoTV
生命科学分野の有用なデータベース(DB)やウェブツールの動画マニュアルや講演・講義動画、イラスト、講習資料などを紹介するポータルサイト。
macでインフォマティクス
上坂一馬先生が個人でまとめているバイオインフォマティクスツールの解説サイト。ツールの実装から解析例までを日本語で解説している。
(お世話になっております。)
LabCode
こちらもバイオインフォマティクスツールの解説サイト。
Galaxy Training!
世界中のGalaxyユーザーによって構築されている解析チュートリアルサイト。
遺伝子系
アライメント・相同性検索・系統樹
BLAST: Basic Local Alignment Search Tool
DNAの塩基配列あるいはタンパク質のアミノ酸配列のシーケンスアライメントを行い相同性検索(ホモロジー検索)を比較的高速に行うことができる。
Multiple Sequence Alignment - CLUSTALW
DNA配列やタンパク質配列の多重整列を行うためのアルゴリズムClustalWをKEGG内で行えます。
MEGA
塩基配列、タンパク質配列データの分子進化・系統学的解析を行うためのフリーソフトウェア。
プライマー設計
相補鎖変換ツール | 西田コンピューティングサービス (nishida-science.net)
相補鎖に変換したい核酸の塩基配列を相補鎖配列に変換することができる。
DNA逆向き相補鎖|ベクタービルダー (vectorbuilder.jp)
DNA 配列をタイプまたはペーストすると、反転配列、相補鎖、逆向き相補鎖の配列が自動的に検索される。他にもGC含有率やコドンの最適化等の解析ツールがある。
Primer Design tool for In-Fusion® (takara-bio.co.jp)
TAKARAが提供する、In-Fusionで使用するベクターの配列とPCRプライマーに基づき、In-Fusionで使用するプライマーの設計をすることができる。
ApE- A plasmid Editor (utah.edu)
プラスミドを設計するためのフリーソフト。DNA配列の編集、制限酵素サイトの検索、2種類の配列のアライメントなどができる。フリーソフト。
SnapGene | Software for everyday molecular biology
DNAクローニングやPCRの計画、視覚化、記録を手早く簡単に行うことができる遺伝子工学実験支援ソフトウェア。
Primer-BLAST
UCBIデータベース内のゲノム情報から条件に合ったプライマー配列候補を選択することができる。
Primer3Plus
こちらも持っているDNA配列に対して条件に合ったプライマーを設計できるツール。
プロモーター領域
BDGP: Neural Network Promoter Prediction (fruitfly.org)
ヒトとショウジョウバエのプロモーター配列のトレーニングセットとしてDNA配列からプロモーター領域を探すことができる。
ゲノムアノテーション
DFAST
品質評価法と分類評価法を統合した細菌ゲノムアノテーションパイプライン。
eggNOG-mapper
ゲノム、メタゲノム、およびトランスクリプトームデータから翻訳された大規模な遺伝子コーディング領域配列などの新規配列の高速機能アノテーションを目的としたアプリケーション。
GhostKOALA
BlastKOALAで使用するデータセットと同じ参照GENESデータセットに対してGHOSTX検索を行い、ユーザーの配列データにK番号(KEGGで用いられる機能遺伝子の分類)を付与する。その後のKEGGをもちいた代謝経路予測に用いることができる。
発現量解析
iDEP.96
RNA-seqにおける一通りの解析が行えるユーザーフレンドリーなツール。
代謝予測
KEGG Mapper
生物のアミノ酸配列FASTAファイルからKOで分類し、再構築することで生物が持つ代謝経路をKEGG pathway にマッピングすることができる。複数の生物の代謝経路を比較することも可能。
Antibiotic Resistant Target Seeker
ゲノム上にある潜在的な二次代謝産物(抗生物質)生産遺伝子クラスターを予測・発見することができる。
遺伝子クラスター比較
CAGECAT
相同な遺伝子クラスターを迅速に検索・可視化する ウェブサーバ。コマンドラインやプログラミングの専門知識を必要とせず、相同性検索やダウンストリーム解析を行うことができる。
DiGAlign : the Dynamic Genomic Alignment server
一度に最大300ゲノムという大規模な比較ゲノム解析がウェブ上で行えるツール。特に、独自の機能として、ガイドツリーを利用して、似ているゲノムのシンテニーマップを簡単に表示できる。さらに遺伝子の同定と機能予測もできる。
タンパク質系
以下はアミノ酸配列を貼り付けるだけで基本的に解析可能なので詳細は省略します。
特に機能未知遺伝子の機能を研究する人は一通り試してみてください。
分子の性質
・等電点、分子量:Compute pI/Mw tool
・その他の物理的・化学的パラメータ:ProtParam
局在予測
・細胞内局在:PSORT WWW Server
・細胞内局在:DeepLocPro 1.0
・シグナル配列:SignalP 6.0
・シグナル配列:TargetP 2.0
・膜貫通部位:DTU/DeepTMHMM
・GPIアンカー:NetGPI 1.1
モチーフ・ドメイン
・ドメイン:ScanProsite
・モチーフ・ドメイン:InterPro
・モチーフの検出(比較用)(塩基配列も可):MEME Suite
翻訳後修飾予測
・MusiteDeep:タンパク質の翻訳後修飾(PTM)部位の予測および可視化のためのディープラーニングフレームワークを提供する。
・リン酸化(他の種類の修飾も可):GPS 6.0
・糖鎖修飾:NetNGlyc 1.0
立体構造
・立体構造予測(多量体・複合体も可):AlphaFold2- Colab
・ホモロジーモデリング:swissmodel
・モデルクオリティチェック:QMEAN
・立体構造&リガンド相互作用:AlphaFold Server (AlphaFold3)
・基質結合予測部位:af2bind- Colab
・立体構造検索:Foldseek Search Server
・立体構造比較:Pairwise Structure Alignment Tool
分子グラフィックツール:RasMol
分子グラフィックツール:PyMOL
分子構築/エディタ:Avogadro
分子グラフィックツール:UCSF Chimera
分子ドッキングツール:AutoDock Vina
タンパク質-タンパク質ドッキング(多量体予測など):ClusPro 2.0: protein-protein docking
タンパク質間相互作用
・STRING: functional protein association networks
機能予測(あまりあてにしすぎない)
・ProteInfer
・Clean
・DeepGOWeb
・DeepFRI
天然変性タンパク質
・天然変性領域予測:metapredict.net
ディープラーニングに基づく、IDRと予測される構造のコンセンサス予測を行う。
・天然変性領域特性:polymer_property_predictors.ipynb - Colab
タンパク質の天然変性領域は、アンサンブルという急速に相互変換する状態をとっている。ALBATROSSは、プロテオーム規模のアンサンブル平均特性を瞬時に予測することができる。
・天然変性領域特性:idrome_constructor.ipynb - Colab
プロテオーム中のすべてのIDRを予測し特性をアノテーションする。複数の配列を同時に解析できるALBATROSS。
・天然変性領域と生体分子との相互作用:DEPICTER2
無秩序予測ツールであるflDPnnと、現在予測可能な全ての無秩序機能(無秩序リンカー、タンパク質、ペプチド、DNA、RNA、脂質結合)をカバーする5つの手法が含まれている。