高複雑度ワンポットゴールデンゲートアセンブリー

2023年9月28日 11:27

記事内容へスキップ
記事情報へスキップ
最新のプロトコル
カレント・プロトコル第3巻第9号e882
プロトコル
オープンアクセス
高複雑度ワンポットゴールデンゲートアセンブリー
https://currentprotocols.onlinelibrary.wiley.com/doi/10.1002/cpz1.882

アンドリュー・P・シッケマ, S・カスラ・タバタベイ, ヤン・ジウン・リー, ショーン・ルンド, グレゴリー・J・S・ローマン
初出：2023年9月27日
https://doi.org/10.1002/cpz1.882
分子生物学セクションに掲載
分子生物学について
セクション

概要
ゴールデンゲートアセンブリーは、DNAアセンブリーとクローニングの柔軟な方法であり、あらかじめ定義された接続を介して、1回の反応で複数の断片を結合することができる。この方法は、IIS型制限酵素を用いたDNAの切断に依存しており、この制限酵素は認識部位の外側で切断するため、生成した断片から認識部位を切り離しながら、任意の配列のオーバーハングを生成することができる。適合する融合部位を選択することにより、ゴールデンゲートは1回の反応で複数のDNA断片を決められた順序で結合させることができる。従来、この方法は1回のアセンブリーラウンドで5〜8個の断片を結合するのに使われてきたが、より複雑なアセンブリーでは収率と精度が急速に低下する。最近われわれは、データ最適化アセンブリーデザイン（DAD）を用いて、ライゲーションフィデリティーとバイアスデータの包括的な測定を行うことで、1回の反応で52ものフラグメントを同時に接合する非常に複雑なアセンブリーでも、高いアセンブリー精度が得られることを実証した。ここでは、DADの原理とオンラインツールを適用して、既存の融合部位セットとアセンブリースタンダードの忠実度を評価し、新しい最適セットを選択し、既存のアセンブリーに融合部位を追加する方法について説明する。さらに、小さなゲノムのワンポット集合体の設計を含む、既知の配列を最適なポイントで分割するためのDADの適用について述べる。T7バクテリオファージゲノムを例に、PCRによるパーツ作製と同時にネイティブなIIS部位の除去（ドメスティケーション）を含むプロトコルを紹介する。最後に、中〜高複雑度（12〜36フラグメント）のアセンブリーに推奨されるサイクリングプロトコール、高品質なパーツを作製する方法、最適なアセンブリー結果を得るためのDNA純度とフラグメント化学量論的バランスの重要性を強調する例、アセンブリーの成功を評価する方法について紹介する。© 2023 New England Biolabs, Inc. Wiley Periodicals LLC発行のCurrent Protocols。

基本プロトコール1：NEBridge Ligase Fidelity Viewerを用いたオーバーハングセットの忠実度の評価

基本プロトコール2：NEBridge GetSet Toolを用いた忠実度の高いオーバーハングセットの作成

代替プロトコル1：NEBridge GetSet Toolを用いた既存のオーバーハングセットの拡張

基本プロトコール3：NEBridge SplitSet Toolを用いた最適な融合部位を持つゲノム配列の分割

基本プロトコール4：12フラグメントの目的プラスミドへのワンポットGolden Gateアセンブリー

代替プロトコル2：24以上のフラグメントを目的プラスミドにワンポットゴールデンゲートアセンブリーする

基本プロトコル5：12以上の部分からT7バクテリオファージゲノムをワンポットゴールデンゲートアセンブリーする

サポートプロトコル1：アセンブリー用高純度アンプリコンの作製

サポートプロトコール2：アセンブリー用パーツを保持ベクターにクローニングする

サポートプロトコル3：Qubit 4蛍光光度計を用いたDNA濃度の定量

サポートプロトコル4: TapeStationを用いた大規模アセンブリーの可視化

サポートプロトコル5：ONTロングリードシーケンスによるファージゲノムアセンブリーの検証

はじめに
現代の分子生物学および合成生物学は、合成またはゲノム由来の断片からDNAを迅速かつ正確にアセンブルし、遺伝子、発現系、パスウェイ、遺伝子編集アレイ、さらには人工染色体や小型ゲノムのような巨大構造体を構築することに依存している（図1）。相同性指向性アセンブリー法（例えば、ギブソンアセンブリー、ポリメラーゼサイクリングアセンブリー（PCA）、酵母アセンブリー）では、エキソヌクレアーゼ、ポリメラーゼ、リガーゼ酵素の組み合わせ、あるいはネイティブなin vivo相同組換えシステムを利用して、長い相同性末端をアセンブリーする。他のアセンブリー法は、例えば制限酵素（BioBricks [Shetty et al., 2008]やGolden Gate Assembly [Engler et al., 2008]）、APリアーゼ（USERクローニング [Bitinaite et al., 2007]）、アルゴノート（PlasmidMaker [Enghiad et al., 2022]）などのエンドヌクレアーゼによって生成された短い相補的末端のライゲーションに依存している。これらの方法は、短く定義されたオーバーハングの正確な生成と、ワトソン-クリック対のオーバーハングのみを特異的にライゲーションして、目的のマルチフラグメントアセンブリーを生成することに依存している。どの方法も大きなDNAコンストラクトの生成に使用できるが、それぞれに潜在的な欠点と利点がある。例えば、相同性指向性の方法は、欠失産物を生成しやすいため、高度に反復するDNAには使いにくい。ポリメラーゼによる鋳型伸長への依存は、高忠実度PCR酵素を用いることで大幅に改善されるものの、融合部位近傍でのインデルや塩基置換などのエラーにつながる可能性がある。ライゲーション指向法は一般に変異が導入されにくく、反復DNAに対してより寛容であるが、ほとんどの場合、エンドヌクレアーゼの標的部位をPCRで、あるいはそれ以前のDNA合成工程で導入する必要がある。

詳細は画像に続くキャプションを参照。
図1
図ビューアーで開く
パワーポイント
キャプション
ゴールデンゲートアセンブリー（GGA）は、アセンブリーにおいて融合部位として使用される短いオーバーハングを生成するためのIIS型制限エンドヌクレアーゼの使用に依存する、広く使用されているライゲーション指向アセンブリーである（図1および2）。IIS型制限酵素はその認識部位の外側を切断するが、これは多断片集合体の成功の鍵となる特徴である（Szybalskiら、1991）。GGAに使用されるフラグメントは、制限切断時に認識部位がインサートから切り離され、所望の融合部位のオーバーハングが残るように設計されている。フラグメントが目的のアセンブリーパートナーにライゲーションされると、融合配列はもはや認識部位を含まず、再切断はできない。代わりにフラグメントがその前駆体フラグメントに再び結合すると、切断部位が再生され、再び切断することができる。こうして切断とライゲーションが繰り返されることで、アセンブル産物が蓄積され、認識部位を含む断片や保持ベクターの量が減少していく（図2A）。選択したIIS型酵素に対する1つ以上の認識部位を自然に含む標的配列は、内部で切断され、不完全な産物をもたらすことに注意することが重要である。このため、しばしば標的DNAのネイティブな認識部位を除去する必要があり、このプロセスはドメスティケーションと呼ばれる。

詳細は画像に続くキャプションを参照。
図2
図ビューアーで開く
パワーポイント
キャプション
相同性指向性アセンブリー法とライゲーション指向性アセンブリー法の両方によって、大きな構築物を構築する戦略が存在する。In vivo組換え法では、一度に何十もの断片をうまく結合できることが示されているが、これらの方法は手間がかかり、前駆構築物を標的生物に導入し、生物を増殖させ、最終的に使用する前にDNAを再単離する必要がある（Gibson et al.） GGAを含むin vitroの方法は、歴史的に、1回のラウンドで使用されるフラグメントの数に制限があり、複雑性の高いアセンブリーでは、アセンブリーが不正確になったり、収率が低くなったりする。この限界は、階層的アセンブリー戦略を用いることで克服されてきた。この戦略では、1回の反応で結合させるフラグメントの数は少なく（通常は2～8）、その後、2回目または3回目のアセンブリーで複数の初期アセンブリーを結合させ、最終的な目的の産物を得る（Bird et al.、2022；Current Protocols article Marillonnet & Grutzner、2020）。大腸菌や別の生物を通しての複数回の組み立てと通過に要する時間に加え、これらの戦略はしばしば複雑な一連の保持ベクターを必要とし、特定の供給源からのDNAのクローニング、増殖、組み立ての問題によって制限されることがある。バクテリオファージDNAは特に難易度が高く（Yeom et al., 2020）、ゴールデンゲートアセンブリー（Golden Gate Assembly）を用いたバクテリオファージゲノムアセンブリー（Liang et al.

最近のアセンブリー戦略の進歩により、包括的なDNAライゲーションフィデリティー（ミスマッチ配列に対する識別）とバイアス（他の配列よりもある配列を優先する）の測定が適用され、ライゲーション指向アセンブリーの設計に情報が提供されるようになった（Potapov, Ong, Kucera, et al.）これらのデータ最適化アセンブリーデザイン（DAD）戦略は、GGA法に適用され、1回の反応で35以上のパーツの高忠実度、高効率アセンブリーの生成に成功している（Pryor et al.、2022）。DADは、高度に多重化されたライゲーション忠実度実験における観察に基づいて計算された忠実度を最大化するスコアを提供することによってオーバーハングセットを評価する。典型的には、与えられたフラグメントの複雑さにおいて、多くの高忠実度オーバーハングセットを同定することができ、ネイティブコード配列でさえも非常に柔軟なアセンブリー設計が可能となる。特定のオーバーハングを必要としたり、除外したりすることができ、融合部位を希望する領域に配置することで、ユーザーはORFをそれ自身のフラグメントに分離したり、毒性のある可能性のある配列を細分化したりすることができる。加えて、家畜化変異や他の変異原は、希望の塩基変化を導入する部位の近くに融合部位が存在することを要求するだけで、PCRで作製されたパーツに便利にデザインすることができる。DADはさらに、小さなゲノム（例えばT7バクテリオファージ）の組立てや、組換えバクテリオファージの生産を1回の組立て工程で可能にした（Pryorら、2022）。

本稿では、いくつかのオンラインツール（https://ligasefidelity.neb.com; Pryor et al., 2020）を用いて、ライゲーションフィデリティデータをアセンブリー設計に適用するためのプロトコルを紹介する。基本プロトコル1では、Ligase Fidelity Viewerを使用して、既存のオーバーハングセットをチェックして、予想される忠実度を確認し、潜在的なミスマッチライゲーションイベントを特定する方法を説明する。Basic Protocol 2 では、NEBridge GetSet Tool を使用して、希望するサイズのオーバーハングセットを作成し、特定の接続を要求または除外する方法について説明します。代替プロトコル1では、NEBridge GetSetツールを使用して互換性のある接続を追加し、既存のアセンブリを拡張する方法について説明します。基本プロトコル3では、NEBridge SplitSetツールのアップデート版を使用して、高忠実度の融合部位を選択して既知のターゲット配列を分割する方法について説明します。基本プロトコール4では、12個のインサートフラグメントの単一反応アセンブリーについて、代替プロトコール2では、24個以上のフラグメントの修正プロトコールについて説明しています。Basic Protocol 5では、Basic Protocol 3のデザインルールに従って作成したワンポット反応を用いたT7バクテリオファージのアセンブリーとレスキューについて記述しています。サポートプロトコールでは、PCRによる高品質なパーツの作製（サポートプロトコール1）、保持プラスミドへのパーツのクローニング（サポートプロトコール2）、Qubitによる正確なフラグメント定量（サポートプロトコール3）、TapeStationによる大規模アセンブリーの可視化（サポートプロトコール4）、Oxford Nanopore Technologies社のロングリードシーケンスによるアセンブリーの検証（サポートプロトコール5）について記述している。

戦略的計画
制限特異性の選択
複雑なGGA反応を計画する場合、どのIIS型制限酵素を使用するかが重要な検討事項である（Szybalski et al.、1991）。GGAに使用される最も一般的な酵素は、6塩基の認識部位を持ち（BsaI: GGTCTCN、BsmBI/Esp3I: CGTCTCN、BbsI/BpiI: GAAGACNN）、認識部位の近くで切断し、切断効率と精度が高く、4塩基のオーバーハングを生じる。平均して、これらの酵素は2048塩基対ごとに認識部位を持つと予想される（40kbの配列ではおよそ20個）。使用頻度の低い酵素は7塩基の認識部位を標的とし、SapI/BspQI (GCTCTCN)は3塩基のオーバーハングを、AarI/PaqCI (CACCTGCNNNN)は4塩基のオーバーハングを生成する(Kennedy et al., 2023)。7塩基の認識部位を持つ酵素は、任意のDNA配列中に8192bpごとに（40kbの配列中におよそ4-5個）、自然に存在する部位を持つと予想される。我々は、上記の4塩基オーバーハング生成酵素が、36以上のフラグメントの高精度GGAをサポートできることを見出した。SapIとBspQIは、3塩基オーバーハングでは可能な融合部位対が少なくなるため、マルチフラグメントアセンブリーには見過ごされがちであるが、DADライゲーション解析により、少なくとも12対の3塩基オーバーハングが1回の反応で高精度に効率よく結合できることが示されており、これは多くの用途に十分である（Pryor et al.）ほとんどの酵素のサイクリングプロトコールは別のところで発表されている(Marillonnet & Grutzner, 2020; Pryor et al., 2022)。基本プロトコール4と代替プロトコール2は、高複雑性アセンブリーにおけるほとんどのIIS型酵素をカバーする一般的なプロトコールである。AarI/PaqCIのプロトコールは、基本プロトコール5で若干修正されており、アクチベーターオリゴヌクレオチドが必要である。

これまでの研究で、選択する制限酵素の同一性は、融合部位のオーバーハング集合の忠実性にわずかな影響しか与えないことが示されている（Pryor et al.）したがって、酵素の選択は、モジュラー・クローニング（MoClo; Weber et al., 2011）用のBbsI/BpiIとBsaI、メビウス・アセンブリー（Andreou & Nakayama, 2018）用のAarI/PaqCIとBsaIなど、使用する保持ベクターに存在する特異性など、アセンブリーシステムのニーズによって決定されることが多い。さらに、標的アセンブリー配列内に存在する選択した酵素の内部制限部位は、反応中に切断され、切断されたアセンブリー産物につながる。したがって、組立て（すなわち家畜化）の前に、断片から内部部位を除去する必要がある。これは、同定されたORFにサイレント変異を加えることで最も容易に達成される（HamediRadら、2019；Marillonnet & Grutzner、2020；Zhangら、2015）。遺伝子間領域、特に同定可能な制御エレメントへの変化は避けるべきであり、これらの領域内での家畜化変異誘発の必要性を回避するような異なる制限特異性を選択することが望ましい。酵素の最良の選択は、最も少ない家畜化変異（理想的にはゼロ）を必要とするもので、必要な変異はORF内に配置されることが多い。変異は、DNA合成業者に断片を注文する場合はインシリコで、プラスミドに保持されている断片の場合は部位特異的突然変異誘発法で導入することができる。また、PCRプライマーに取り込むことができるほど認識部位の近くに切断点を設計すれば、ゲノムDNA（gDNA）からパーツを作製するのと同時に、認識部位に変異を組み込むことも可能である（基本プロトコール3を参照）。

DNAリガーゼの選択とアセンブリープロトコル
我々は以前、ライゲーションの忠実度が正確なアセンブリーに最も大きな影響を与えることを発見しており、ライゲーション、バッファー、サイクリング法、制限酵素とリガーゼの比率がライゲーションの忠実度に重要な因子である（Potapov, Ong, Kucera, et al.）ほぼすべての場合において、T4 DNAリガーゼは高複雑度GGAに使用するのに最適なリガーゼである。T7 DNAリガーゼはT4 DNAリガーゼよりも全体的に高いフィデリティーを持つことが示されているが、T7 DNAリガーゼは効率が低く、バイアスが高いため、このフィデリティーの優位性は簡単には実現できないことが繰り返し分かっている（Bilotti et al.） DADを適用することで、T4リガーゼの高効率を利用しつつ、不正確なライゲーションによるアセンブリーエラーを最小限に抑えることができるためである。プロトコールに関しては、37℃の静置インキュベーションはより高いアセンブリー忠実度をもたらすが、アセンブリー効率の低下という大きなトレードオフがあり、正しいアセンブリーの絶対数が少なくなることがわかった。静的インキュベーションは、予測された忠実度が低い既存のオーバーハングセットの誤ったアセンブリーを最小限に抑えるために使用できるが、DADで選択したオーバーハングをサイクリングアセンブリープロトコール（基本プロトコール4参照）と組み合わせて使用することで、一般的に全体的な忠実度と効率が高くなる（Pryor et al.）

デザインツールの選択
Ligase Fidelity Viewerツールは、入力されたオーバーハングセットの推定フィデリティ（ミスマッチの可能性を表すスコア）を決定し、既存のアセンブリーにおけるリガーゼフィデリティの問題を特定するために使用できる（Basic Protocol 1参照）。このツールには、様々なリガーゼ、制限酵素、サイクリングプロトコルの下で収集された包括的なデータセットのデータベースが含まれており、そこから選択して入力されたオーバーハングセットを評価することができます。NEBridge GetSetツール（基本プロトコール2を参照）は、配列制限がない場合に、適合する融合部位のセットを生成するために適用される。この方法は、全体の忠実度を最適化しながら、既存のセット内の融合部位を置き換えたり、新しい部位を追加したりするためにも使用できます。NEBridge SplitSetツール（基本プロトコル3を参照）は、コーディング配列を含む既知の配列内に最適な融合部位を配置するように設計されており、融合部位を特定の領域や正確な位置に限定することができます。このツールは、パーツ作製と同時に変異（家畜化を含む）を起こすのに適した融合部位の選択も支援することができる。適切なツールとプロトコルの選択に役立つフローチャートを図3に示す。

詳細は画像に続くキャプションにある
図3
図ビューアで開く
パワーポイント
キャプション
アセンブリーのための適切なフラグメント数の決定
図2Bは、異なるオーバーハング選択法の予測フィデリティスコアを、使用するフラグメントの総数の関数として示したものである（Pryor et al.）多くのフラグメントを用いた高複雑度アセンブリーでは、ミスマッチライゲーションの機会が多く、正しいアセンブリーの予測割合が低くなる。最適化されたオーバーハングセットを使用している場合でも、フラグメント数が増えると一般的に忠実度と効率が低下する。成功するアセンブリーと失敗するアセンブリーを分ける明確なカットオフはないが、DADに最適化された融合部位セットを12フラグメントまで使用した場合、一般的に非常に高い産物収率（1,000～10,000CFU/μlまたはPFU/μl）が得られる。アセンブリーでは、このようにフラグメント数が多くても多くの形質転換体が成功するが、複雑さが増すにつれて、DNA純度などの要因にますます注意を払う必要がある。我々は以前、1回の反応で最大52個のフラグメントを組み立てることが可能であることを示したが、完全なアセンブリーのみが生存可能なファージを産生できるような極めてストリンジェントな選択機構を持つことを含め、全ての要因を最適化した場合、このレベルの複雑さが最大であると感じている（Pryor et al.、2022）。最良の結果を得るためには、ほとんどのユーザーは単一アセンブリー反応を40フラグメント未満に制限することを推奨する。アセンブリーのフィデリティスコアが低いと、不正確なアセンブリーや不完全なアセンブリーを含むコロニーが増えるため、目的の産物を確実に単離するために、アセンブリー後にさらにコロニーをスクリーニングする必要があるかもしれません。ほとんどのGGAエラーは全断片の欠失または挿入を伴うため、コロニーPCR（Current Protocolsの論文Woodman et al.，2016を参照）を用いて挿入サイズを測定すれば、正しいアセンブリーを同定するのに十分かもしれないが、最終産物の完全な配列検証を行うことが望ましい（Support Protocol 5を参照）。

アセンブリーのインシリコ検証
パーツやプライマーを注文する前に、アセンブリーデザインを視覚化し、フラグメントが正しい順序で、希望する最終配列でアセンブルされると予測されることを確認することを推奨する。NEBridgeツール（https://goldengate.neb.com/#!/）やGeneiousまたはSnapGeneソフトウェアなど、多くのオンラインツールが公開されている。DADを用いて選択された融合部位は経験的データに基づいており、Golden Gate Assembliesで使用するために検証されているため、これらの警告は無視しても差し支えない。とはいえ、アセンブリーツールを使用することで、アセンブリーの順序を視覚化することができ、パーツが意図したオーバーハングを確実に作り出し、最終的なアセンブリーシーケンスを提供することができる。これらのツールは内部制限部位にフラグを立てることもでき、標的配列からすべてのネイティブ部位が除去されていることを確認するのに重要である。内部認識部位が残っている場合は、アセンブリーを修正してこれらの部位を除去するか、別のIIS酵素を使用すべきである。設計段階での入念なバリデーションは、時間とリソースの大幅な節約につながる。

アセンブリー用フラグメントの生成
パーツのin silico設計が完了したら、パーツの生成方法を選択しなければならない。入力DNAソースの品質に関する一般的な階層は、プラスミドDNA＞アンプリコンDNA（gDNAまたは合成DNAテンプレートから）＞直接合成DNA（すなわち、gBlock）である。アセンブリーには、複数のソースからのパーツが混在することがある。ますます利用しやすくなっている解決策は、DNAベンダーにパーツを注文することである（合成フラグメントからのLacIZカセットのアセンブリーの例については、「結果の理解」を参照）。ほとんどの業者は現在、ホスホルアミダイト合成によって合成されたオリゴヌクレオチドから出発してDNAを製造しており、より大きな断片はPCAなどの方法によって組み立てられている（図1; Hoose et al.）断片は、gBlock（または類似の直鎖dsDNA断片）として、あるいは保持ベクター中の配列が確認された挿入物として得ることができる。GGAに必要なType IIS部位は、家畜化変異やその他の所望の改変とともにインシリコで簡単に追加できるので、ベンダーによるパーツの合成は便利である。合成DNAを注文することで、メタゲノムや培養不可能なソースからの配列、あるいは純粋にインシリコ設計による配列など、適切なgDNAがないために天然ソースから得られないパーツを提供することもできる。このルートの大きな障壁は、合成配列のコストであり、DNAの合成と出荷に十分なリードタイムを確保しなければならない。さらに、ベンダーの成功率にはばらつきがあり、注文された配列をすべて提供できるとは限らない。プラスミド中の配列が確認された断片は、直鎖dsDNAよりも高価であるが、特徴的に純度が高い。精製されたプラスミドは、変異を含む個々のDNA分子のようなコンタミを含む可能性が非常に低く、最終産物が不正確になる。しかしながら、宿主の毒性などの問題から、すべての配列を簡単にクローニングできるわけではない。直鎖dsDNA部分はPCRを用いて増殖させることができるが、これは増幅の連続ラウンドによって突然変異を導入するリスクを伴う。

もし入手可能であれば、gDNAを鋳型としてPCRでパーツを作製するのが現実的な選択肢である。PCRでパーツを作製する場合、プライマーを介して必要なIIS部位を付加する(Support Protocol 1参照)。この方法ではDNA合成では得られない断片が得られることが多く、PCRアンプリコンを直接GGA反応に用いることもできる（T7ファージゲノムの例についてはUnderstanding Resultsを参照）。オフターゲット増幅やプライマーダイマーに由来する不純物がアセンブリー反応の基質となり、収量に劇的な影響を与える可能性があるため、これらの断片の純度を確保するためにはより注意が必要である（Supporting Information Fig.） PCR断片はそのまま使用しても優れた結果が得られるし、プラスミド内で増殖させることもできる（ただし、毒性や遺伝的不安定性のため、すべての配列が大腸菌でうまく継代できるわけではない）。

基本プロトコール1：NEBridge LIGASE FIDELITY VIEWERを用いたオーバーハングセットの信頼性評価

効果的なGGAの重要な要素は、オーバーハングセットの忠実度である（Potapov, Ong, Kucera, et al., 2018; Pryor et al.）これは特定のオーバーハング集合に対して計算される予測スコアで、集合内のオーバーハング間のミスマッチの可能性を全体的に表す。絶対的なスコアではないが、セットを比較する相対的な手段として用いることができる。このプロトコールでは、NEBridge Ligase Fidelity Viewerを使用して、既存のオーバーハングセットの忠実度を評価する方法について説明し、既存のクローニングツールセットの忠実度の評価や、異なるツールキットからのパーツの互換性の評価に応用します。具体的な項目は、図4と解説（「結果を理解する」を参照）で説明した解析例について記載されています。

詳細は画像に続くキャプションに記載
図4
図ビューアで開く
パワーポイント
キャプション
必要なリソース
最新のウェブブラウザーを搭載したパソコンまたはその他の機器
解析するアセンブリの融合部位のオーバーハングをカンマで区切ったプレーンテキストリスト
例 ggag、tact、ccat、aatg、aggt、ttcg、gctt、ggta、cgct

NEBridge Ligase Fidelity Viewer (https://ligasefidelity.neb.com/viewset/run.cgi)にアクセスする。
セットのオーバーハング長を "Overhang length "ドロップダウンメニューから選択する。この例では4塩基を選択する（図4A）。

この設定により、3塩基と4塩基のオーバーハングデータセットを分けることで、次のステップで利用できるライゲーション条件が決定される。

Ligation conditions "ドロップダウンメニューから、最も代表的なライゲーション条件を選択する。この例では、BsaI-HFv2 37-16 cyclingを選択します。

この設定により、ライゲーション忠実度推定計算に使用するライゲーション忠実度データセットを選択します。利用可能なデータセットは2つのカテゴリーに分類されます：(1)静的インキュベーション温度下でT4またはT7リガーゼによる事前に生成されたオーバーハングのライゲーションを評価するライゲーションのみのデータセット（Potapov, Ong, Kucera, et al., 2018; Potapov, Ong, Langhorst, et al., 2018）と、(2)GGAプロトコルを模倣した様々な条件下でIIS型制限酵素とT4リガーゼをインキュベートして生成されたデータセット（Pryor et al.）最高の精度で予測するためには、選択したデータセットが、アセンブリーに使用する消化、ライゲーション、サイクリング条件と一致する必要がある。T4 DNA Ligase Bufferを使用するアセンブリープロトコールに従う場合は、IIS型酵素のサイクリング条件を使用する。NEBridge Ligase Master Mix を使用する場合は、関連する条件を選択してください。各データセットのインキュベーション条件の詳細については表1を参照のこと。

表1. NEBridge Ligase Fidelity Toolsで利用可能なライゲーション条件
酵素オーバーハング長反応バッファー温度 (°C) インキュベーション時間とサイクリング
T4 DNA ligase 3-または4-base T4 DNA ligase buffer 25 1hr static
T4 DNA ligase 3- or 4-base T4 DNA ligase buffer 25 18 hr static
T4 DNA ligase 3- or 4-base T4 DNA ligase buffer 37 1hr static
T4 DNA ligase 3- or 4-base T4 DNA ligase buffer 37 18 hr static
T7 DNA リガーゼ 4 塩基 T4 DNA リガーゼバッファー 25 1 時間静置
T7 DNA リガーゼ 4 塩基 T4 DNA リガーゼバッファー 37 18 時間静置
SapI, T4 DNA ligase 3 塩基 T4 DNA ligase buffer 37→16 30 サイクル、5 分ステップ
SapI, T4 DNA ligase 3-base NEBridge Ligase Master Mix 37→16 60サイクル、5分ステップ
BspQI、T4 DNAリガーゼ3塩基 NEBridgeリガーゼマスターミックス 42→16 60サイクル、5分ステップ
BsaI-HFv2, T4 DNA ligase 4-base T4 DNA ligase buffer 37→16 30サイクル、5分ステップ
BsaI-HFv2, T4 DNA ligase 4-base T4 DNA ligase buffer 37 18 hr static
BsmBI-v2, T4 DNA ligase 4-base T4 DNA ligase buffer 42→16 30サイクル、5分ステップ
BsaI-HFv2, T4 DNA ligase 4-base NEBridge Ligase Master Mix 37→16 60サイクル、5分ステップ
PaqCI, T4 DNA ligase 4-base T4 DNA ligase buffer 37→16 60サイクル、5分ステップ
PaqCI, T4 DNA ligase 4-base NEBridge Ligase Master Mix 37→16 60サイクル、5分ステップ
BsmBI-v2、T4 DNAリガーゼ4塩基 NEBridgeリガーゼマスターミックス 42→16 60サイクル、5分ステップ
BbsI-HF, T4 DNAリガーゼ 4塩基 NEBridgeリガーゼマスターミックス 37→16 60サイクル、5分ステップ
4. Overhangs (5′→3′)」フィールドにオーバーハングセット配列を入力する。この例では ggag、tact、ccat、aatg、aggt、ttcg、gctt、ggta、cgct。

オーバーハング配列は5′→3′方向に書き込まれ、相補的なオーバーハングはプログラムによって自動的にセットに加えられる。ユーザーはペアのどちらかのメンバーを提供することができますが、提供された結果の解釈を簡単にするために、常にトップストランドオーバーハングを使用し、融合部位をアセンブリに表示される順番で入力することをお勧めします。オーバーハングの長さはステップ1で選択した長さと一致させる。正規のA、C、G、T塩基のみがサポートされています。不正確なオーバーハングや重複したオーバーハングは自動的に破棄されます。オーバーハングは大文字、小文字、または混合で入力することができる。

Show normalized ligation counts "の前のボックスのチェックは外しておく。

"Show normalized ligation counts "は、データセット中の各オーバーハング対の頻度を正規化したカウントを表示する機能を有効にします（Potapov, Ong, Kucera, et al., 2018）。このボックスの選択を解除すると、同じ定性データが表示されますが、予測に使用したシーケンスデータセットからの絶対リード数を使用します。

Submit」をクリックする。

ページを送信すると、プログラムは選択した条件下で、このオーバーハング一式の予測フィデリティデータを出力する。詳細は図4BとUnderstanding Resultsを参照。

基本プロトコル2：NEBridge GetSetツールを使った高忠実度オーバーハング・セットの生成
高忠実度のオーバーハング・セットを生成できると、モジュラー・アセンブリー・システムにおいて、パーツ間の任意の融合部位を選択できるようになる（Damalas et al.）高忠実度のオーバーハングセットを簡単に作成できるように、我々はリガーゼ忠実度データに基づいてNEBridge GetSet Toolと呼ばれるウェブツールを作成した（Pryor et al.）このツールにより、ユーザーは要求されるオーバーハングの数、IIS型制限酵素、ライゲーション条件を選択し、特定の用途に最適なオーバーハングセットを得ることができる。また、プログラムによるアルゴリズム検索で、特定のオーバーハング配列を要求したり、除外したりすることもできる。これらの機能により、生成されるオーバーハングセットを大幅に制御することができる。具体的な項目は、Figure 5とその解説（Understanding Resultsを参照）に記載されている例で説明されている。

詳細は画像に続くキャプション
図5
図ビューアで開く
パワーポイント
キャプション
必要なリソース
最新のウェブ・ブラウザを搭載したパソコンまたはその他の機器

NEBridge GetSet Tool（https://ligasefidelity.neb.com/getset/run.cgi）にアクセスします。
オーバーハング長」のドロップダウンメニューから、オーバーハング・セットのオーバーハング長を選択します。この例では4-baseを選択する。

この設定により、次のステップで3塩基と4塩基のオーバーハングデータセットを分離し、どのライゲーション条件を利用できるかが決定される（図5A）。

Ligation conditions "ドロップダウンメニューから、最も代表的なライゲーション条件を選択する。この例では、BsmBI-v2 42-16 cyclingを選択する。

この設定により、ライゲーション忠実度推定計算に使用するライゲーション忠実度データセットが選択されます。利用可能なデータセットは2つのカテゴリーに分類されます：(1) 静的なインキュベーション温度下でT4またはT7リガーゼによる事前に生成したオーバーハングのライゲーションを評価するライゲーションのみのデータセット（Potapov, Ong, Kucera, et al., 2018; Potapov, Ong, Langhorst, et al., 2018）と、(2) GGAプロトコルを模倣した様々な条件下でIIS型制限酵素とT4リガーゼをインキュベートして生成したデータセット（Pryor et al.）最も正確な予測のためには、選択したデータセットがアセンブリーに使用する消化、ライゲーション、サイクリング条件と一致する必要がある。

1. "Number of overhangs"（オーバーハング数）フィールドに、セットに必要なオーバーハング数を入力する。この例では24と入力する。

この設定は、プログラムによって返されるオーバーハング・セットのサイズを決定します。入力可能な範囲は2～50（含む）です。

必要なオーバーハングを「必要なオーバーハング（5′→3′）」フィールドに入力します。この例では、このフィールドは空白のままにしておきます。

このフィールドに入力されたオーバーハングは、検索アルゴリズムによって自動的に選択され、常に最終的なオーバーハングセットに表示されます。オーバーハング配列は5′→3′方向でなければならない。ソフトウェアのアルゴリズムの一部として逆相補配列が自動的に生成されるため、ペアのどのオーバーハングを提出するかは任意である。オーバーハングの長さは、ステップ1で選択した長さと一致していなければならない。正規のA、C、G、T塩基のみがサポートされている。不正確なオーバーハングや重複したオーバーハングはプログラムの実行を妨げ、エラーメッセージとともに自動的にフラグが立てられる。スペースがある場合は除外される。オーバーハングは大文字、小文字、または混合で入力できる。

除外するオーバーハングを "Excluded overhangs (5′→3′) "フィールドに入力します。この例では、このフィールドは空白のままにしておきます。

このフィールドに入力されたオーバーハングは、可能な解決策から除外され、最終的なオーバーハングセットには表示されません。除外されたオーバーハングは単に計算で許可されないだけです。この機能は、ホモポリマー（例：CCCC）やTNNA（ライゲーション効率が低い）の配列を持つオーバーハングなど、問題となる可能性のあるオーバーハングを除外するために使用できますが、高いアセンブリー効率を達成するためにこれが必要となることはほとんどありません。ステップ4で述べたオーバーハングの入力制限がここでも適用される。必須フィールドと除外フィールドの両方に入力されたオーバーハングは必須として扱われる。

Submit "をクリックする。

プログラムはオーバーハングのリストと、NEBridge Ligase Fidelity Viewerが提供するものと同様のフィデリティの可視化結果を返します（図5B）。これらの出力の解釈については Understanding Results を参照されたい。同じパラメータで検索を繰り返すと、同じようなフィデリティを持つ異なる解が得られることに注意してください。探索アルゴリズムは決定論的ではなく、ランダムな初期ステップから忠実度の最大値を見つけようとします。したがって、異なる実行により、類似した忠実度推定値の異なる解が得られる可能性があります。特定の先行計算を検索するには、リクエストIDを記録します。このリクエストIDは、NEBridge GetSetツールの提出ページで入力し、以前の提出出力を検索することができます。先行計算は限られた時間しか保存されないことに注意してください。

代替プロトコル1：NEBridge GetSetツールを使って既存のオーバーハング・セットを拡張する
NEBridge GetSetツールの特に有用なアプリケーションは、既存のオーバーハング・セットを拡張して、セットの忠実度を高く保ちながら、より適合性の高い融合部位を追加することです。NEBridge GetSetのこのアプリケーションは、既存のアセンブリーに新しいフラグメントを追加したり、アセンブリー内の既存のフラグメントを細分化するための最適なオーバーハングを見つけたり、既存の標準オーバーハングセット（MoCloなど）を拡張したりすることができます。このプロトコルでは、NEBridge GetSetを使用してオーバーハングを追加生成する方法と、新しいオーバーハングを組み込むために既存のアセンブリを再設計する方法を説明します。例として、LacIZアセンブリ（基本プロトコール4、Supporting Information Table S1参照）を拡張して、2つの新しい選択マーカー、superfolder GFP（sfGFP、蛍光）とAmpRカセット（アンピシリン耐性）をコードする3つのフラグメント（図6A）を追加する方法を説明する。NEBridge GetSetは、既存のアセンブリと互換性のある新しい融合部位を選択するために使用され、これらの新しい融合部位は、拡張アセンブリを生成するために、新しいフラグメントを設計し、既存のフラグメントを変更するために使用されます（図6AおよびSupporting Information Table S2）。

詳細は画像に続くキャプションを参照。
図6
図ビューアーで開く
パワーポイント
キャプション
必要なリソース
最新のウェブブラウザを搭載したパソコンまたはその他の機器
プレーンテキスト、コンマで区切られた融合部位のオーバーハングのリスト。
例 ggag、ggca、tcgc、cagt、tcca、gaat、agta、tctt、caaa、gcac、aacg、gtct、ccat
プレーンテキスト、FASTA、GenBank、または類似フォーマットの既知部分の配列ファイル
ファイル例：Supporting Information参照 GenBankファイル 12-part_LacIZ_Assembly, 15-part_Expanded_LacIZ_Assembly

基本プロトコール2のステップ1-3と同様に開始する。この例では、オーバーハング長に4塩基、ライゲーション条件にBsaI-HFv2 37-16サイクリングを選択する。
Number of overhangs（オーバーハング数）」フィールドに、現在のセットのオーバーハング数と新しいオーバーハング数を入力する。この例では16と入力する。

この設定により、プログラムが返すオーバーハングセットのサイズが決まります。次のステップで必要なオーバーハングもこの値にカウントされるため、必要なオーバーハング数を超えて要求されたオーバーハング数が、プログラムが返す新しいオーバーハング数を決定します。この例では、16のオーバーハングが要求され、13のオーバーハングが必要（開始）なので、NEBridge GetSetは3つの新しいオーバーハングを検索することになります。

必要なオーバーハング（5′→3′）」フィールドに、拡張する現在のオーバーハングセットを入力します。この例では

ggag、ggca、tcgc、cagt、tcca、gaat、agta、tctt、caaa、gcac、aacg、gtct、ccat。

除外するオーバーハングを "Excluded overhangs (5′→3′) "フィールドに入力する。この例では、このフィールドは空白にしておく。
Submit "をクリックする。

プログラムは、必要なオーバーハングと追加の融合部位を含むオーバーハングのリストと、忠実度の可視化を返します。出力の説明については、Understanding Resultsを参照してください。

新しいオーバーハング配列を特定する。新しいオーバーハングセットは、入力された必要な配列（ステップ3）の後に、新しく生成されたオーバーハングが続く順序でリストされます（図6C）。この例では、新しいオーバーハングはCTGA、GATA、ACAAである。

基本プロトコール2で述べたように、検索アルゴリズムは決定論的ではなく、同じパラメータで繰り返し入力すると、同じような忠実度の推定値でも異なる解が得られることがある。このプロトコルに従った例では、異なる特定のオーバーハングが示唆されたセットが得られる可能性が高い。推定忠実度が5％未満の違いのあるオーバーハングセットは、実用上区別するのが難しく、同等に扱うことができます。この例で選択したオーバーハング・セットの推定忠実度は98%です。特定の先行計算を検索するには、リクエストIDを記録します。このリクエストIDは、NEBridge GetSetの投稿ページで入力することで、過去の投稿出力を検索できます。先行計算は限られた時間しか保存されないことに注意してください。

拡張アセンブリー中の新しい融合部位の配置を決定する。この例では、新しいオーバーハング配列のうち2つが新しい融合部位に配置され、3つ目が新しい断片を既存のアセンブリーに接続しています（図6A）。

新しい融合部位の配置は状況に大きく左右されるが、いくつかの考察を以下に示す（「結果を理解する」を参照）。この例では、融合部位AをAmpR遺伝子の中央に配置し、融合部位BをAmpRとsfGFPの間に配置し、融合部位Cを目的プラスミドと元のアセンブリーの間の元の融合部位に置き換えた。

新しいオーバーハング配列を新しい融合部位に割り当てる。この例では、ACAAを融合部位Aに、GATAを融合部位Bに、CTGAを融合部位Cに配置した。

状況によって、融合部位へのオーバーハングの配置は完全に任意であったり、非常に特異的であったりする（いくつかの考察については、「結果の理解」を参照）。この例では、ACAAがAmpR遺伝子の希望する融合部位Aの近くに存在し、オーバーハングとして使用された。オーバーハングGATAとCTGAは、融合部位BとCの既存の配列と置き換えることで挿入された。

新しい断片の挿入配列を決定する。新しいオーバーハングをアセンブリー配列に配置した後、2つのオーバーハングの間の配列（オーバーハングを含む）を取ることにより、挿入配列を抽出することができる。この例では、挿入配列はSupporting Information Table S2にある。

この例では、断片をAmpR-1（融合部位1～融合部位A）、AmpR-2（融合部位A～融合部位B）、sfGFP（融合部位B～融合部位C）と定義した。

インサート配列をゴールデンゲートフラグメントに変換する。前のステップで抽出したインサート配列には、タイプIIS部位と関連するスペーサーが欠けているため、これを追加する必要があります。BsmBIを使用する我々の例では、CGTCTCA（スペーサー）を挿入配列の5′末端に付加し、TGAGACGを3′末端に付加してから合成し、pUC57-mini-BsaI-FreeまたはpUC57-mini-Kana-BsmBI-FreeのEcoRV部位に挿入した（Supporting Information Table S3）。

状況に応じて、断片配列は、既存または合成テンプレートからのPCR（サポートプロトコル1を参照）、既存または合成ソースからのDNAを含むプラスミド（この例で使用）、または合成DNAの直接使用（戦略的計画を参照）など、複数の方法で生成することができる。すべての場合において重要なのは、少なくとも6bpの5′配列の後に、目的のIIS型認識部位とそのIIS型酵素に適したスペーサー（BsaI、BsmBI/Esp3I、SapI/BspQIでは1bp、BbsI/BpiIでは2bp、PaqCI/AarIでは4bp）が存在することである。

既存のフラグメントを、拡張したアセンブリーに適合するように修正する。アセンブリーを拡張する最後のステップは、既存の融合部位にフラグメントを挿入することで生じる衝突を解決することである。この例では、新しい断片を既存のアセンブリーと目的プラスミドのGGAG融合部位に挿入する。この融合部位は目的プラスミドの一部であり、位置的にロックされている。したがって、その融合部位のもう半分を形成する断片を変更しなければならない。ここでは、フラグメントLacIZ-1のGGAGオーバーハングを融合部位CのCTGAオーバーハングに変更する必要がある。最終的なアセンブリー配列については、Supporting Information GenBankファイル15-part_Expanded_LacIZ_Assemblyを参照。

必要なオーバーハングの変更を行う最適な戦略は、展開前アセンブリーで使用するフラグメントの生成方法によって異なる。プラスミドに導入された断片の場合、部位特異的突然変異誘発は経済的な方法である。PCRで作られた断片の場合、プライマーの変更だけで済む可能性が高い。しかし、状況によっては、必要なオーバーハングを持つDNAを生成する技術であれば、どのようなものでも有効である。

断片DNAを作製し、アセンブリーと形質転換を行う(Basic Protocol 4を参照)。形質転換体を、アンピシリン（100μg/ml）、クロラムフェニコール（25μg/ml）、IPTG（0.2mM）、X-gal（80μg/ml）を含むLBプレートにプレートする。

最終的なアセンブリー結果の詳細については、図6Bと「結果を理解する」を参照。

基本プロトコール3：NEBridge SplitSetツールを用いた最適な融合サイトによるゲノム配列の分割
DAD駆動ゴールデンゲートアセンブリーの最も強力な使い方の1つは、NEBridge SplitSetツールを使って既存の配列をアセンブリーに適したフラグメントに分割することです。NEBridge SplitSetは、NEBridge GetSetと同様に、定義された検索ウィンドウと入力パラメータを使用して、配列から忠実度の高いオーバーハング・セットを選択することができます。例として、約40kbのT7バクテリオファージゲノムを12のフラグメントに分割する方法を説明します。この12個のフラグメントからアセンブリーを行うには、Basic Protocol 5を参照してください。

必要なリソース
最新のウェブブラウザを搭載したパソコンなど
Geneious、SnapGene、または類似の配列データ閲覧・編集用ソフトウェア
アセンブルするターゲットの配列ファイル（プレーンテキスト、FASTA、GenBankまたはその他の形式）。配列は、あいまいな位置のない正規のヌクレオチドのみを含んでいなければならない。
例 T7 ゲノム配列 (https://www.ncbi.nlm.nih.gov/nuccore/V01146.1?report=fasta)

入手可能な配列解析ソフトウエアを用いて、標的配列中の既存のIIS型酵素認識部位を見つける。この例では、Geneiousを用いてT7バクテリオファージゲノム中のPaqCI（AarIアイソキゾマー）部位を同定した。野生型T7ゲノムは、3942-3948位、8771-8777位、9387-9393位、9949-9955位、および17729-17735位に5つの部位を持つ（遺伝子のコンテキストについては、Supporting Information Table S4を参照）。

ゲノム解析には、オンラインツール（例：NEBCutter、https://nc3.neb.com/NEBcutter/）やフリーソフトウェアツール（例：SnapGene）など、適切なソフトウェアを使用することができる。同定は、ゲノム配列内のPaqCI認識部位（5′-CACCTGC-3′）を単に検索することによっても行うことができる。アセンブリーをデザインする際に、どの制限特異性を使うかを選択する論理については、Strategic Planningを参照。

https://ligasefidelity.neb.com/splitset/run.cgi、NEBridge SplitSet Toolに移動する。
Assembly name "フィールドにアセンブリ名を入力する。この例では、T7-PaqCIと入力する。

このフィールドは、ツールが出力するフラグメント配列の命名接頭辞として機能する。デフォルト値は "MyAssembly "である（図7）。

詳細は画像に続くキャプションにある
図7
図ビューアーで開く
パワーポイント
キャプション
4. アセンブリを直線状にするか円形にするかを選択します。この例では、circularを選択する。

線形アセンブリーの場合、ツールは入力された配列を線形として扱い、最初に入力された塩基を位置1として使用する。サーキュラーアセンブリーの場合、ツールはポジション1と最後の塩基位置を融合した連続配列を想定する。T7ファージは本来直鎖状ゲノムですが、この例では環状ゲノムをアセンブルしています。その理由の詳細については、Understanding ResultsおよびPryor et al.

オーバーハング長」ドロップダウンメニューからオーバーハング長を選択する。この例では4-baseを選択する。

この設定により、3塩基と4塩基のオーバーハングデータセットを分けて、次のステップでどのライゲーション条件を利用できるかが決まります。

Ligation conditions "ドロップダウンメニューから、最も代表的なライゲーション条件を選択する。この例では、PaqCI, 1×T4 DNA Ligase buffer, 37-16 cycling を選択する。

この設定により、ライゲーションフィデリティの推定計算に使用するライゲーションフィデリティデータセットを選択します。利用可能なデータセットは2つのカテゴリーに分類されます：(1)静的インキュベーション温度下でT4またはT7リガーゼによる事前に生成されたオーバーハングのライゲーションを評価するライゲーションのみのデータセット（Potapov, Ong, Kucera, et al., 2018; Potapov, Ong, Langhorst, et al., 2018）と、(2)GGAプロトコルを模倣した様々な条件下でIIS型制限酵素とT4リガーゼをインキュベートして生成したデータセット（Pryor et al.）最高の精度で予測するためには、選択したデータセットが、アセンブリーに使用する消化、ライゲーション、サイクリング条件と一致する必要がある。

Nucleotide Sequence "フィールドにアセンブルする全塩基配列を入力する。この例では、T7バクテリオファージの全ゲノム配列を入力する。
Use terminal overhangs as fusion sites (for linear assemblies only)」ボックスのチェックを外したままにする。

この設定は、5′末端と3′末端の3ヌクレオチドまたは4ヌクレオチド（選択したオーバーハングの長さ）を、ライゲーションフィデリティの計算にオーバーハングとして含めるかどうかを選択します。この設定は、目的プラスミドに挿入するための直鎖アセンブリーをデザインするときに特に役立ちます。5′末端と3′末端のヌクレオチドは目的プラスミドと相補的でなければならないことに注意してください。

Define split regions based on "で、ドロップダウンメニューからアセンブリーに適したオプションを選択する。この例では、Split regionsを選択する。

分割領域を定義する4つのオプションは、フラグメント数（number of fragments）、最大フラグメントサイズ（maximum fragment size）、最小フラグメントサイズ（minimum fragment size）、分割領域（split regions）です。フラグメント数（number of fragments）の設定により、配列は次のフィールドで要求されたフラグメント数に均等に分割される。次のステップで定義される融合部位の数は、リニアアセンブリーかサーキュラーアセンブリーのどちらを選択したかに依存することに注意してください。最大および最小フラグメントサイズオプションは、フラグメント数の設定と同様に機能しますが、次のフィールドに入力されたフラグメントサイズの最小値または最大値に基づいてフラグメント数を選択します。これらの設定は、フラグメントが合成DNAのベンダー要件に適合する必要がある場合に便利です。分割領域の設定では、カンマで区切られた "window-start-position "と "window-end-position "の入力形式で範囲ウィンドウを入力することにより、ウィンドウまたは融合部位の位置を事前に定義することができます。すべての設定で入力可能な範囲は、3-50フラグメント（含む）です。Use terminal overhangs as fusion sites (for linear assemblies only) "をチェックすると、リニアアセンブリに2つのオーバーハングが追加されますが、これらのオーバーハングの位置は編集できません。

ドロップダウンメニューに続くフィールドに、アセンブリの定義済み分割領域を入力します。この例では、次のように入力します：

3940-3950, 8770-8780, 9385-9395, 9952-9962, 15575-15585, 17725-17735, 23290-23300, 26630-26640, 29715-29725, 29945-29955, 33260-33270, 36584-36594

この例では、いくつかの融合部位は、ネイティブPaqCI部位に家系化変異を導入するためにPCRベースの部位特異的突然変異誘発を使用する場所の近くに、±5ヌクレオチドの狭い検索ウィンドウで制限されている。融合部位から遠すぎると、プライマーの3′末端近くのミスマッチにつながる可能性があるため、可能であれば融合部位を家畜化標的から10ヌクレオチド以内に保つことを推奨する。融合部位の配置の自由度が高い場合は、サーチウィンドウを広く設定することができる（50-200塩基対など）。ブレイクポイントの配置の詳細については、結果の理解と戦略的計画を参照。

Define split regions "をクリックする。

分割領域の設定が選択されているので、ステップ 10 で入力された値は、ツールが各ブレークポイントの融合部位を選択するために使用できるゲノムの領域を自動的に定義します。他の設定が選択されている場合、ツールはフラグメント数または最大/最小フラグメントサイズに基づいて、±25ヌクレオチドのウィンドウで等間隔に融合部位を選択することで、これらのウィンドウを自動的に定義します。Define split regions "を押すと、デフォルトの選択項目が表示されます。デフォルト値は多くのアセンブリーに適していますが、ユーザーはデフォルトのブレークポイント領域と検索ウィンドウを手動で変更することができます。

Excluded overhangs (5′→3′)" フィールドに除外するオーバーハングを入力する。この例では、このフィールドは空白のままにしておきます。

基本プロトコル2と同様に、これらのオーバーハングは完全に除外され、選択されたオーバーハングセットが除外されたオーバーハングと互換性があるかどうかは考慮されません。この入力は、これらのオーバーハングが最終セットで使用されるのを防ぐだけである。この機能は、ホモポリマー（例えばCCCC）やTNNA（ライゲーション効率が低い）の配列を持つオーバーハングなど、潜在的に問題のあるオーバーハングを除外するのに便利です。この機能は、反復最適化を行う際に、特定の融合部位候補を除外するためにも使用できる）。

Submit "をクリックする。

プロトコルの実行には、リクエストされたフラグメントの数にもよりますが、数秒から数分かかります。出力は、NEBridge GetSet（基本プロトコール2参照）で作成されるフィデリティテーブルと融合部位リストと同様で、さらに上流と下流のオーバーハングを含む全フラグメントの配列リストが出力されます。詳細な出力と最終的なアセンブリーデザイン情報については、図7B、Supporting Information 図S6と表S5を参照。

NEBridge SplitSetの出力断片を増幅するプライマーを設計し、適切なスペーサーとType IIS部位を付加する。この例では、配列GGCTACCACCTGCGACT（スペーサー）をすべてのプライマーの5′末端に付加した。

5′プライマー伸長構造は、制限酵素の完全な活性を保証するための末端スペーサー（GGCTACを普遍的な6bp末端スペーサーとして使用する）、タイプIIS認識部位（PaqCIの場合はCACCTGC）、制限酵素特異的スペーサー（PaqCIの場合は4bpスペーサーが必要）からなる。

15.適切なプライマーにサイレント点変異を導入し、断片を家畜化する。この例では、変異の位置と最終的なプライマー配列のリストについては、それぞれSupporting Information Table S4とS6を参照。最終的なアセンブリー配列については、Supporting InformationのGenBankファイルを参照のこと。

家畜化プライマー設計の説明は、Marillonnet & Grutzner (2020)のBasic Protocol 2に記載されている。このアセンブリーのためにPCRで導入した家畜化変異の例については、図7Cを参照のこと。

基本プロトコール4：12フラグメントのワンポットGOLDEN GATEアセンブリーからデスティネーションプラスミドへ
GGAの最も一般的な応用は、複数のフラグメントから組み立てられたプラスミドの作成である。このプロトコールでは、12個のDNA断片を選択可能な抗生物質耐性マーカーを持つ目的プラスミドにワンポットアセンブリーするためにGGAを使用する。このプロトコールは、12-23個の断片のアセンブリーに推奨する。この例では、図6Aに示すように、断片が集合してLacIとLacZのカセットを形成し、X-gal上でプレーティングすると、正しい集合では青いコロニーが、正しくない集合では白いコロニーが生じる（Potapov, Ong, Kucera, et al.）アセンブリーの融合部位はBasic Protocol 3に従って選択した。断片の5′末端と3′末端は、IIS型認識部位（この場合はBsmBI）とスペーサーヌクレオチドで挟まれている。DNA断片は保持プラスミドにクローン化され、直接アセンブリーで使用される。使用したパーツ配列とオーバーハングについては、Supporting Information Table S1を参照。アセンブリーデザインとパーツ調製において重要なその他の要素については、戦略的計画と重要なパラメータを参照のこと。パーツはminiprep（例えば、Current ProtocolsのEngebrechtら、1991）で精製し、Qubit（Support Protocol 3参照）、Nanodrop、または同様の方法で定量する。

材料
12個のLacIZパートベクター（LacIZ-12-F1～LacIZ-12-F12；パート配列はSupporting Information Table S1を参照）の等モルパーツマスターミックス
目的プラスミド：pGGAselect (New England Biolabs, cat. no. N0309A)
10× T4 DNA Ligase Reaction Buffer (New England Biolabs, cat. no. B0202)
NEBridge Golden Gate Enzyme Mix (BsmBI-v2) (New England Biolabs, cat. no. M2617)
ヌクレアーゼフリー水（New England Biolabs, cat.）
T7 Expressコンピテント大腸菌（New England Biolabs、cat.no. C2566）
SOC Outgrowth Medium（New England Biolabs、カタログ番号 B9020S）
25μg/mlクロラムフェニコール、0.2mM IPTG、80μg/ml X-galを含むLBプレート（Current Protocols article Elbing & Brent, 2019を参照

0.2-ml PCRチューブ（USA Scientific、カタログ番号1402-8108）
サーモサイクラー（Bio-Rad T100 Thermal Cycler、カタログ番号1861096）
1.5-ml DNA LoBindチューブ（エッペンドルフ社製、カタログ番号 022431021）
42℃ヒートブロック
チューブシェーカー
ガラスプレートビーズ（Sigma-Aldrich、カタログ番号 71013）
37℃インキュベーター
組み立ての実行

以下の成分を0.2ml PCRチューブに入れる：

最終濃度3 nMの等モルパーツマスターミックス
1.09 μl 55 nM (75 ng/μl) pGGAselect
2 μl 10×T4 DNAリガーゼ反応バッファー
2 μl NEBridge Golden Gate Enzyme Mix (BsmBI-v2)
ヌクレアーゼフリー水 20μl
NEBridge Ligase Master Mix などの異なる酵素源を使用する場合や、Type IIS と T4 DNA リガーゼを手動で混合する場合は、容量を調整することができます。

静かに5～10回ピペッティングしてよく混合し、微量遠心機で10秒間スピンダウンする。
サーモサイクラーに入れ、以下のサイクリングプロトコルを実行する：

(42℃、5分→16℃、5分）×30サイクル→60℃、5分。
通常、フラグメント数が24未満のアセンブリーには30サイクルで十分であるが、フラグメント数が24以上のアセンブリーには60サイクルを推奨する。しかし、サイクル数を増やしても効率や忠実度が低下することはほとんどない。

完成したアセンブリーの配列については、Supporting Information GenBankファイル12-part_LacIZ_Assemblyを参照のこと。

形質転換に使用するまで、温度を4℃に下げる。

アセンブリーは4℃で1週間、-20℃で6ヶ月間保存することもできる。

産物を大腸菌に形質転換する。
5. T7 Express細胞を氷上で10分間解凍する。

50μlのT7 Express細胞を1.5mlのDNA LoBindチューブに分注します。
1. 5μlのアセンブリー反応を加え、チューブを軽く4回振って混合し、氷上で30分間インキュベートする。
細胞を42℃で10秒間ヒートショックする。
細胞を5分間氷上に戻す。
950μl SOC Outgrowth Mediumを添加し、37℃で1時間振盪培養する（225rpm）。
ガラスビーズを用い、5μlの細胞をクロラムフェニコール、IPTG、X-galを含む予熱したLBプレートにプレートする。

アセンブリーの評価
12. 青色コロニーを陽性、白色コロニーを陰性とする。

組み立ての忠実度を以下のように計算する：

%
忠実度

青い
コロニー
/
合計
コロニー
×
100
ここで使用したLacIZシステムは、DADの原理で計算した推定忠実度より、実測忠実度が約5％高いことがわかった。これは、多くの不正確なアセンブリーが不完全（すなわち直線状）であるために形質転換できず、その結果、白色コロニーが過小にカウントされたためであると考えられる。視覚的な方法を用いない場合、完全長の集合体を含むクローンはコロニーPCRを用いて同定できる（Woodman et al.） DADの原則を使用して高精度のアセンブリーをデザインした場合（Basic Protocol 2または3など）、すべてのフラグメントを含むアセンブリーは完全に正しい可能性が非常に高い。しかし、コンストラクトの最終的なバリデーション、特にPCRで作製したフラグメントを含むアセンブリーのバリデーションにはシークエンシングを推奨する。

代替プロトコール2：24以上のフラグメントをデスティネーションプラスミドにワンポットゴールデンゲートアセンブリーする。
このプロトコールでは、選択可能な抗生物質耐性マーカーを持つ目的プラスミドに24以上のDNA断片をワンポットでアセンブリーするための代替GGAプロトコールについて説明する。この例では、挿入断片は基本プロトコール4と同じLacIとLacZカセットを組み立てるが、挿入断片の数は2倍で、それぞれの大きさはおよそ半分である。インサートフラグメントは、12フラグメントアセンブリーのオーバーハングが24フラグメントアセンブリーで再利用されるように分割される。このように断片を分割できることは、GGAの柔軟性をよく示すものであり、12断片アセンブリーの断片を24断片アセンブリーに置き換えることができるため、パーツの交換やシステム・エンジニアリングが容易になる。このプロトコルで使用したアセンブリーでは、同じ最終製品を用いて、フラグメント数を増やすことによるアセンブリー効率への影響を評価することもできる。フラグメントのサイズ自体はアセンブリーにおいて重要な要因ではないようだが、非常に小さい（<25 bp）、あるいは非常に大きい（>>10 kb）フラグメントでは、それらのサイズのDNAで通常の問題が発生する可能性がある。すなわち、非常に小さなDNA二重鎖は熱的に不安定で溶ける可能性があり、一方、非常に大きなDNAは剪断やその他の機械的損傷を受ける可能性がある。これらの両極端の中で、断片サイズは任意であり、業者から入手できる合成DNAの長さなど、多くの外的要因によって決定される。断片の配列とオーバーハングについては、Supporting Information Table S7を参照のこと。

追加材料（基本プロトコール4も参照）
24個のLacIZパーツベクターの等モルパーツマスターミックス（LacIZ-24-F1～LacIZ-24-F24；パーツ配列はSupporting Information Table S7参照）

基本プロトコール 4 のステップ 1-2 を参照）。
サーモサイクラーにセットし、以下のサイクリングプロトコルを実行する：

(42℃、5分 → 16℃、5分）×60サイクル → 60℃、5分
サイクル数が30から60に増えていることに注意。サイクル数は60回を超えても増やすことができるが、IIS型酵素とT4 DNAリガーゼは一般的にサイクル数が多くなると分解し始めるので、収穫は少なくなる。極端なアセンブリー効率が望まれる場合（例えば、基本プロトコール5におけるT7バクテリオファージゲノムのアセンブリー）には、90サイクルを行うことができる。

完成したアセンブリーの配列については、Supporting Information GenBankファイル24-part_LacIZ_Assemblyを参照。

3.形質転換、プレーティング、アセスメントを記載通りに行う（基本プロトコール4のステップ4～13を参照）。

基本プロトコール5：12以上のパーツからなるT7 BACTERIOPHAGEゲノムのワンポットGOLDEN GATEアセンブリー
ゴールデンゲートアセンブリーのもう一つの魅力的なアプリケーションは、1回の反応で小さなゲノム全体をアセンブリーすることです。このプロトコールでは、PaqCIとT4 DNAリガーゼを用いた12、24、または36のPCRアンプリコン断片（サポートプロトコール1を参照）のワンポット集合体を用いたT7バクテリオファージの集合体とレスキューについて説明する（図8A）。断片はBasic Protocol 3と同様に設計した（PCRプライマーと断片配列の詳細については、Supporting Information Table S6, S8-S10およびGenBankファイルを参照）。このプロトコールは、Support Protocol 1のガイドラインに従って調製・精製されたパーツが等モル比で混合されていることを前提としている。フラグメントデザインの詳細については、Figure 7, Strategic Planning, Critical Parameters, Basic Protocol 3を参照のこと。アセンブリーのデザインと実行については、図8を参照。

詳細は画像に続くキャプションに記載
図8
図ビューアーで開く
パワーポイント
キャプション
追加材料（基本プロトコール4も参照）
12、24、または36のT7パーツからなる等モルパーツマスターミックス： PaqCI-12-F1～PaqCI-12-F12、PaqCI-24-F1～PaqCI-24-F24、またはPaqCI-36-F1～PaqCI-36-F36（調製法についてはサポートプロトコル1を参照；プライマーについてはサポート情報表S6を参照；パーツ配列についてはサポート情報表S8～10を参照）
10 U/µl PaqCI（New England Biolabs、カタログ番号R0745）
20 mM PaqCI activator（New England Biolabs、カタログ番号 S0532）
400 U/µl T4 DNA Ligase（New England Biolabs、カタログ番号 M0202S）
NEB 10-beta Electrocompetent E. coli (New England Biolabs, cat. no. C3020K)
NEB 10-beta/Stable Outgrowth Medium（New England Biolabs、カタログ番号 B9035S）
トップアガー（Elbing & Brent, 2019）
抗生物質無添加LB寒天培地（Elbing & Brent, 2019

1mmギャップエレクトロポレーションキュベット (BTX、cat. no. 45-0134)
Gene Pulser Xcelエレクトロポレーションシステム（Bio-Rad、カタログ番号1652660）
5mlスクリューキャップチューブ（MTC Bio、カタログ番号 C2540）
組み立ての実行

以下の成分を0.2ml PCRチューブに入れる：

最終濃度3 nMの等モルパーツマスターミックス
2 μl 10× T4 DNAリガーゼバッファー
2 μl PaqCI
0.5 μl PaqCIアクチベーター
2 μl T4 DNAリガーゼ
ヌクレアーゼフリー水 20 μl
2. 静かに5～10回ピペッティングしてよく混合し、微量遠心機で10秒間スピンダウンする。

サーモサイクラーに入れ、以下のサイクリングプロトコルを実行する：

(37℃、5分→16℃、5分）×90サイクル→60℃、5分。
サイクルの回数を30回や60回に減らして、より速く組み立てることもできますが、観察されるPFU/μlは減少します。一般的に、12個の断片であれば30サイクルで十分であり、24個以上の断片であれば60サイクルが推奨される。しかし、アセンブリー反応に必要な時間が増えるだけで、サイクル数を増やしてもデメリットはほとんどない。

完成したアセンブリーの配列については、Supporting InformationのGenBankファイルを参照のこと。

任意である：形質転換の前に、TapeStation（Support Protocol 4；図8C参照）あるいは大きな（約40kb）DNAコンストラクトを可視化するのに適した他のシステムでアセンブリーを検証する。

ファージの起動
5. mmギャップのエレクトロポレーションキュベットを氷上で予冷する。

NEB 10-βエレクトロコンピテント細胞を氷上で10分間解凍する。
50 µlの細胞を1.5 mlのDNA LoBindチューブに分注します。
1. 1 µlのアセンブリー産物を加え、軽く2-3回ピペッティングして混合する。

より多くのプラークが必要な場合は、2.5 µl まで問題なく添加できます。ただし、2.5 µlを超えると、エレクトロポレーション中にアーク放電を起こすことがあります。2.5 µl以上必要な場合は、細胞量を増やすか、使用前にアセンブリーを脱塩する必要があります。

DNA/細胞混合液を冷やしたキュベットに移し、氷上に置く。

移した後のサンプルに気泡がないことを確認する。

Bio-Rad Gene Pulser Xcellエレクトロポレーションシステムを以下の設定でセットアップする：

電圧 = 1800 V
キャパシタンス = 25 µF
抵抗 = 200 Ω
キュベット = 1 mm
これらは、"Preset Protocols" → "Bacteria" → "E. coli - 1mm, 1.8kV "のデフォルト設定です。

キュベットの外側の余分な水分を拭き取り、Xcell ShockPod キュベットチャンバーにセットします。

アーク放電の可能性を減らすため、キュベットから水分を取り除くのが最善です。

Pulse "を押して、試料をエレクトロポレーションします。
すぐに950μlのNEB 10-beta/Stable Outgrowth Mediumを加え、細胞を新しい1.5ml DNA LoBindチューブに移します。
細胞を37℃で1.5時間、振盪（225 rpm）しながらoutgrowthで回復させる。
LB寒天培地（抗生物質不使用）を37℃に予熱する。
1. 5mlのスクリューキャップチューブに、100～500μlのoutgrowth培養液を加え、さらに最終容量が3mlになるように十分な量の溶融（47℃）上面寒天を加える。

プラークの分離を確実にするため、通常2回希釈する： 100μl培養液＋2.9ml上面寒天培地、および500μl培養液＋2.5ml上面寒天培地である。

17.ホモジナイズするために、1～2秒間軽く振り混ぜる。

撹拌は、完全に混合するのに十分な強さであるが、気泡が入らない程度に穏やかに行う。

あらかじめ温めておいたLB寒天培地プレートに混合液を注ぎ、揺すって均一に広げ、室温で10分間放置して上面寒天培地を固化させる。
プレートを逆さにし、プラークが形成されるまで37℃で培養する。

プラークは通常、5～6時間培養後に現れ始める。あるいは、プレートを30℃で一晩培養することもできる。

インキュベーターからプレートを取り出し、評価まで4℃で保存する。プラークを含むプレートの例については図8Dを参照のこと。

効率の評価
21. プラークを数え、アセンブリー反応1μlあたりに形成されたプラーク数としてウイルスアセンブリー効率を決定する：

効率
(
PFU
/
ml
)

プラーク
/
�
/
�
ここで、Fはプレーティングされたoutgrowth cultureの割合、Vはエレクトロポレーションに使用した集合体の体積である。100プラークのプレートでは、1µlの集合体のエレクトロポーレーションから100µlのoutgrowth cultureがプレーティングされた：

効率

100
プラーク
/
100
�
l
メッキ
アウトグロース
/
1000
�
l
合計
成長
/
1
�
l
アセンブリ

1000
PFU
/
�
l
最終産物はシーケンスバリデーションが可能である（サポートプロトコル5参照）。

サポートプロトコール1：高純度アンプリコンの作製
PCR法を用いて高複雑度アセンブリー用の断片を作製する場合、確実な結果を得るためには高純度のアンプリコンDNAが必要である。IIS部位を含むプライマーダイマーやオフターゲット増幅産物のような不純物は、意図したアセンブリー産物の生成を妨害するアセンブリー活性オーバーハングを生成する可能性がある（トラブルシューティングとSupporting Information Figure S2を参照）。厳密な精製はこれらの不純物を減らし、アセンブリー部分をより正確に定量することを可能にする。このプロトコールでは、Q5 DNAポリメラーゼとMonarch PCR & DNA Cleanup Kitを用いたPCR DNAの生成と精製について説明する。

追加材料（基本プロトコール4-5も参照）
Q5 Hot Start High-Fidelity 2× Master Mix (New England Biolabs, cat. no. M0494L)
10 µM プライマー、ヌクレアーゼフリー水（基本プロトコール 5 でフラグメントを生成するために使用したプライマーについては、Supporting Information Table S6 を参照のこと）
1 ng/µl 鋳型DNA（Basic Protocol 5でアンプリコンを生成するには、T7 gDNAを使用する。310005)
Monarch PCR & DNA Cleanup Kit (5 μg) (New England Biolabs, cat. no. T1030L)
HPLCグレードイソプロパノール（Sigma-Aldrich, cat.）
200プルーフエタノール (Sigma-Aldrich, cat. no. E7023)
PCRの実施

各PCRを0.2ml PCRチューブに以下のようにセットする：

25 μl Q5 Hot Start High-Fidelity 2× Master Mix
2.5 μl 10 µM フォワードプライマー
2.5 μl 10μMリバースプライマー
1.0 μl 1 ng/μl 鋳型DNA
19 μl ヌクレアーゼフリー水
複数の同一のPCRを同時に行うことで、生成するアンプリコンの量を増やすことができ、最終的なDNA収量と濃度を高めることができる。

2-3秒間微量遠心する。
サーモサイクラーに入れ、蓋の温度を105℃にして以下のプロトコルを実行する：

98℃、30秒→（98℃、10秒→Ta、30秒→72℃、30秒/kb）×35サイクル→72℃、2分→10℃でホールド。

アニーリング温度（Ta）は、使用する正確なプライマー配列に依存する。https://tmcalculator.neb.com/#!/mainにあるTa計算機を使用して、プライマーセットに最適なTaを決定する。伸長時間は、生成されるアンプリコンの長さに依存する。kbあたり最低30秒を推奨する。

産物を精製する。
4. Binding BufferとWash Bufferの1×作業溶液をMonarch PCR & DNA Cleanup Kitの説明書に従って調製する。

Binding Buffer: 濃縮バッファーに63.6 mlのイソプロパノールを加える。
Wash Buffer: 100 mlのエタノールを濃縮バッファーに加える。
5. PCR産物を1.5mlのDNA LoBindチューブに移す。

収量を上げるために同じPCRを複数回行った場合は、ここで1つのチューブにまとめることができる。

50 µl の PCR 産物に対して、2 kb 未満の場合は 250 µl の Binding Buffer を、2 kb 以上の場合は 100 µl の Binding Buffer を加える。上下に10回ピペッティングして混合する。
DNA 結合カラムを付属のコレクションチューブに入れる。
希釈したPCR産物をカラムにロードし、16,000×gで1分間遠心する。
フロースルーを捨て、カラムをコレクションチューブに戻す。
カラムに Wash Buffer を 200 µl 加え、16,000 × g で 1 分間遠心する。
さらに 200 µl の Wash Buffer を加え、16,000 × g で 1 分間遠心します。
フロースルーを捨て、カラムを回収チューブに戻す。

この追加スピンにより、カラムからエタノールが完全に除去されます。

16,000 × g で 1 分間遠心する。
カラムを新しい 1.5 ml DNA LoBind チューブに移す。
メンブレンに触れないように注意しながら、15μlのヌクレアーゼを含まない水をメンブレンに直接ピペットする。
室温で3分間インキュベートし、結合したDNAを溶出する。
16,000×gで1分間遠心する。
カラムを取り出して廃棄する。
バイオアナリシス、ゲル電気泳動、または同様の方法でフラグメントの純度を評価する。Qubit（推奨、サポートプロトコル3参照）またはNanodropでサンプル濃度を測定する。

オフターゲット・バンドが顕著に確認される場合は、追加精製（例：ゲル精製）が望ましい。アセンブリーは可能ですが、不純物の多いアンプリコンでは効率（総 PFU/µlアセンブリーで測定）に大きな影響が出る可能性があります。

サポートプロトコール2：ホールディングベクターへのアセンブリーパーツのクローニング
頻繁に再利用される、あるいは操作（例えば部位特異的突然変異誘発）が必要なパーツについては、増殖、精製、配列検証を容易にするために、PCRで生成した、あるいは購入した合成フラグメントを保持ベクターにクローニングすることがしばしば便利である。ここでは、PCR断片をpUC57-mini-BsaI-Freeベクター（配列はSupporting Information Table S3を参照）のEcoRVサイトにブラントクローニングするプロトコルを紹介する。大腸菌でクローン化することが常に可能とは限らないことに注意されたい；これは、パーツが有毒であったり、高度に反復するエレメントを含んでいたりする場合には推奨されない。

追加材料（基本プロトコール4-5とサポートプロトコール1を参照）
pUC57-mini-BsaI-Free（Supporting Information Table S3）またはユーザー提供の保持ベクター（100 ng/µl
10× CutSmart バッファー（New England Biolabs, cat.）
20 U/μl EcoRV-HF（New England Biolabs、カタログ番号 R3195S）
5 U/μl Quick CIP (New England Biolabs, cat. no. M0525S)
インサートDNA：精製PCRアンプリコン（サポートプロトコル1を参照）または市販の合成直鎖DNA
Quick Blunting Kit (New England Biolabs, cat. no. E1201S)：10×Blunting Buffer、Blunting Enzyme Mix、1mM Deoxynucleotide Solution Mixを含む。
Quick Ligaseと2×Quick Ligation Reaction Bufferを含むQuick Ligation Kit (New England Biolabs, cat. no. M2200S)
NEB 5αコンピテントセル大腸菌（高効率）（New England Biolabs, cat.）
100μg/mlアンピシリンを添加したLB寒天プレート（Elbing & Brent, 2019）
ベクターの調製

50μlのEcoRV-HF消化物を以下のようにセットし、ベクターを直鎖化および脱リン酸化する：

10 µl 100 ng/µl pUC57-mini-BsaI-Free
5 µl 10× CutSmartバッファー
2 µl 20 U/µl EcoRV-HF
2 µl 5 U/µl Quick CIP
31 µl ヌクレアーゼフリー水
2. サーモサイクラーで37℃、1時間インキュベートする。

EcoRV-HFとQuick CIPを80℃で10分間熱失活させる。
消化したDNAを説明通りに精製する（サポートプロトコール1のステップ4-19を参照）。ベクター濃度を決定した後、ヌクレアーゼフリー水を用いて10 nMに希釈する。

インサートの調製
5. インサートDNAをヌクレアーゼフリー水で60 nMに希釈する。

25μlのQuick Blunting反応を以下のようにセットアップし、インサートDNAを鈍化させ、リン酸化する：

5 µl 60 nM インサート DNA
2.5 µl 10× Blunting Buffer
2.5 µl 1 mM デオキシヌクレオチド溶液ミックス
1 µl Blunting酵素ミックス
14 µl ヌクレアーゼフリー水
7. 25℃で20分間インキュベートする。

70℃で10分間インキュベートし、酵素ミックスを失活させる。

インサートとベクターをライゲーションする。
9. 20μl のライゲーション反応を以下のようにセットする：

10 µl 2× Quick Ligation Reaction Buffer
5 µl 12 nM インサート
2 µl 10 mM 直鎖化ベクター
2 µl ヌクレアーゼフリー水
1 µl Quick Ligase
10. 25℃で5分間インキュベートした後、4℃で保持する。

大腸菌にトランスフォームする
11. NEB 5αコンピテント大腸菌50μlチューブを氷上で解凍する。

1. ライゲーション反応液2µlを加え、軽く4-5回フリックして混合し、氷上で30分間インキュベートする。
細胞を42℃で正確に30秒間ヒートショックし、チューブを氷上に戻して5分間静置する。
950μl の室温SOC培地を加え、攪拌しながら37℃で1時間インキュベートする。
1. 100 µlのoutgrowth培養液を、100 µg/mlのアンピシリンを加えた予熱したLB寒天培地にプレートし、37℃で一晩培養する。
コロニーPCR（Woodmanら、2016）を用いて挿入DNAを含むコロニーを同定し、シークエンシングで挿入を確認する。
17.クローニングしたプラスミドからGGA用の高品質DNAを作製するには、標準的なミニプレッププロトコール（例えば、Engebrechtら、1991）に従うか、市販のプラスミド精製キットを使用する。

サポートプロトコール 3：QUBIT 4 フルオロメーターを用いた DNA 濃度の測定
ゴールデンゲートアセンブリー用のDNA濃度を測定するプロトコルを以下に説明する。このプロトコールにより、DNA増幅とプラスミド精製の成功をモニターし、アセンブリー反応に正しいモル比が使用されていることを確認することができます。

追加材料（基本プロトコール4も参照）
Qubit 1× dsDNA Broad Range (BR) Assay Kit（Thermo Fisher Scientific 社、cat. No. Q33265）（1× dsDNA BR Working Solution、Qubit dsDNA BR Standards #1 および #2 を含む
アッセイするDNAサンプル（SP1、SP2を用いて作製したもの、または合成dsDNAまたはプラスミドとしてベンダーから購入したもの）
Qubit Assay Tubes（Thermo Fisher Scientific、カタログ番号 Q32856）
Qubit 4 Fluorometer（Thermo Fisher Scientific、カタログ番号 Q33238）

190μl の 1× dsDNA BR Working Solution を 2 本の Qubit Assay Tubes に加える。
片方のチューブに10µlのスタンダード#1を、もう片方のチューブに10µlのスタンダード#2を加える。2～3秒間ボルテックスし、2～3秒間微量遠心する。
1. 1×dsDNA BR作業溶液199µlを、測定する各サンプルごとに1本のQubit Assay Tubeに分注します。
各チューブに1µlのDNAサンプルを加える。2～3秒間ボルテックスし、2～3秒間微量遠心します。
すべてのチューブを室温で2分間放置する。
蛍光光度計のホーム画面で、1× dsDNA Broad Range（BR）アッセイを選択し、プロンプトに従って標準品とサンプルを読み取ります。
濃度が100 ng/µl未満のサンプルの場合は、このステップで中止し、ステップ6で決定した濃度を使用してパーツマスターミックスを作成します。濃度が100 ng/µlを超えるサンプルについては、DNAサンプルの一部を20～50 ng/µlに希釈し、ヌクレアーゼを含まない水を用いて最終容量≥10 µlまで希釈し、ステップ8～11と同様に再度測定します。

必要な希釈量はDNAの供給源によって異なります。サポートプロトコール1を用いて作製したアンプリコンDNAは、おそらく希釈を必要としない。業者から購入したプラスミド DNA は 50 倍希釈が必要な場合があります。

1. 再測定する各サンプルについて、1×dsDNA BR Working Solutionを190µlずつQubit Assay Tubeに分注します。
各チューブに10µlの希釈DNAサンプルを加える。2～3 秒間ボルテックスし、2～3 秒間微量遠心します。

10 µl のサンプルを使用することで、より安定した濃度測定が可能ですが、測定に使用するサンプルの割合とのバランスを考慮する必要があります。サポートプロトコール 1 に従って作成されたサンプルの場合、サンプル濃度は通常 50 ng/µl 未満であり、定量に 1 µl のサンプルを使用するとサンプル総量の約 7 % を消費するため、1 µl を超えるサンプルの使用は現実的ではありません。高濃度サンプルの場合、高精度の測定を得るために全サンプルのごく一部を使用することは、一般的にサンプル消費量に見合う価値があります。

ステップ5～6を繰り返して測定を行います。
測定濃度にステップ7での希釈係数を乗じて、サンプル濃度を決定します。この濃度を用いてパーツマスターミックスを作製する。

極端な濃度精度が必要な場合は、複数回測定を行って平均化することで、精度を高めることができます。

サンプル濃度が低すぎてパーツマスターミックスを調製できない場合は、溶出量を少なくしてカラム精製（サポートプロトコル1のステップ4～19を参照）を繰り返すことにより、サンプルを濃縮することができます。また、遠心式真空濃縮機（SpeedVacなど）を使用してサンプルを濃縮することもできます。

サポートプロトコル4：タペストリーによる大きなアセンブリーの可視化
ここでは、Agilent TapeStationシステムを使用して、最終組立品を可視化する方法について説明します。これは、アセンブリー反応の成功を評価する半定量的ツールとして使用できます。

追加材料 (基本プロトコール 4 も参照)
完成した GGA 反応（基本プロトコール 4-5 および代替プロトコール 2 を参照）または解析する他の DNA サンプル
Genomic DNA Ladder および Sample Buffer (Agilent, cat. no. 5067-5366)
光学チューブストリップおよびキャップ（Agilent、カタログ番号 401428 および 401425）
IKA MS3 ボルテックスシェーカー MS 3.5 PCR プレートアタッチメント (IKA, cat. nos. 0003319000 and 0003428000)
4200 TapeStation システム (Agilent, cat. no. G2991BA)
ローディングチップ（Agilent、カタログ番号 5067-5598）
ゲノムDNA ScreenTape (Agilent cat. no. 5067-5365)

すべての試薬を室温で少なくとも 30 分間平衡化させます。
GGAアセンブリーサンプルを微量遠心機で10秒間スピンダウンする。
10 µl の Genomic DNA Sample Buffer と 1 µl の Genomic DNA Ladder を光学チューブストリップの最初の位置にピペットする。
各サンプルについて、10 µl の Genomic DNA Sample Buffer と 1 µl の GGA 反応液をチューブストリップの後続のウェルにピペッティングします。

プレアセンブリー反応のサンプルや、コントロールとして T4 DNA ligase や Type IIS 酵素を欠失させたコントロール反応を行うことは、多くの場合有益である。最終的なアセンブリーに近いサイズの DNA サンプル（例えば、Basic Protocol 5 の T7 gDNA）があれば、それをアセンブリーのポジティブコントロールとして使用することもできる。

チューブストリップにキャップをし、2000rpmに設定したIKA MS3ボルテックスシェーカーで1分間攪拌する。
サンプルを微量遠心機で 1 分間スピンダウンする。

液体がチューブの底にあり、泡がないことを確認する。

メーカーの指示に従って4200 TapeStationを準備する。装置に十分なローディングチップがあることを確認する。
Genomic DNA ScreenTapeを4200 TapeStationシステムに挿入する。
TapeStation Controllerソフトウェアで、適切なサンプル位置を選択し、各サンプル名を入力する。
チューブストリップホルダーのA1の位置にラダーを置き、装置にサンプルをセットする。
TapeStation Controllerソフトウェアの "Start "をクリックする。

検査が終了したら、TapeStation Analysisソフトウェアで結果を見ることができる。この方法で可視化したアセンブリーの例については、図8CまたはSupporting Information 図S1～S2を参照のこと。

サポートプロトコール 5：ONT LONG-READ SEQUENCING による PHAGE ゲノムアセンブリーの検証
多くの場面で、アセンブリーの配列を検証し、すべてのパーツが正しい順序で存在し、パーツの生産やアセンブリー中に意図しない変異が導入されていないことを確認することが重要である。このプロトコールでは、培養ファージから単離されたT7ウイルスゲノムの配列を検証するためのワークフローを説明する。手順には、ウイルスゲノムDNAの単離、ライブラリーの調製、Oxford Nanopore Technologies (ONT)のロングリードシーケンスによるデータ収集、最後にONTシーケンスデータの処理とシーケンスアセンブリが含まれます。バクテリオファージの取り扱いと特性解析に関する詳しい情報は、Current ProtocolsのPelzek et al.

材料
NEB 10-beta Electrocompetent E. coli（New England Biolabs、cat.No. C3020K）または他の適切なT7宿主株。
LB培地（Elbing & Brent, 2019）
T7ファージプラークを含むLBプレート（基本プロトコール5参照）
ファージ希釈バッファー（レシピ参照）
PEG 8000（シグマアルドリッチ、カタログ番号89510）
NaCl（シグマアルドリッチ、カタログ番号 793566）
Monarch HMW DNA Extraction Kit for Tissue (New England Biolabs, cat. No. T3060S)を含む：
Monarch HMW gDNA組織溶解バッファー
Proteinase K（分子生物学グレード）
Monarchタンパク質分離溶液
Monarch 2mlチューブ
Monarch DNA Capture Beads
Monarch gDNAウォッシュバッファー
モナークビーズリテーナー
MonarchコレクションチューブII
Monarch gDNA 溶出バッファー II
HPLCグレードイソプロパノール（Sigma-Aldrich, cat.）
Ligation Sequencing Kit（Oxford Nanopore Technologies、カタログ番号 SQL-LSK109）
Native Barcoding Expansion（Oxford Nanopore Technologies、cat.No. EXP-NBD104またはEXP-NBD114）
アダプターミックスIIエクスパンション（Oxford Nanopore Technologies、カタログ番号EXP-AMII001）
NEB Blunt/TA Ligase Master Mix（New England Biolabs、カタログ番号 M0367）
NEBNext Quick Ligation Reaction Buffer（New England Biolabs、カタログ番号 B6058）
NEBNext Companion Module for Oxford Nanopore Technologies Ligation Sequencing（New England Biolabs、カタログ番号 E7180S）
Agencourt AMPure XP ビーズ（ベックマン・コールター、カタログ番号 A63881）
MinION フローセル（R9.4.1）（Oxford Nanopores Technologies、カタログ番号 FLO-MIN106D）
フローセルプライミングキット（オックスフォード・ナノポア・テクノロジー、cat.No.EXP-FLP002）

培養チューブ（VWR、カタログ番号10545-946）
37℃振とうインキュベーター
250ml 三角フラスコ（VWR、カタログ番号 10536-914）
1.5mlのDNA LoBindチューブ（エッペンドルフ社、cat. no.）
50ml遠心チューブ（VWR、cat.No. 21008-940または類似品）
サーマルミキサー（例：エッペンドルフ、cat.No.5382000023）
チューブローテーター（VWR、cat.No. 10136-084など）
1.5mlチューブ用マグネットセパレーター（New England Biolabs社製、カタログ番号 S1509S）
MacOS と NCBI BLAST ソフトウェア (https://ftp.ncbi.nlm.nih.gov/blast/executables/blast/LATEST/)
注：本記事執筆時点で、掲載されているONTキットの一部（SQL-LSK109、EXP-NBD104/114、EXP-AMII001）は、NEB製品M0367、M6630、E7546、E6056で使用する単一のキット（SQK-NBD、114.24 Ligation Sequencing gDNA - Native Barcoding Kit 24 V14）に置き換えられています。プロトコールはほぼ同じです。
ファージの増殖とDNAの単離

培養チューブに5mlのLB培地とNEB 10-β細胞を接種し、37℃で一晩、飽和するまで振盪培養する（225rpm）。
250mlの三角フラスコに50mlのLB培地を入れ、0.5mlの一晩培養したものを接種し、37℃（225rpm）でOD600が0.1程度になるまで培養する。

この培養には約1時間かかる。

ガラスピペットを寒天に通してプレートの底まで突っ込み、単離されたT7ファージアセンブリープラークの寒天栓を採取する。ピペットを少し振ってプレートからプラグを緩め、ピペットを取り除く。

ピペットの先端に寒天の栓が見えるはずである。

プラグを1.5mlのDNA LoBindチューブに入れた1mlのファージ希釈バッファーに移す。チューブを軽く攪拌し、ファージ粒子をバッファーの中に拡散させる。
細菌培養液に100μlのファージ懸濁液を接種する。

必要なファージの量は、ファージの最適感染倍率（MOI）と単離されたファージ粒子の力価に依存する。T7ファージのMOIは約0.01であり、上記のように収集したプラークの力価は一般的に約1×108 PFU/mlである。したがって、100μlのファージ粒子懸濁液は、OD600が0.1 = 8 × 107 cells/mlであると仮定すると、約0.01のMOIを与えるはずである。

37℃（225rpm）でインキュベートし、OD600の低下を測定してファージの増殖をモニターする。培養液が目視で透明に見え、OD600が0.1未満になれば、ファージの増殖は完了である。

細菌宿主からファージ粒子への最適な変換は、使用するMOIが十分に低く、感染後数時間OD600が上昇し続ける場合に達成される。この継続的な増殖により、バクテリオファージに感染した細胞の大部分が消失する前に、相当量の細胞塊が産生される。OD600が1時間未満で減少する場合は、使用するウイルス量を減らすことが望ましい。

培養液を50mlの遠心チューブに移し、12,000×g、4℃で20分間遠心して、残存細胞と細胞残屑をペレット化する。上清を新しい50mlチューブにデカントする。
5 gのPEG 8000（最終10%）と2.922 gのNaCl（最終1 M）を加え、完全に溶解するまで転倒混和する。

PEG 8000とNaClの組み合わせは、ウイルス粒子を破裂させることなく沈殿させる。

9.4℃で4～8時間または一晩インキュベートする。
12,000×g、4℃で10分間遠心し、上清を捨てる。

ペレット化したファージ粒子は、チューブの側面に沿って薄白色のスミアとして見えるはずである。

ファージ粒子を300μlのファージ希釈バッファーに懸濁し、新しいDNA LoBindチューブに移す。

再懸濁したファージ粒子は、4℃で数ヶ月から数年間、遮光して保存することができる。ウイルス力価は時間とともに低下するので、使用前に確認する必要がある。

12.微量遠心機で5～10秒かけて不溶性粒子をペレット化し、上清を新しいDNA LoBindチューブに移す。
300 µl HMW gDNA Tissue Lysis Bufferと20 µl proteinase Kを加え、サーマルミキサーで56℃、300 rpmで撹拌しながら少なくとも45分間インキュベートする。

プロテイナーゼKと熱の組み合わせにより、ウイルスカプシドが分解され、ゲノムDNAが放出される。

Protein Separation Solutionを300μl加え、1分間転倒混和し、16,000×gで10分間遠心する。

分離の結果、DNAを含む大きく透明な上相と、タンパク質と脂質を含む下相が生じる。

上層のDNAを含む相をMonarch 2-ml Tubeに移し、DNA Capture Beadsを2つ加える。

ゲノムの小さいファージ（例えば、約40kbのT7ゲノム）の場合、標準的な1000µlのピペットチップで十分である。より大きなゲノムの場合は、ワイドボアピペットを推奨する。

550 µlのイソプロパノールを加え、チューブローテーターで4分間攪拌し、DNAをビーズに結合させる。

DNAはガラスビーズに巻きついた白い塊として明らかになるはずである。

17.ビーズに巻き付いたDNAを取り除かないように注意しながら、ピペッティングで液を捨てる。
500 µl の gDNA Wash Buffer を加え、2～3回転倒混和し、ピペッティングでバッファーを除去することにより、2回洗浄する。
Monarch Collection Tube IIにMonarch Bead Retainerインサートを入れ、ビーズをBead Retainerに流し込む。
微量遠心機でパルススピン（≤1秒）して残留アルコールを除去する。
ビーズリテーナーをコレクションチューブから新しいDNA LoBindチューブに移し、後で使用するために取っておく。
ビーズをコレクションチューブから新しい Monarch 2 ml チューブに移し、直ちに 100 µl の Elution Buffer II を加える。
300 rpmで攪拌しながら、56℃で5分間インキュベートする。
溶出したDNAとビーズをビーズリテーナーに入れ（ステップ21）、12,000×gで1分間微量遠心する。
溶出したgDNAを、50℃で10分間ずつ、軽く攪拌しながら2～3回インキュベートし、完全に溶解させる。

ONTライブラリーの調製と配列決定
26. Ligation Sequencing Kitを使用し、説明書に記載されている以下の試薬とともに、メーカーの説明書に従ってONTライブラリーを調製する：

Native Barcoding Expansion (EXP-NBD104 または EXP-NBD114)
アダプターミックスII Expansion
NEB Blunt/TA リガーゼマスターミックス
NEBNext クイックライゲーション反応バッファー
NEBNext コンパニオンモジュール
Agencourt AMPure XP ビーズ
1.5mlチューブ用マグネットセパレーター
27. Ligation Sequencing Kitに付属の説明書に従い、Flow Cell Priming Kitを使用してMinION Flow Cellを準備します。

Ligation Sequencing Kitに付属の説明書に従って、シーケンスライブラリーをフローセルにロードし、シーケンスランを開始します。

プーリングなしの小規模ゲノムランの場合、12～18時間で十分なデータが収集され、高い信頼性でゲノム配列がアセンブルできるはずです。より大きなゲノムやプールされたライブラリーの場合、より長いデータ収集時間が必要になることがあります。完全なデータ収集ラン（約72時間）では、最大50Gbのデータを生成することができます。ベースコール終了後、生成されたfastqファイルはその後のゲノムアセンブリと解析に使用されます。

ゲノムのアセンブルと解析
29. 目的の配列（すなわちインサート）を含むファイルをFASTA形式で作成する。

コンピューター上でコマンドラインインターフェース（CLI）を開きます。

このプロトコルはMacOS用に書かれており、デフォルトのCLIは "Terminal "と呼ばれる。Terminalウィンドウを開くには、単に "Command + Option + T "を押す。

Windowsが動作しているシステムでは、CLIは「コマンドプロンプト」と呼ばれ、「Windows + R」を押し、ダイアログボックスに「cmd」と入力し、Enterを押すことでアクセスできます。Windowsのコマンドプロンプトの構文は、ここで使用するMacOSの構文とは若干異なることに注意してください。

BLAST実行ファイルがPATHにインストールされていることを確認する。BLASTの最新バージョンはhttps://ftp.ncbi.nlm.nih.gov/blast/executables/LATEST/。

PATH環境変数は次のコマンドで設定できます：

export PATH= ∼/home/user/ncbi-blast version+/bin:$PATH

フラグメント配列が保存されているディレクトリフォルダーに移動する。
コマンドでローカルデータベースを作成する：

makeblastdb -in ../fragments.fasta -input_type fasta -dbtype nucl -title fragments -out fragments

ここで、"fragments.fasta "はステップ29で作成した挿入配列を含むファイルである。

このコマンドは、"fragments "というタイトルのローカル核酸型BLASTデータベースをFASTA形式で生成する。

BLAST操作を実行する前に、outfmtコマンドを使用して出力パラメーターを定義する。

この研究で使用したoutfmtの例は、次の行で定義できる：

outfmt="qseqid sseqid qstart qend sstart send evalue bitscore pident mismatch gaps" という行で定義できる。

主な出力は以下の通り：

qseqid クエリー（すなわちゲノム）配列ID
sseqid ターゲット（挿入/断片など）配列ID
pident 同一一致率
整列長
mismatch ミスマッチ数
gaps ギャップ数
qstart クエリーのアライメント開始位置
qend クエリー内のアライメントの終了位置
sstart フラグメント内のアライメント開始位置
フラグメントのアライメント終了
期待値
ビットスコア bit score
35. BLASTNコマンドを実行して、クエリに存在するすべてのフラグメント配列を検索します：

blastn -query query.fasta -db fragments.fasta -evalue X -out blastn1 -outfmt "n $outfmt".

変数Xは選択されたE値を定義し、検索のストリンジェンシー・レベルを決定する。E値が高いほど、検索は速くなるが、厳密性は低くなる。この場合、1e-3が適切な値であることがわかる。変数 n (0-11の整数) は、アラインメント・ビュー・オプションを定義する。outfmtは、ステップ34で定義されたパラメータのセットを表す。アライメント表示オプションは以下のように定義される： 0 = pairwise, 1 = query-anchored showing identities, 2 = query-anchored no identities, 3 = flat query-anchored show identities, 4 = flat query-anchored no identities, 5 = XML BLAST output, 6 = tabular, 7 = tabular with comment lines, 8 = text ASN.1, 9 = binary ASN.1, 10 = comma-separated values, 11 = BLAST archive format (ASN.1). このアプリケーションでは、表形式（6番）またはカンマ区切り値（10番）の出力モードをお勧めします。

より詳細な情報や詳細は、blastn -helpコマンドを入力することで見つけることができます。

出力のサンプルは表2にある。

この出力ファイルは、pythonやRなどのモジュールやツールを使って解析したり、GeneiousやSnapGeneなどのソフトウェアを使って可視化することができる。

表2. BLASTを用いたT7ゲノム解析のサンプル出力
qseqid sseqid qstart qend sstart send evalue bitscore pident mismatch gaps
T7-Query_1 F3 43190820 43191431 612 3 1e-3 1083 99.510 1 2
試薬と溶液
ファージ希釈バッファー
25 ml 1 M Tris-HCl, pH 7.5 (Thermo Fisher Scientific, cat. no. 15567027)
7.5 ml 5 M NaCl（Thermo Fisher Scientific、カタログ番号 AM9760G）
5 ml 1 M MgCl2 （サーモフィッシャーサイエンティフィック、カタログ番号 AM9530G）
蒸留水で500mlにする。
25℃で2年間保存可能
解説
背景情報
ゴールデンゲートアセンブリーは、マルチフラグメント・モジュラーDNAアセンブリーの手法として10年以上使用されている（Engler et al.）これは、多様性の高いタンパク質ライブラリーが必要な合成生物学アプリケーションや、遺伝子の多くのバリエーションを機能的なオペロンや回路に組み立てるアプリケーションにおいて特に魅力的である。これまでの一般的なアプローチは、タンパク質や多遺伝子コンストラクトを組み立てるための融合部位として、定義されたオーバーハングのセットを使用する「標準」の採用であった（多くの現在の標準は、Birdら、2022にレビューされている）。最近のCurrent Protocolsの論文（Marillonnet & Grutzner, 2020）は、最初の、そして現在でも最も広く採用されているモジュラー階層戦略の一つであるMoCloの文脈で、この設計とアセンブリー戦略の原理について詳しく述べている。MoCloの各レベルでは、標準化され、実験的に検証された融合部位を用いて6つのフラグメントを組み立てることができ、複数回のサブアセンブリーを用いて多くのパーツから大きな構築物を組み立てることができる（すなわち、GGAによって組み立てられた6つの初期転写ユニット自体が1つのパーツに組み立てられ、これらのサブアセンブリーの6つが最大36の初期転写ユニットからなる遺伝子経路に統合される）。多くの類似したスタンダードが存在し、アセンブリーに使用されるプラスミドと融合部位のセットが定義されている。これらの標準のいくつかは、特定の生物をターゲットとしたシステム用に設計されており、同じシステムを研究している複数の研究室がこれらの標準セットを使用することで、研究チーム間でパーツを簡単に共有することができ、そのまま使用することができる。

標準化されたオーバーハングに依存するGGAシステムであまり扱われていない問題は、これらのセットの初期選択であり、特に、忠実度が高く効率的なアセンブリーをもたらすセットと、効率が低かったり不正確なアセンブリーをもたらすセットとをどのように区別するかである。融合部位を機能配列内に配置するには、既存の配列から融合部位を修正せずに特定する必要があるからである。原理的には、4塩基のオーバーハングを使うことで、非パリンドロームで相補的なペアをすべて1回の反応で使うことができれば、最大120個の断片が可能になる。実際には、可能な交差対の数が膨大なため、アセンブリー速度が遅くなり、ミスマッチ対のライゲーションから多くの生成物が形成される。あるアセンブリーでは、1つの誤った融合が不完全または不正確なコンストラクトにつながり、正しいアセンブリーの数は、6～8個以上のパーツを持つアセンブリーでは急激に減少し始める。選択されたすべてのオーバーハングが、セット内の他のすべてのオーバーハングと少なくとも2塩基対異なっていることを要求することで、忠実性の点でほぼ完璧なセットを選択することは可能である。この場合、望ましくないライゲーションイベントは2つのミスマッチ対を必要とするが、これはコヒーシブエンドライゲーションでは非常に起こりにくい（Bilotti et al., 2022; Potapov, Ong, Kucera, et al.）しかし、この要件により、1回の反応では8フラグメントが限界となる。この数を超えると、誤ったライゲーションが制限されるオーバーハングセットを決定するために、追加の部位を選択する際に、より多くの推測が必要となる。

融合部位の選択は、コーディング配列（または他の機能配列）を細分化しながら、これらの経験則に従おうとすると、さらに問題となる。このような場合、アセンブリーはさらに、配列の途中でヌクレオチドを追加したり、既存の配列を変更したりする自由がなく、アセンブリーする必要がある正確な配列に制限される（ORFのサイレント変異を含む可能性は別として）。これらのアセンブリーは、実質的に5～8個の断片に制限されることが多く、断片の数が増えると、正しいアセンブリーを同定するために、より多くのスクリーニングが必要となり、完全長産物の収率も低下する。その結果、転写ユニットは、融合部位の選択の必要性を回避するために、ギブソンアセンブリーや、ホモロジー領域を用いてエレメントを組み立てる他の方法を用いて、あるいはGGAによって組み立てるフラグメントの数を可能な限り少なく制限することによって、しばしば組み立てられる。

DADを用いて、ミスマッチライゲーションの可能性が低い、あるいは全くないと予測される適合性の高いオーバーハングの大規模なセットを選択することにより、ゴールデンゲートアセンブリーの設計においてはるかに大きな柔軟性が可能になる（Pryor et al.）ライゲーションフィデリティのデータから、(1)すべての融合部位が少なくとも2つのミスマッチを持つセットは、高い精度でアセンブルされると予想されること、(2)推測でこれ以上の融合部位を追加すると、予想されるアセンブル精度は急速に低下し、12フラグメントあたりで中程度のフィデリティが予想され、20フラグメントあたりでは正確にアセンブルされる生成物はほとんどないと予想されることが確認された（図2B）。DADガイド下でのオーバーハング選択は、20以上のオーバーハングのセットを生成することができ、ほぼ完璧なフィデリティが予測される。配列の拘束がない場合、オーバーハングセットの選択は、リガーゼのフィデリティーセット内の単純なデータ検索によって達成され、予測されるミスマッチライゲーションの可能性が最小化されたセットを探す。この方法を用いると、反応が正確にアセンブルされるという高い信頼性をもって、適合する接続の新しい標準をデザインすることができる。さらに、大規模な高忠実度セットへの道を手作業で推測することは考えにくいが、30以上の融合部位まで可能な高忠実度セットは数多く存在する。これは、この複雑さの範囲のセットも、使用しなければならない融合部位や除外しなければならない融合部位などの制約を追加して、簡単に選択できることを意味する。この機能は、全体的な忠実度を犠牲にすることなく、既存のオーバーハングセットを拡張したり、既存のセットを解析して、ミスマッチライゲーションが多発するペアリングを特定して置き換えたりするために使用できる（Basic Protocol 2およびAlternate Protocol 1を参照）。

DADを用いた高忠実度オーバーハングセット選択の柔軟性は、コーディング配列内の融合部位の選択をさらに単純化する。融合部位が必要なおおよその領域、あるいは単に得たい断片の数を選択することにより、既存の配列に制約された融合部位セットを同定することができる。これにより、遺伝子や小さなゲノムを、ネイティブ配列に変更を加えることなく、高精度でアセンブルできると予測される36（またはそれ以上）の部分に分割することができる。この複雑性の高いGolden Gate戦略は、1回のアセンブリーラウンドで10から50以上のパートからなる完全なT7ファージゲノムのアセンブリーに適用され、サイレント変異によるネイティブなタイプIIS制限部位を除去する変更のみを必要とした(Pryor et al., 2022)。実際、オーバーハング選択の高い柔軟性により、これらのネイティブなタイプIIS部位の近くに融合部位を配置することができ、PCRによるパーツ生成中に家畜化することができる（基本プロトコール3参照）。これにより、細菌宿主に強い毒性を持つ可能性の高いサブアセンブリーを増殖させる必要性を回避して、ファージゲノム全体を一段階で組み立てることができる。高複雑性アセンブリーを設計するためのDADの他の応用例としては、高複雑性ライブラリーやコンビナトリアルライブラリーを作るための個々のタンパク質の高度にモジュール化されたアセンブリー（Olingら、2022年）、CRISPRアレイのような高度に反復的なDNAエレメントの簡略化されたアセンブリー（Volkeら、2022年；Yuanら、2022年）、酵母における大規模（10kb以上）プラスミド発現系の構築の簡略化（Szent-Gyorgyiら、2022年）などが発表されている。

重要なことは、先に述べたように、高複雑性アセンブリーの鍵は融合部位の選択であるが、実際のアセンブリープロトコールと関連する重要な考慮事項は、あらゆるゴールデンゲートアセンブリー（Marillonnet & Grutzner, 2020）と同じであるということである。実際、ここで推奨されるサイクリングプロトコールは、以前に報告されたものと密接に一致しており、37℃/16℃および42℃/16℃サイクリング条件下で収集された忠実度データを使用することで、ゴールデンゲートプロトコールで使用される条件下で融合部位を選択することができる。サイクリングプロトコルの代わりに37℃での静置インキュベーションを用いると、さらに高いフィデリティーが得られることが以前に示されているが、ほとんどのユーザーは、低温サイクリング条件に適合する吟味されたオーバーハングセットを用いると、優れた結果が得られるであろう（Potapov, Ong, Kucera, et al.）実際には、16℃のアニーリング/ライゲーションステップを含めると、サイクリングアセンブリーに対するリガーゼのフィデリティーが予測される極端な場合を除き、不正確なアセンブリーの量はほとんど増加せず、全長産物のアセンブリーがより速く、より完全になる（Pryor et al.） 16℃でのライゲーション活性の増加は、多断片集合体の完成を促進する上で極めて重要である。通常、完全長の集合体のみが形質転換に成功し、正確ではあるが不完全な構築物は形質転換されないからである。高温静置インキュベーションは、フィデリティーが低いと予測される既存のオーバーハングセットの使用に限定される場合には、フィデリティーの問題を克服することができるが、実際には37℃静置インキュベーションでは多フラグメントアセンブリーの収量が低下するため、高フィデリティーオーバーハングセットを選択するのに比べ、典型的なアセンブリーにはあまり有用ではない。

重要なパラメータ
ゴールデンゲートアセンブリーでは、ミスマッチライゲーションがあると、2つのフラグメントが誤った順序で不可逆的に結合します。このようなミスは不正確または不完全な産物をもたらし、エラーのない完全長の産物の収量を制限する（下記参照）。これらの要因は、フラグメントの数が少ない場合（6個以下）にはそれほど重要ではなく、小さなセットにはミスマッチの可能性が高い2つのオーバーハングが含まれる可能性が低いからである。セット内の全てのオーバーハング間で少なくとも2塩基対が異なることを保証することで、8オーバーハング対までの高忠実度オーバーハングセットを選択するのは簡単である。この基準を満たすオーバーハング間のミスマッチライゲーションは非常に起こりにくい。逆に、8つ以上のセットを選択する場合、当てずっぽうや古典的な経験則で良いセットをヒットさせるのはますます難しくなる。ライゲーションフィデリティーデータを利用した検索アルゴリズムは、高フィデリティーオーバーハングセットの同定を大幅に簡素化し、配列に基づく制約の追加や特定のオーバーハングの包含・除外を可能にする。結果として得られる推定フィデリティーは、そのセットがどれだけ最適に近いかを示す品質スコアであり、完全長で正しく順序付けられたアセンブリーを含むコロニー／プラークのパーセンテージを示す真の定量的予測因子ではない。多くの場合、どのようなアセンブリーデザインに対しても、ミスマッチライゲーションの可能性を最小限に抑えたユニークな高忠実度オーバーハングセットを選択することができる。しかし、最適でないセットの方が多く、当てずっぽうで高忠実度セットを見つけることは考えにくく、セットのサイズが大きくなるにつれてますます難しくなる（図2B）。

最適なオーバーハングセットを選択することで、成功の確率とアセンブリーされた産物の全体的な収量を最大にすることができるが、他の要因も考慮しなければならない。空のベクターバックグラウンド、汚染DNA（ゲノムDNA、異常アンプリコン、プライマーダイマーなど）、形質転換後の有害インサートの除去はすべて、誤ったアセンブリーを含むコロニー数の増加の原因となりうる。また、「良い」オーバーハングも「悪い」オーバーハングも存在せず、ライゲーションフィデリティーはオーバーハングセットとの関連においてのみ見積もることができることを認識することも重要である。ある高忠実度セットの一部であるオーバーハングは、別のオーバーハングセットではミスマッチの可能性が高く、新しいオーバーハングセットの忠実度をチェックする必要性が強まる。

関連する問題は、アセンブリーで使用される制限特異性のすべてのネイティブな認識部位がターゲット配列から除去されていることを確認する必要性である。断片内に存在する内部部位は、アセンブリーで使用されるIIS型制限酵素によって認識され切断される。例えば、ここで紹介するT7バクテリオファージのPaqCIアセンブリー（基本プロトコール3を参照）では、パーツ生成中に5つのネイティブPaqCI部位が取り除かれる。アセンブリー中に消化された内部部位は、アセンブリーを妨害する可能性のあるオーバーハングをさらに生成する。さらに、多くのプロトコールには60℃のエンドホールドステップが含まれており、これはリガーゼを不活性化するが、制限酵素は活性を維持する。通常、これによって空ベクターが確実に消化され、空ベクターのバックグラウンドが減少する。しかし、内部部位が存在するとアセンブリーも切断され、目的の産物の収量が大幅に減少する。

高忠実度のオーバーハング・セットを選択し、イン・シリコ・デザインを注意深く検討すれば、成功の可能性は最大になるが、他の多くの要因が反応の効率と精度に影響する。アセンブリーで使用するDNAの純度と正確な定量は重要な考慮点である。PCRで断片を作る場合、アンプリコンに汚染プライマーやオフターゲット増幅産物がないことを確認することが重要である。このような不純物は単に定量を複雑にするだけでなく、アセンブリーの収率に致命的な影響を与える可能性がある。不純物はIIS部位を含み、その結果、アセンブリー活性のある消化中にオーバーハングを生じ、不正確なアセンブリーや不完全なアセンブリーを生成する可能性があるからである。この影響は、不純物を含むフラグメントの数が増えるほど大きくなる。複雑なアセンブリーの場合、不純物を含むPCR産物が1つでもあると、その影響は非常に大きくなる。12フラグメントのT7ファージゲノムアセンブリーの場合、顕著な不純物を含むフラグメントはPFU/μlで測定したアセンブリー収量を少なくとも2桁低下させた（Supporting Information Fig.）断片のモルバランスも複雑なアセンブリーでは重要であるが、これは通常、DNA断片の純度よりも影響が小さい。過剰に存在する断片や制限的な断片は、相容れない末端を持つ不完全な集合体の蓄積につながる。このような状況では、アセンブリーの精度に影響はないが、形質転換体／プラークの収量が減少する可能性がある。例えば、LacIZカセットの13断片または25断片集合体内の個々の断片の濃度を4倍にすると、CFU数は約50%減少した（Supporting Information Fig.）純度と不正確な定量の両方が、集合体の複雑さに関係なく収量を減少させるが、これらの影響は、注意深く設計され実行された場合でも効率が低下する傾向がある、高複雑度集合体では複雑になる。DADで選択されたオーバーハングセットを用いて12、24、36フラグメントのT7ファージアセンブリーを比較すると、シリーズ間でPFU/μlが大きく低下していることがわかる（参考情報 Fig.S1A）。

最後に、システムの形質転換／レスキュー効率は、最適なデザインであっても、未加工アセンブリーの濃縮が不十分なために、明らかな失敗を引き起こす可能性がある。この要因は、標準的なプラスミド系の形質転換には影響しそうにないが（宿主毒性に問題のある遺伝子の形質転換を試みた場合以外では）、ファージゲノムや他の大きなアセンブリーをレスキューしようとする場合には問題になるかもしれない。T7ファージの場合、ゲノムは十分に小さいので形質転換は効率的であり、細胞内に入ると裸のゲノムから生存可能なファージが容易に生成される。レスキューを成功させるためには、システムごとに異なる懸念や要求があるため、必要とされるアセンブリーDNAの量の見積もりと同様に、研究するシステムに特化した強固な形質転換プロトコルを推奨する。

トラブルシューティング
ゴールデンゲートアセンブリーに失敗する最も一般的な要因は、(1)オーバーハングセットの忠実度、(2)アセンブリー反応の効率（反応バッファー、酵素の量と比率、パーツの濃度と純度、サイクリング条件に影響される）、(3)宿主生物における最終産物の生存性および安定性です。市販のアセンブリーキットを使用する場合、ここに概説したプロトコールとメーカーの推奨に従うことで、アセンブリーが成功する可能性は最大になるが、いくつかの要因（パーツの純度やアセンブリーの毒性など）は軽減するのが難しい場合がある。表3は、NEBridge Ligase Fidelityツールを使用し、ゴールデンゲートアセンブリーを行う際に起こりうる一般的な失敗モードを示したものです。

表3. リガーゼフィデリティツールとゴールデンゲートアセンブリー反応のトラブルシューティングガイド
問題考えられる原因
基本プロトコル 1 オーバーハング配列が NEBridge Ligase Fidelity Viewer で受け付けられない非標準の塩基や文字が存在する、オーバーハングの長さが正しくない、オーバーハングが重複しているプログラムが返すエラーメッセージを読み、正しい入力を行う
基本プロトコル2、代替プロトコル1 オーバーハング配列がNEBridge GetSetで受け付けられない標準以外の塩基または文字が存在する、オーバーハング長が正しくない、オーバーハングが重複しているプログラムが返すエラーメッセージを読み、正しい入力を行う
基本プロトコル 3 NEBridge SplitSetが受け付けない塩基配列非標準の塩基または文字が存在する配列をチェックし、A, T, C, G塩基のみが存在することを確認する。
入力された分割領域が重複している各領域の開始座標と終了座標をダブルチェックする
基本プロトコール4、代替プロトコール1-2 アセンブリー後にコロニーがほとんどない、または全くない不正確なデザインプライマーデザイン（PCRの場合）、オーバーハング配列、IISサイトとスペーサーを確認する。
基本プロトコール 4 PCR産物からベクターをアセンブリーした後、コロニーがほとんどないインプットDNAの質が悪いインプットDNAの純度、特にPCR DNA中にプライマーダイマーがないことを確認する。PCR 条件を確認、最適化し、断片をゲル精製することを検討する。
不正確なアセンブリー不正確なデザインプライマーデザイン（PCRの場合）、オーバーハング配列、タイプIIS部位およびスペーサーを検証する。
インサートが大腸菌と生物学的に干渉しているインサートのクローニング能力を確認するため、失われた部分を個別にクローニングすることを検討する。
大腸菌と生物学的に干渉する。インサートが大腸菌での増殖と相容れない活性を持つ可能性がある。
基本プロトコール 5 プレート上でプラークがほとんど／全く観察されないアセンブリー反応の失敗アセンブリー反応の産物を TapeStation で確認する。正しいサイズが観察されない場合は、アセンブリーデザインと反応条件を見直してください。
形質転換効率が低いコンピテントセルが生存していることを確認する。コントロールプラスミド（例：pUC19）を形質転換し、コンピテントセルの形質転換効率を計算する。効率が低すぎる場合は、新しい高効率コンピテントセルを使用する。正しい抗生物質が存在することを確認する。
TapeStation 上でアセンブリー産物が観察されない、または産物のサイズが正しくない、または複数の産物が観察される設計が正しくないプライマー設計（PCR の場合）、オーバーハング配列、Type IIS サイトおよびスペーサーを確認する。
入力 DNA の品質が悪い入力 DNA の純度、特に PCR DNA のプライマー二量体がないことを確認する。PCR 条件を確認、最適化し、断片をゲル精製することを検討する。
最適でない GGA 反応設計に適した反応条件を確認する（例：サイクル数、温度）。新しいバッファー/コンポーネントを使用する。
結果の理解
ゴールデンゲートアセンブリーが成功するかどうかは、すべてのフラグメントが効率よく正しい順序で結合されるかどうかにかかっています。私たちのこれまでの研究で、ライゲーションフィデリティーが正確なアセンブリーの主要な決定因子であることが実証されており、包括的なライゲーションフィデリティーデータセットを融合部位のオーバーハングの選択に適用することで、1回の反応で数十のフラグメントからなる複雑なアセンブリーを、信頼性が高く、柔軟にデザインすることができる。ここで紹介するプロトコールは、パーツの調製とアセンブリー反応の実行のためのベストプラクティスとともに、これらのツールの適用を示すものである。

基本プロトコール1では、NEBridge Ligase Fidelity Viewerウェブツールを使用して、既存のオーバーハング集合体の忠実度を評価します。データセットの例として、標準的なレベル1のMoCloオーバーハング（Weber et al. MoClo標準ライゲーション条件（BsaI-HFv2 37-16サイクリングライゲーション条件）での推定ライゲーション忠実度は93％であった（図4B）。推定ライゲーション忠実度の下には、ライゲーション頻度マトリックスがあり、これは与えられたオーバーハングセット中のすべての可能なオーバーハング対のライゲーションの可能性を描いている。与えられたオーバーハング配列とその逆相補配列がx軸とy軸に沿ってリストされている。マトリックスの各ボックスは、軸に示された配列のライゲーション頻度を表す。ワトソン・クリック塩基対は青色（良好）と水色（不良、低効率）のハイライトで示され、ミスマッチ対はオレンジ色（高頻度のミスマッチイベント）、薄いオレンジ色（中程度の頻度）、非常に薄いオレンジ色（微量のミスマッチライゲーション）で示される。データセットにオブザベーションのないペアリングはハイライトされない。MoCloオーバーハングの例では、ミスマッチライゲーションの可能性が予測される2つのペアリングに注目。GGTAとTACTのペアリングはミスマッチの可能性が高く、TACCとAGTAのペアリングはミスマッチの可能性が中程度である。

基本プロトコール2は、NEBridge GetSet Toolを使用して、高忠実度のオーバーハングセットをde novoで生成する方法を示している。ここでは、必要なオーバーハングの数を入力すると、高忠実度の融合部位のリストが返される。NEBridge GetSetのグラフ出力はNEBridge Ligase Fidelity Viewerの出力と機能的に同じであり、同じように解釈できる（図5B）。NEBridge GetSet出力の違いは、推定ライゲーションフィデリティの上にリクエストIDとオーバーハングセットの出力が含まれていることである。同じサイズのオーバーハングでも、同じような忠実度を持つオーバーハングが多数存在するため、同じ入力パラメーターのセットを再実行すると、異なるオーバーハングのリストが返されることが多い。リクエストIDを使用することで、前回実行時の出力を復元することができます。オーバーハングセットはプログラムによって選択されたセットで、必要なオーバーハングが最初にリストされ、その後にツールによって追加された新しいオーバーハングが続きます。リクエストされたオーバーハングの数が、最終的なライゲーションフィデリティの推定値に最も大きな影響を与える。20個以下のオーバーハングのリクエストでは100%に近いフィデリティーが推定されるのに対し、30個までのオーバーハングのリクエストでは90%に近いフィデリティーが推定される（オーバーハングが要求されない、または除外されないと仮定した場合）。要求されるオーバーハング数がさらに増加すると、推定忠実度は著しく低下し、ほとんどのサイクリング条件では最低でも約50オーバーハングに達する（図2B）。アセンブリーが機能しなくなる推定忠実度のハードカットオフは存在しないが、50％以下では急速に減少することがわかった。

NEBridge GetSet Toolのもう一つの用途は、融合部位の数に対して予測されるフィデリティが低いことが判明したクローニング・スタンダードに対して、オーバーハングの置換を提案することである。多くの場合、これは数個の融合部位を置き換えるだけで達成できる。例えば、Basic Protocol 1のMoCloの例（推定フィデリティ93%）に戻ると、セット中のTACT/ACTAまたはGGTA/TACCオーバーハングのペアのいずれかを置き換えることで、予測されるミスマッチを取り除くことができる。MoCloセットから必要なオーバーハングとしてTACTを除いたものを使用し、9つのオーバーハング（すなわち、必要な8つのオーバーハングにTACTの置換を加えたもの）を要求してBasic Protocol 2を実施したところ、ツールは新しいオーバーハングGACTを返し、新しいセットの推定ライゲーション忠実度は100%であった（Supporting Information 図S4）。これは、1つのオーバーハングにおける1塩基の変化（TからGへ）が、比較的小さなオーバーハングセットの推定フィデリティーに大きな影響を与えることを示している。

代替プロトコル1は、NEBridge GetSetを応用して、予測されるフィデリティを最小限に抑える互換性のあるオーバーハングを追加して既存のアセンブリーを拡張することを示しています。例として、12パートのBsmBI LacIZアセンブリー（Pryor et al., 2020の12パートBsaI LacIZアセンブリーに基づく；図6A、Supporting Information Table S1およびGenBankファイル12-part_LacIZ_Assemblyを参照）を用い、AmpRカセットおよびsfGFP（Pedelacq et al., 2006）を含む新しいフラグメントを追加して15パートアセンブリーに拡張した。これらの追加遺伝子が選ばれたのは、主に抗生物質選択と蛍光で評価できる、区別しやすい表現型が得られるからである。今回のデモンストレーションでは、改変が必要な既存部分の数を最小限にするため、新しい配列を1つのブロックにまとめたが、インシリコでDNAを配置する方法はほぼ無限であり、遺伝子の多くの異なる配置が可能である。さらに、LacIZカセットの破壊を最小限に抑えるため、新しい配列を既存のアセンブリーと目的プラスミドの間に挿入した（図6A）。このアセンブリーでは、3つの新しい断片オーバーハングを選択した。この数の融合部位は、どの断片も1kbを超えず、どの断片も複数の遺伝子を含まないことを保証する。フラグメントサイズの上限を1kbとしたのは、合成コストを削減し、フラグメントサイズを既存のフラグメントと一致させるためである。フラグメントあたり1つの遺伝子しか認めないことで、抗生物質耐性遺伝子と蛍光色素遺伝子を簡単に入れ替えることができる。例えば、sfGFPをそれ自身のフラグメントに完全に含ませることで、たった1つのフラグメントを操作するだけで、それを別の蛍光色素に置き換えることができる。

我々のAmpRとsfGFPを拡張した15部位のBsmBI LacIZアセンブリーでは、GGCA、TCGC、CAGT、TCCA、GAAT、AGTA、TCTT、CAAA、GCAC、AACG、GTCT、CCATオーバーハングを、ベースとなる12部位のアセンブリーと全く同じように（すなわち、同じ断片を挟むように）使用した。GGAGオーバーハングはpGGAselectデスティネーションベクターの上流オーバーハングであり、拡張アセンブリーの最初のフラグメントの上流オーバーハングとして使用されなければならないので、必須オーバーハングとしても含まれなければならない。つまり、ベースとなる12個のBsmBI LacIZアセンブリーの13個のオーバーハングすべてが、拡張アセンブリーで再利用され、必須オーバーハングとして入力されなければならない（Supporting Information 図S5）。既存の13個のオーバーハングに3個のフラグメント（したがって融合部位）を追加するので、必要なオーバーハング数は16個である。実行が完了すると、生成されたオーバーハングが表示され、最初に必要なオーバーハングが入力された順番に表示され、その後に新しく生成されたオーバーハングが表示される。この例では、プログラムはCTGA、GATA、ACAAというオーバーハングを選択し、全セットのライゲーション忠実度は98％と推定された（図6C）。生成されたオーバーハングは投稿ごとに異なる可能性があるが、NEBridge GetSetによって生成された高忠実度のオーバーハングセットであれば、同様の挙動を示すと予想されることに注意すべきである。

新しいオーバーハングが選択されたので、次にこれらのオーバーハングを拡張アセンブリに配置する必要があった（図6A）。このアセンブリーでは、ネイティブな配列を変えずにAmpR遺伝子を2つの断片に分割したかったので、選択した新しい融合部位の1つを既存の配列内に見つける必要があった。我々は、AmpR-1とAmpR-2断片間の融合部位として、AmpR遺伝子のほぼ中間点に存在するACAAを使用した。このことは、オーバーハングをネイティブ配列の中で、希望する融合部位の近くに簡単に配置できることを示している。次に、オーバーハングGATAをAmpRとsfGFPの間のスペーサー内に配置し、オーバーハングCTGAをLacZ末端とsfGFPリボソーム結合部位（RBS）の間に配置した。この後者の変更は、オリジナルのLacIZアセンブリーの最終断片の末端からGGAGオーバーハングを置き換えたもので、この配列はpGGAselect目的プラスミドと対になっている。その後、GGAGオーバーハングをAmpR-1フラグメントの先頭に移動させ、アセンブリーが目的プラスミドに正しく挿入されるようにし、アセンブリーを完成させた（図6A）。つの新しいフラグメント配列はGenScript社から入手し、パーツマスターミックス中の12-part BsmBI LacIZのフラグメント1に置き換えた（サポート情報表S2およびGenBankファイル、15-part_Expanded_LacIZ_Assemblyを参照）。その後、形質転換細胞をLB cam/amp IPTG X-galプレートにプレーティングした以外は、基本プロトコール4と同様にアセンブリーを実施した。拡張されたアセンブリは、基本の12-part BsmBI LacIZと同様の忠実性を保持していることが観察された（Supporting Information Table S12）。全体のコロニー数は約50％減少したが、これは通常二重抗生物質選択下で形質転換効率が低下することから予想されることである。二重抗生物質プレート上で見つかったコロニーのうち、99.3％が蛍光を示し、sfGFP遺伝子を含んでいることが示された（図6BおよびSupporting Information Table S12）。

基本プロトコール3では、NEBridge SplitSetツールを用いて、ゲノムを最適なオーバーハングを持つ一定数の断片に分割する方法を説明する。このプロセスは、NEBridge GetSetを用いた部位の選択と非常によく似ていますが、部位の選択が指示された検索ウィンドウ内の配列に限定される点が異なります。選択されたオーバーハングセット、推定フィデリティ、ライゲーションフィデリティマトリックス（図7A）に加えて、NEBridge SplitSetは、5′および3′オーバーハングと内部配列を含むコンポーネントフラグメントも出力する（Supporting Information 図S6B）。重要なことは、出力された配列にはタイプIIS部位がなく、適切な認識部位とスペーサーを配列の5′末端と3′末端に付加してから組み立てる必要があることである。PCRによって生成された断片の場合、認識部位とスペーサーは5′プライマーエクステンションとして含めることができる。合成的に作成されたフラグメントの場合、認識部位とスペーサーは注文前に配列に付加することができる。NEBridgeのGetSetと同様に、高忠実度のオーバーハングセットには多くの可能性があり、同じ入力パラメータを再実行すると、同等のオーバーハングセットの複数のリストが返されることがあります。一般に、どのようなセットでも良好なアセンブリ結果が得られるため、ユーザーは部品を設計する際にどのような高忠実度セットを選択してもかまいません。

基本プロトコール3の例として、PaqCIを用いてT7バクテリオファージゲノムを12パートの環状アセンブリーに分割する方法を示します（図7と8、サポート情報GenBankファイルPaqCI_12-part_T7_Assembly）。さらに、NEBridge SplitSetを使用して、同じ配列を24パートと36パートのバージョンに分割した（Supporting Information図S1、表S7-S8、およびGenBankファイルPaqCI_24-part_T7_Assembly、PaqCI_36-part_T7_Assembly）。T7ゲノムは通常、感染中に直鎖dsDNAとして注入されるにもかかわらず（Fujisawa & Morita, 1997）、T7ゲノムの円形アセンブリーは直鎖アセンブリーよりも有意に多くのプラークを産生することを以前に示した（Pryor et al.）これはおそらく、一般に環状構築物の形質転換性が高いことに起因していると考えられる。アセンブリー環状化は、ゲノムの3′末端から末端リピートを横切って、gDNAのPCRによって生成されたゲノムの5′末端まで広がるブリッジ断片を用いて達成される。この断片が、末端反復で終わる直鎖gDNAからどのように生成されるかは確認していないが、末端反復が相同な末端として機能し、PCA様機構によって拡張され、生体内で末端反復がどのように機能するか（Weigel & Seitz, 2006）に類似した、完全なブリッジ断片を生成することができると考えている。われわれは配列決定により、ブリッジ断片に末端リピートが1つだけ含まれていることを確認した。

アセンブリー設計の次のステップとして、Geneiousを用いてT7バクテリオファージ配列内のすべてのネイティブPaqCI/AarI認識部位の位置を同定した（Supporting Information Table S4）。次に、これらの部位から5ヌクレオチド以内の融合部位を必要とするようにSplitSetを制限した。この部位は、所望のサイレント変異を含むプライマーを用いたPCRによって、パーツ生成中に除去することができる（参考情報表S4およびS9）。例えば、T7ゲノムの9387から9393に位置するPaqCI部位は、gp2.5のPro77のサイレント変異を作るために、A9388をTに変換することによって除去された。他の融合部位は、より大きな検索ウィンドウを許可して、任意に間隔をあけた。これらのパラメータを用いて得られたオーバーハングのサンプルセットは、GGCA、CTGG、CAGC、CCTC、GGTC、TGTT、TGGT、AGGA、ATTC、CAAA、CATT、TAGAであり、ライゲーションフィデリティスコアは86%であった。このスコアは12パートのアセンブリーデザインとしては比較的低いことに注意してください。この場合、ネイティブ配列への制限と、必要なサイレントミュータジェネシス位置付近のタイトウィンドウが、可能なオーバーハングセットを制限し、NEBridge GetSetを使用して生成された制限のないセットで観察されるよりも低いフィデリティの原因となっていると思われます。これらの初期5部位を共有する24フラグメント版と36フラグメント版では、どちらのアセンブリーも予測忠実度は24%であった（Supporting Information Table S5）。

出力断片が得られたら、プライマーを設計し、Support Protocol 1または以前に発表されたプロトコル（Marillonnet & Grutzner, 2020）を用いて、すべての部分を増幅するPCRを行うことができる。家畜化が必要な場合、その領域をカバーするフォワードプライマーとリバースプライマーは、所望の変異を導入しなければならない。そうでない場合は、通常のプライマー設計を行う。プライマーのアニール部分が設計されると、適切なスペーサーとタイプIIS認識部位が5′エクステンションとして追加される（代替プロトコル1のステップ10を参照）。サポートプロトコール1および3に記載されているガイドラインに従うことで、アンプリコンの純度が高く、不要なDNA断片やプライマーがなく、適切な濃度を確保することができる（図8Bおよびサポート情報Fig.）別の方法として、DNAベンダーに完全な断片を注文することもできるが、特にバクテリオファージゲノムを扱う場合には、すべての断片が合成可能あるいはクローニング可能とは限らないという注意点がある。PCR後、アンプリコンを定量し、等モル比で混合する。全てのアンプリコンを分注し、複数のアセンブリー反応に使用できるマスターミックスを調製することを推奨する。典型的な反応では、各フラグメントの最終濃度を3nMにすることを推奨する。

同じゲノムを12、24、36の部分に分割することにより、アセンブリーに対するフラグメントの数の影響を直接評価することができた。すべてのT7アセンブリーのアセンブリー反応をBasic Protocol 5に従って行い、PFU/μlを用いて結果を評価した（図8DおよびSupporting Information Fig.）最終産物は、Support Protocol 4を用いてAgilent TapeStationで可視化した（図8CおよびSupporting Information 図S1）。断片の数を12個から24個に倍増させると、PFU/μlは1桁減少し、36個ではさらに小さな減少が観察された（Supporting Information 図S1B）。これらの結果は、DADを用いてオーバーハングセットを最適化しても、より複雑なアセンブリーでは完全長のアセンブリーが少なくなることを示しており、目的プラスミド中のLacIZアセンブリーに関する以前の研究（Pryorら、2020、2022）と一致している。また、不純物PCR断片をアセンブリーに含めた場合の影響も調べた。このアセンブリーでは、プライマー二量体や不正確な増幅産物がアセンブリー活性を持つと仮定し、観察された収量が2桁減少することを見出した（Supporting Information Fig.）このことは、かなりの量のオフターゲット増幅を示す産物が1つでもあれば、アセンブリー収率に壊滅的な影響を与える可能性があることを示している。

時間に関する考察
基本プロトコール1を用いて既知のオーバーハングを評価する場合、必要な情報を入力するのに数分、検索を実行するのに1秒未満しかかからない。基本プロトコル2でオーバーハングセットを生成する場合も、情報の入力には数分しかかかりませんが、検索にかかる時間は新しいオーバーハングがいくつ要求されるかに依存します。50個のオーバーハングを要求する場合、約5分を要する。

Alternate Protocol 1も同様の時間を要しますが、アセンブリーを設計し、変更を組み込むためにさらに時間が必要です。通常、このin silico作業は、システムの複雑さとユーザーのシステムに対する習熟度にもよるが、数時間で完了する。パーツの生成と変更に選択された方法は、インシリコの設計からアセンブリーまでの所要時間に影響する。PCRでパーツを作製する場合、プライマーの設計と注文に要する時間は、一般的に数時間のオーダーである。プライマーが到着すれば、PCR、クリーンアップ、定量は通常1日か2日で完了する。合成DNAを業者に注文した場合、設計と注文のプロセスは数時間で完了するが、納期は業者によって数週間から数ヶ月に及ぶ。ここで説明したアセンブリー反応は5時間から18時間であるが、低複雑度のアセンブリーであれば1時間程度でセットアップができ、さらに1時間程度で完了する。形質転換、生長、プレーティングには2-3時間かかり、その後一晩生長させてからプレートの評価を行う。

基本プロトコール3では、アセンブルするゲノムの初期解析が必要ですが、アセンブルの複雑さや必要性に応じて数分から数日かかります。パラメータが設定されると、NEBridge SplitSetは、ブレークを配置するために必要なサーチウィンドウの情報を慎重に入力し、確認する必要があり、15分以上かかることがあります。NEBridge SplitSetの実際の実行時間はNEBridge GetSetと同様で、必要な融合部位の数が増えるにつれて短縮されますが、最大規模の検索でも通常5分以内です。

基本プロトコール4～5および代替プロトコール2は、いずれもアセンブリー反応の準備に約1時間を要します。反応時間はサイクリング条件とサイクル数に依存する。基本プロトコール4では推奨される30サイクルで5時間、代替プロトコール2では60サイクルで10時間、基本プロトコール5では90サイクルで18時間かかる。形質転換、生長、プレーティングには2-3時間かかり、その後一晩生長させてからプレートの評価を行う。

サポートプロトコール1では、PCR反応に通常2～3時間かかるが、生成されるアンプリコンのサイズに依存する。スピンカラムによる精製には約1時間かかり、アガロースゲル電気泳動やバイオアナリシスによる可視化にはさらに1-2時間かかることがある。

サポートプロトコール2は、サポートプロトコール1によって生成されたPCR断片を利用し、これを処理して保持プラスミドにライゲーションする。PCR断片の生成後、処理とライゲーションに約2時間、形質転換、生長、プレーティングに2-3時間かかり、その後一晩生育させる。保持プラスミドの調製には約2時間かかり、その後一晩の増殖と採取、ミニプレップによる精製に1時間かかる。複数の断片のクローニング、増殖、精製を並行して行うのが簡単な場合が多い。

サポートプロトコール3は、サンプル数にもよるが、サンプルのセットアップに最大30分かかり、Qubit蛍光光度計での測定は1サンプルあたり1分未満である。Support Protocol 4は、サンプル準備に15～30分、TapeStationでの実行に1サンプルあたり2～3分かかります。

サポートプロトコル5では、宿主細菌の一晩培養から始めて、ファージを増殖させるのに1日必要です。ファージ粒子の回収とDNAの単離には、細胞残屑の除去と沈殿剤の添加に約1時間、その後一晩培養し、ファージ粒子の単離とgDNAの精製に2-3時間かかる。ONTライブラリーの調製には2-3時間かかり、ONTシーケンスには収集したリード数に応じて12-72時間かかる。データ解析には、解析パイプラインの構築を含めて1-2日、標準参照配列を使用する場合はパイプラインがあれば1-2時間かかる。

謝辞
Tasha Joséには図のデザインと作成を手伝ってもらい、Katharina Bilotti、Eric Cantor、Laurence Ettwiller、Rachel Keown、Vladimir Potapov、Lindsey Spiegelman、Nathan Tanner、Michael Ternsには批判的なフィードバックと原稿の熟読を感謝する。New England Biolabsは、記載された研究に資金を提供し、著者の給与を支払った。オープンアクセスチャージの資金はNew England Biolabsより提供された。

著者貢献
Andrew P. Sikkema：調査、方法論、執筆（原案、査読、編集）、S. Kasra Tabatabaei：調査、方法論、執筆（原案、査読、編集）、Yan-Jiun Lee：調査、執筆（原案）、Sean Lund：調査、執筆（原案）、Gregory J. S. Lohman：概念化、調査、方法論、監修、執筆（原案、査読、編集）。

利益相反
すべての著者は、DNAリガーゼ、IIS型制限酵素、DNAアセンブリーキットなどの分子生物学試薬を製造・販売するNew England Biolabs社の社員である。この所属は、著者の公平性、ジャーナルの基準や方針の遵守、データの利用可能性に影響を与えるものではない。

オープンリサーチ
サポート情報
引用文献
主な参考文献
インターネットリソース
PDFダウンロード
戻る
広告主の皆様へ

コンテンツアラートを受け取る

コンテンツを購読する

アクセス許可を得る

その他のリンク
ワイリーオンラインライブラリーについて
プライバシーポリシー
利用規約
クッキーについて
クッキーの管理
アクセシビリティ
ワイリーリサーチDE&Iステートメントと出版ポリシー
ヘルプ＆サポート
お問い合わせ
トレーニングとサポート
DMCAと著作権侵害の報告
機会
購読エージェント
広告主および企業パートナー
ワイリーとつながる
ワイリーネットワーク
ワイリープレスルーム
著作権 © 1999-2023 John Wiley & Sons, Inc. 無断複写・転載を禁ずワイリーホームページ

高複雑度ワンポットゴールデンゲートアセンブリー

%忠実度

効率(PFU/ml)

効率

100プラーク/100�lメッキアウトグロース/1000�l合計成長/1�lアセンブリ

いいなと思ったら応援しよう！

%
忠実度

効率
(
PFU
/
ml
)

100
プラーク
/
100
�
l
メッキ
アウトグロース
/
1000
�
l
合計
成長
/
1
�
l
アセンブリ