Nature.com をご覧いただきありがとうございます。CSS サポートが制限されたバージョンのブラウザを使用しています。最高のエクスペリエンスを実現するには、更新されたブラウザを使用することをお勧めします (または Internet Explorer の互換モードを無効にする)。さらに、継続的なサポートを確保するために、サイトはスタイルと JavaScript なしで表示されます。
スライドごとに 3 つの記事を表示するスライダー。[戻る] ボタンと [次へ] ボタンを使用してスライド間を移動するか、最後にあるスライド コントローラー ボタンを使用して各スライド間を移動します。
詳しい商品説明
304 ステンレス鋼溶接コイルチューブ/チューブ
1.仕様: ステンレス鋼コイルチューブ/チューブ
2. タイプ: 溶接またはシームレス
3.規格: ASTM A269、ASTM A249
4.ステンレス鋼コイルチューブ外径:6mm〜25.4MM
5.長さ: 600-3500MMまたは顧客の要件に従って。
6. 肉厚: 0.2mm ~ 2.0mm。
7.公差:外径:+/-0.01mm。厚さ: +/-0.01%。
8.コイル内穴サイズ: 500MM-1500MM (顧客の要件に応じて調整可能)
9.コイルの高さ: 200MM-400MM (顧客の要件に応じて調整できます)
10. 表面: ブライトまたはアニール
11.材質:304、304L、316L、321、301、201、202、409、430、410、合金625、825、2205、2507など。
12.パッキング:木製ケース、木製パレット、木製シャフト、または顧客の要求に従って織られた袋
13. 試験:化学成分、降伏強度、引張強度、硬度測定
14. 保証:第三者機関(例:SGS TV)検査等。
15. 用途:装飾、家具、石油輸送、熱交換器、手すり製造、製紙、自動車、食品加工、医療など。
ステンレス鋼のすべての化学組成と物理的特性は次のとおりです。
材料 | ASTM A269 化学組成 % 最大 | ||||||||||
C | Mn | P | S | Si | Cr | Ni | Mo | 注意 | Nb | Ti | |
TP304 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 18.0~20.0 | 8.0~11.0 | ^ | ^ | ^ 。 | ^ |
TP304L | 0.035 | 2.00 | 0.045 | 0.030 | 1.00 | 18.0~20.0 | 8.0~12.0 | ^ | ^ | ^ | ^ |
TP316 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 16.0~18.0 | 10.0~14.0 | 2.00-3.00 | ^ | ^ | ^ |
TP316L | 0.035D | 2.00 | 0.045 | 0.030 | 1.00 | 16.0~18.0 | 10.0~15.0 | 2.00-3.00 | ^ | ^ | ^ |
TP321 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 17.0~19.0 | 9.0~12.0 | ^ | ^ | ^ | 5℃ -0.70 |
TP347 | 0.08 | 2.00 | 0.045 | 0.030 | 1.00 | 17.0~19.0 | 9.0~12.0 | 10℃ -1.10 | ^ |
材料 | 熱処理 | 温度 F (C) 最小 | 硬度 | |
ブリネル | ロックウェル | |||
TP304 | 解決 | 1900年(1040年) | 192HBW/200HV | 90HRB |
TP304L | 解決 | 1900年(1040年) | 192HBW/200HV | 90HRB |
TP316 | 解決 | 1900年(1040年) | 192HBW/200HV | 90HRB |
TP316L | 解決 | 1900年(1040年) | 192HBW/200HV | 90HRB |
TP321 | 解決 | 1900(1040)F | 192HBW/200HV | 90HRB |
TP347 | 解決 | 1900年(1040年) | 192HBW/200HV | 90HRB |
外径、インチ | 外径公差インチ(mm) | 重量許容値% | 長さ公差インチ(mm) | |
+ | - | |||
≤ 1 / 2 | ± 0.005 ( 0.13 ) | ±15 | 1 / 8 ( 3.2 ) | 0 |
> 1 / 2 ~1 1 / 2 | ±0.005(0.13) | ±10 | 1/8(3.2) | 0 |
> 1 1/2 ~< 3 1/2 | ±0.010(0.25) | ±10 | 3 / 16 (4.8) | 0 |
> 3 1/2 ~< 5 1/2 | ±0.015(0.38) | ±10 | 3 / 16 (4.8) | 0 |
> 5 1/2 ~< 8 | ±0.030(0.76) | ±10 | 3 / 16 (4.8) | 0 |
8~<12 | ±0.040(1.01) | ±10 | 3 / 16 (4.8) | 0 |
12〜< 14 | ±0.050(1.26) | ±10 | 3 / 16 (4.8) | 0 |
自然の微生物群集は系統学的にも代謝的にも多様です。研究が十分に進んでいない生物群1に加えて、この多様性は生態学的および生物工学的に重要な酵素や生化学的化合物を発見する可能性を秘めています2,3。しかし、このような化合物を合成し、それぞれの宿主に結合するゲノム経路を決定するためにこの多様性を研究することは依然として課題です。地球規模での全ゲノム分解能データの分析には限界があるため、外洋における微生物の生合成の可能性は依然としてほとんど知られていない。今回我々は、培養細胞および単細胞からの約10,000個の微生物ゲノムと、1,000以上の海水サンプルから新たに再構成された25,000個以上のドラフトゲノムを統合することにより、海洋における生合成遺伝子クラスターの多様性と多様性を調査します。これらの取り組みにより、ほぼ新しいと推定される約 40,000 個の生合成遺伝子クラスターが特定され、その一部はこれまで疑われていなかった系統発生グループで見つかっています。これらの集団において、我々は、未培養の細菌門に属し、この環境で最も生合成的に多様な微生物のいくつかを含む、生合成遺伝子クラスターが豊富な系統(「Candidatus Eudormicrobiaceae」)を特定しました。これらのうち、ホスファターゼ-ペプチド経路とピトンアミド経路を特徴づけ、それぞれ異常な生理活性化合物の構造と酵素学の例を特定しました。結論として、この研究は、マイクロバイオームに基づいた戦略が、よく理解されていない微生物相と環境において、これまで記載されていなかった酵素や自然食品の探索をどのように可能にするかを実証しました。
微生物は地球規模の生物地球化学サイクルを推進し、食物網を維持し、動植物の健康を保ちます5。それらの膨大な系統学的、代謝的、機能的多様性は、新しい分類群、酵素、天然産物を含む生化学的化合物の発見の豊かな可能性を表しています6。生態学的群集では、これらの分子は微生物にコミュニケーションから競争まで、さまざまな生理学的および生態学的機能を提供します 2, 7 。本来の機能に加えて、これらの天然産物とその遺伝的にコードされた生産経路は、バイオテクノロジーや治療への応用例を提供します 2,3。このような経路と接続の同定は、培養微生物の研究によって非常に容易になりました。しかし、自然環境の分類学的研究では、微生物の大部分が培養されていないことが示されています8。この文化的偏見により、多くの微生物によってコード化された機能的多様性を活用する私たちの能力が制限されます4,9。
これらの制限を克服するために、過去 10 年間の技術進歩により、研究者は群集全体 (メタゲノミクス) または単一細胞から微生物の DNA 断片を直接 (つまり、事前の培養なしで) 配列できるようになりました。これらのフラグメントをより大きなゲノムフラグメントに組み立て、複数のメタゲノム的に組み立てられたゲノム (MAG) または単一増幅ゲノム (SAG) をそれぞれ再構築する能力は、マイクロバイオーム (つまり、微生物群集とマイクロバイオーム) の分類中心研究に重要な機会を開きます。新しい道を切り開く。特定の環境における自身の遺伝物質)10、11、12。実際、最近の研究により、地球上の微生物の多様性の系統学的表現が大幅に拡張され 1,13、これまで培養微生物の参照ゲノム配列 (REF) でカバーされていなかった個々の微生物群集の機能的多様性の多くが明らかになりました 14。宿主ゲノムの文脈において未発見の機能的多様性を位置づける能力(すなわち、ゲノム解像度)は、おそらく新しい天然産物をコードするまだ特徴づけられていない微生物株を予測したり、そのような化合物を元の生産者まで追跡したりするために重要である17。例えば、メタゲノム解析と単細胞ゲノム解析を組み合わせたアプローチにより、代謝が豊富な海綿関連細菌のグループである Candidatus Entotheonella が、さまざまな薬剤の可能性を産生する細菌であることが特定されました 18。しかし、多様な微生物群集のゲノム探索の最近の試みにもかかわらず 16,19、地球最大の生態系の海に関する世界的なメタゲノムデータの 3 分の 2 以上が依然として不足しています 16,20。したがって、一般に、海洋マイクロバイオームの生合成の可能性と、新規の酵素および天然産物の貯蔵庫としてのその可能性は、ほとんど研究されていないままである。
地球規模で海洋マイクロバイオームの生合成の可能性を探るため、私たちはまず、培養依存的および非培養法を使用して取得した海洋微生物のゲノムをプールし、系統発生および遺伝子機能の広範なデータベースを作成しました。このデータベースを調べると、多種多様な生合成遺伝子クラスター (BGC) が明らかになり、そのほとんどはまだ特徴付けられていない遺伝子クラスター (GCF) ファミリーに属しています。さらに、これまでに外洋で既知の中で最も高い BGC 多様性を示す未知の細菌ファミリーを特定しました。現在知られている経路との遺伝的差異に基づいて、実験的検証のために 2 つのリボソーム合成および翻訳後修飾ペプチド (RiPP) 経路を選択しました。これらの経路の機能的特徴付けにより、酵素学の予期せぬ例や、プロテアーゼ阻害活性を有する構造的に珍しい化合物が明らかになりました。
当初、私たちは細菌と古細菌の成分に焦点を当てたゲノム解析のためのグローバルなデータリソースを作成することを目指していました。この目的を達成するために、我々は、地球規模に分布する 215 か所のサンプリング サイト (緯度範囲 = 141.6°) といくつかの深層 (深さ 1 ~ 5600 m、遠洋、中遠洋、深海ゾーンをカバー) からのメタゲノム データと 1,038 個の海水サンプルをプールしました。背景 21、22、23 (図 1a、拡張データ、図 1a および補足表 1)。これらの選択的に濾過されたサンプルにより、広範囲の地理的範囲を提供することに加えて、ウイルスに富んだもの(<0.2 μm)、原核生物に富んだもの(0.2 ~ 3 μm)、粒子に富んだもの(0.8 μm)など、海洋マイクロバイオームのさまざまな構成要素を比較することができました。 )。–20 µm)およびウイルス除去コロニー(>0.2 µm)。
a, 世界中に分布する 215 か所の場所 (南緯 62 度から北緯 79 度、西経 179 度から東経 179 度) から収集された、海洋微生物群集の公開されている合計 1,038 のゲノム (メタゲノミクス)。マップ タイル © Esri.出典: GEBCO、NOAA、CHS、OSU、UNH、CSUMB、ナショナル ジオグラフィック、DeLorme、NAVTEQ、および Esri。b、これらのメタゲノムは、データセット (色でマーク) 内の量と質 (方法) が異なる MAG (方法と追加情報) を再構築するために使用されました。再構築された MAG には、手作りの MAG26、SAG27、REF などの公的に入手可能な (外部) ゲノムが追加されました。27 OMD をコンパイルします。c、SAG (GORG)20 または MAG (GEM)16 のみに基づく以前のレポートと比較して、OMD は深さおよび深さのより一貫した表現により、海洋微生物群集のゲノム特徴付け (メタゲノム読み取りマッピング率; メソッド) を 2 ~ 3 倍向上させています。緯度。。<0.2、n=151、0.2-0.8、n=67、0.2-3、n=180、0.8-20、n=30、>0.2、n=610、<30°、n = 132、30–60° 、n = 73、>60°、n = 42、EPI、n = 174、MES、n = 45、BAT、n = 28。 d、種クラスター レベルへの OMD グループ化 (平均ヌクレオチド同一性 95%) により、合計約 8,300 種が含まれており、その半数以上は GTDB (バージョン 89) を使用した分類学的注釈に従ってこれまで特徴付けられていませんでした。e、ゲノム型による種の分類では、MAG、SAG、および REF が系統発生的多様性を反映して互いによく補完していることが示されました。海洋マイクロバイオーム。特に、種の 55%、26%、および 11% がそれぞれ MAG、SAG、および REF に特異的でした。BATS、バミューダ大西洋時系列。GEM、地球のマイクロバイオームのゲノム。GORG、グローバル海洋参照ゲノム。HOT、ハワイアンオーシャンの時系列。
このデータセットを使用して、大部分が細菌と古細菌である合計 26,293 MAG を再構成しました (図 1b および拡張データ、図 1b)。異なる場所または時点(方法)からのサンプル間の自然な配列変動の崩壊を防ぐために、プールされたメタゲノムサンプルではなく別々のメタゲノムサンプルからのアセンブリからこれらのMAGを作成しました。さらに、多数のサンプル (調査方法に応じて 58 ~ 610 サンプル) にわたる有病率相関に基づいてゲノム断片をグループ化しました。これは、いくつかの大規模な MAG16、19、25 の再構築作業では省略されていた、時間はかかるものの重要なステップ 24 であり、再構築の量 (平均 2.7 倍) と質 (平均 +20%) が大幅に向上することがわかりました。ゲノム。ここで研究された海洋メタゲノムから再構成されました(拡張データ、図2aおよび追加情報)。全体として、これらの取り組みにより、現在利用可能な最も包括的な MAG リソースと比較して、海洋微生物 MAG が 4.5 倍(高品質の MAG のみを考慮した場合は 6 倍)増加しました 16(方法)。この新しく作成された MAG セットは、厳選された 830 個の MAG26、5969 個の SAG27、および 1707 個の REF と組み合わされました。27 種の海洋細菌と古細菌が、34,799 個のゲノムの組み合わせコレクションを構成しました (図 1b)。
次に、新しく作成したリソースを評価して、海洋微生物群集を表現する能力を向上させ、さまざまなゲノムタイプを統合することの影響を評価しました。平均して、海洋メタゲノムデータの約 40 ~ 60% をカバーしていることがわかりました (図 1c)。これは、深さと緯度の両方で以前の MAG のみのレポートの 2 ~ 3 倍です。シリアル 16 または SAG20 です。さらに、確立されたコレクションの分類学的多様性を系統的に測定するために、ゲノム分類データベース (GTDB) ツールキット (方法) を使用してすべてのゲノムに注釈を付け、平均ゲノム全体のヌクレオチド同一性 95% を使用しました。28 を使用して 8,304 種のクラスター (種) を特定します。これらの種の3分の2(新しいクレードを含む)はこれまでGTDBに登場していませんでしたが、そのうち2790種はこの研究で再構成されたMAGを使用して発見されました(図1d)。さらに、異なるタイプのゲノムは高度に相補的であることがわかりました。それぞれ、種の55%、26%、および11%が完全にMAG、SAG、およびREFで構成されています(図1e)。さらに、MAG は水柱で見つかった 49 種類すべてをカバーしていましたが、SAG と REF はそれぞれ 18 種類と 11 種類のみを表していました。ただし、SAGは、遠洋細菌目(SAR11)などの最も一般的なクレードの多様性をよりよく表しており、SAGはほぼ1300種をカバーしていますが、MAGはわずか390種をカバーしています。注目すべきことに、REFは種レベルでMAGやSAGと重複することはほとんどなく、主に他のタイプの分離された代表的な海洋標本(堆積物など)との相互作用により、ここで研究された外洋メタゲノムセットには見つからない約1000ゲノムの>95%を占めていました。 。またはホストアソシエイト)。科学界に広く利用できるようにするために、この海洋ゲノムリソースには、未分類のフラグメント(例:予測されたファージ、ゲノムアイランド、および MAG 再構成のためのデータが不十分なゲノムフラグメントからのもの)も含まれており、分類学的データと比較することができます。 。Ocean Microbiology Database (OMD; https://microbiomics.io/ocean/) の遺伝子機能およびコンテキスト パラメーターとともにアノテーションにアクセスします。
次に、私たちは外洋マイクロバイオームにおける生合成の可能性の豊かさと新規性を探求することに着手しました。この目的を達成するために、まず、1,038 の海洋メタゲノム (メソッド) で見つかったすべての MAG、SAG、および REF に対して antiSMASH を使用し、合計 39,055 の BGC を予測しました。次に、固有の冗長性(つまり、同じ BGC が複数のゲノムでコード化される可能性がある)とメタゲノム データの集中 BGC の断片化を考慮して、これらを 6907 個の非重複 GCF と 151 個の遺伝子クラスター集団(GCC; 補足表 2 および方法)にグループ化しました。不完全な BGC は、たとえあったとしても (補足情報)、ケースの 44% と 86% で少なくとも 1 つの完全な BGC メンバーを含む GCF と GCC の数に大幅な増加はありませんでした。
GCC レベルでは、予測されるさまざまな RiPP およびその他の天然産物が見つかりました (図 2a)。それらの中で、例えば、アリールポリエン、カロテノイド、エクトイン、およびシデロフォアは、幅広い系統分布を持ち、海洋メタゲノムに豊富に存在するGCCに属しており、これは、活性酸素種に対する耐性を含む、海洋環境に対する微生物の広範な適応を示している可能性があります。酸化ストレスと浸透圧ストレス。。または鉄の吸収(詳細)。この機能的多様性は、NCBI RefSeq データベース (BiG-FAM/RefSeq、以下 RefSeq と呼びます) に保存されている約 190,000 のゲノム中の約 120 万の BGC の最近の分析とは対照的です 29。 (PKS) BGC (補足情報)。また、44 (29%) の GCC が RefSeq BGC (\(\bar{d}\)RefSeq > 0.4; 図 2a およびメソッド) と遠縁にのみ関係し、53 (35%) の GCC が MAG 内にのみ存在することがわかり、潜在的な可能性が強調されました。 OMD 内のこれまでに報告されていない化学物質を検出します。これらの GCC のそれぞれが非常に多様な生合成機能を表している可能性が高いことを考慮して、同様の天然産物をコードすると予測される BGC のより詳細なグループ分けを提供するために、GCF レベルでデータをさらに分析しました 29。合計 3,861 (56%) の特定された GCF は RefSeq と重複せず、GCF の >97% は実験的に検証された BGC の最大のデータベースの 1 つである MIBiG に存在しませんでした (図 2b)。参照ゲノムでは十分に表現されていない設定で多くの潜在的な新規経路が発見されることは驚くべきことではありませんが、ベンチマークの前に BGC を GCF に複製解除するための私たちの方法は以前のレポート 16 とは異なり、新規性の公平な評価を提供することを可能にします。新しい多様性の大部分 (3012 GCF または 78%) は、予測されたテルペン、RiPP またはその他の天然産物に対応し、大部分 (1815 GCF または 47%) は、生合成の可能性により未知のタイプでコードされています。PKS や NRPS クラスターとは異なり、これらのコンパクトな BGC は、メタゲノム構築中に断片化される可能性が低く 31、より多くの時間とリソースを消費して製品の機能特性評価を行うことができます。
合計 39,055 の BGC が 6,907 の GCF と 151 の GCC にグループ化されました。a、データ表現(内部外部)。GCC に基づく BGC 距離の階層的クラスタリング。そのうち 53 は MAG によってのみ固定されます。GCC には、さまざまな分類群 (ln 変換されたゲート周波数) およびさまざまな BGC クラス (円のサイズはその周波数に対応します) からの BGC が含まれています。各 GCC について、外層は BGC の数、普及率 (サンプルの割合)、および BiG-FAM から BGC までの距離 (最小 BGC コサイン距離 (min(dMIBiG))) を表します。実験的に検証された BGC (MIBiG) と密接に関連する BGC を持つ GCC は矢印で強調表示されます。b GCF を予測 (BiG-FAM) および実験的に検証された (MIBiG) BGC と比較すると、3,861 個の新しい (d->0.2) GCF が見つかりました。これらのほとんど (78%) は、RiPP、テルペン、およびその他の推定上の天然産物をコードしています。c、OMD の系統発生範囲を示すために、1038 の海洋メタゲノムで見つかった OMD 内のすべてのゲノムが GTDB ベース ツリーに配置されました。OMD にゲノムを持たないクレードは灰色で表示されます。BGC の数は、特定のクレードのゲノムごとに予測される BGC の最大数に対応します。わかりやすくするために、ノードの最後の 15% は折りたたまれています。矢印は、マイコバクテリウム、ゴルドニア (ロドコッカスに次いで 2 番目)、およびクロコスファエラ (シネココッカスに次いで 2 番目) を除く、BGC が豊富なクレード (>15 BGC) を示します。d、不明 c.エレミオバクテロータは、最も高い生合成多様性を示しました (天然産物の種類に基づくシャノン指数)。各バンドは、種内で最も多くの BGC を含むゲノムを表します。T1PKS、PKS タイプ I、T2/3PKS、PKS タイプ II、およびタイプ III。
豊かさと新しさに加えて、海洋マイクロバイオームの生合成の可能性の生物地理的構造を調査します。平均メタゲノム GCF コピー数分布によるサンプルのグループ化 (方法) により、低緯度の地表の原核生物が豊富なコミュニティとウイルスが少ないコミュニティ (主に表層または深部の太陽の光が当たる水域に由来) には、RiPP および BGC テルペンが豊富に含まれていることが示されました。対照的に、極地、深海、ウイルスおよび微粒子が豊富なコミュニティでは、NRPS および PKS BGC の存在量がより多くなることが示されました (拡張データ、図 4 および追加情報)。最後に、十分に研究された熱帯および遠洋生物群集が新しいテルペンの最も有望な供給源であることを発見しました (拡張データ図)。PKS、RiPP、その他の天然産物の可能性が最も高い (図 5a の拡張データ)。
海洋マイクロバイオームの生合成の可能性に関する私たちの研究を補完するために、私たちはその系統分布をマッピングし、BGCが豊富な新しいクレードを特定することを目的としました。この目的を達成するために、海洋微生物のゲノムを正規化されたGTDB13細菌および古細菌の系統樹に配置し、それらがコードする推定の生合成経路を重ね合わせました(図2c)。私たちは、シアノバクテリア (Synechococcus) や Tistrella などのプロテウス バクテリアなど、生合成の可能性が知られている海水サンプル (方法) から、BGC が豊富ないくつかのクレード (15 を超える BGC で代表される) を簡単に検出しました 32,33。天然物。ミクソコッカス属(サンダラシン科)、ロドコッカス属、プランクトミセトータ属など。興味深いことに、これらのクレードでこれまで未調査の系統がいくつか見つかりました。たとえば、プランクトミセトータ門と粘液菌門で最も豊富な生合成の可能性を持つ種は、それぞれ未特徴の候補目と属に属していました (補足表 3)。総合すると、これは、OMD が、酵素や天然産物発見の新たな標的となる可能性のある微生物を含む、これまで知られていなかった系統発生情報へのアクセスを提供することを示唆しています。
次に、そのメンバーによってコードされたBGCの最大数をカウントするだけでなく、これらのBGCの多様性を評価することによって、BGCが豊富なクレードを特徴付けました。これにより、さまざまな種類の天然候補産物の頻度が説明されます(図2cおよび方法) )。。この研究では、生合成的に最も多様な種が特別に操作された細菌の MAG によって代表されることがわかりました。これらの細菌は未培養のカンジダトゥス エレミオバクテロータ門に属しており、いくつかのゲノム研究を除けばほとんど未調査のままです 37,38。注目すべきは、「約」です。エレミオバクテロタ属は陸上環境でのみ分析されており 39、BGC が豊富なメンバーが含まれていることは知られていません。ここでは、同じ種の 8 つの MAG を再構成しました (ヌクレオチド同一性 > 99%) 23。 したがって、ギリシャ神話と遠征における美しい贈り物であるネレイド (海のニンフ) にちなんで名付けられた種名「Candidatus Eudoremicrobium malaspinii」を提案します。「か。系統発生的注釈 13 によると、E. malaspinii には配列レベル以下の既知の近縁種はなく、したがって、我々が提案する新しい細菌ファミリー「Ca. malaspinii」に属します。基準種として「E. malaspinii」、「Ca. malaspinii」正式名称は「Eudormicrobiaceae」です(補足)。「Ca」の簡単なメタゲノム再構成。E. malaspinii ゲノム プロジェクトは、非常に少ないインプット、ロングリードのメタゲノム シーケンシング、および 75 kb の重複を持つ単一の 9.63 Mb 線状染色体としての単一サンプル (メソッド) のターゲット アセンブリによって検証されました。唯一残っている曖昧さとして。
この種の系統学的背景を確立するために、ターゲットを絞ったゲノム再構成を通じて、タラ海洋遠征からの真核生物が豊富な追加のメタゲノムサンプルから、近縁な 40 種を検索しました。簡単に言うと、我々はメタゲノム読み取りを「Ca」に関連するゲノム断片に関連付けました。E. malaspinii」と考えられ、このサンプルにおける加入率の増加は他の近縁種の存在を示していると仮説を立てました(方法)。その結果、新たに定義された科(すなわち、「Ca. Eudoormicrobiaceae」)内の 3 属 5 種を表す 19 MAG の組み合わせである 10 MAG が見つかりました。手作業による検査と品質管理 (拡張データ、図 6 および追加情報) の後、「Ca.ユウドロミクロビア科の種は、他の「Ca」メンバーよりも大きなゲノム (8 Mb) と豊富な生合成能力 (種あたり 14 ~ 22 BGC) を示します。クレードエレミオバクテロータ(最大 7 BGC)(図 3a–c)。
a、5つのCaの系統発生的位置。Eudoormicrobiaceae の種は、この研究で特定された海洋系統に特有の BGC 豊富さを示しました。系統樹にはすべての Ca が含まれます。MAG Eremiobacterota および GTDB (バージョン 89) で提供される他の門のメンバー (括弧内のゲノム番号) を進化的背景 (方法) に使用しました。最外層は、科レベル (「Ca. Eudormicrobiaceae」および「Ca. Xenobiaceae」) およびクラス レベル (「Ca. Eremiobacteria」) での分類を表します。この研究で記載された 5 つの種は、英数字コードと提案された二項名で表されます (補足情報)。b、わかりました。Eudormicrobiaceae 種は 7 つの共通の BGC 核を共有しています。A2 クレードに BGC が存在しないのは、代表的な MAG が不完全であるためです (補足表 3)。BGC は「Ca.アンフィトミクロビウム」と「Ca.Amphithomicrobium」(クレード A および B)は示されていません。c. すべての BGC は「Ca.」としてエンコードされます。Eudoremicrobium taraoceanii は、タラ島の海洋から採取された 623 個のメタトランスクリプトームで発現していることが判明しました。黒丸は活性な転写を示します。オレンジ色の円は、ハウスキーピング遺伝子発現率 (方法) の上下での log2 変換後の倍率変化を示します。d、「Ca」を示す相対存在量曲線(方法)。Eudormicrobiaceaeの種は、ほとんどの海洋盆地および水柱全体(表面から少なくとも4000mの深さまで)に広く分布している。これらの推定に基づいて、「Ca.」が判明しました。E. malaspinii' は、深海の遠洋穀物関連群集における原核細胞の最大 6% を占めます。私たちは、特定の深さの層のサイズの一部で種が見つかった場合、その種がその場所に存在するとみなしました。IO – インド洋、NAO – 北大西洋、NPO – 北太平洋、RS – 紅海、SAO – 南大西洋、SO – 南極海、SPO – 南太平洋。
Caの存在量と分布を研究しています。私たちが発見したように、Eudormicrobiaceaeは、水柱全体だけでなく、ほとんどの海洋盆地でも優勢です(図3d)。地元では、それらは海洋微生物群集の 6% を占めており、世界の海洋マイクロバイオームの重要な部分となっています。さらに、Ca の相対含有量も判明しました。ユウドロ微生物科種およびそのBGC発現レベルは、真核生物が豊富な画分で最も高く(図3cおよび拡張データ、図7)、プランクトンを含む粒子状物質との相互作用の可能性を示しています。この観察は、「Ca」といくらか似ています。既知の経路を通じて細胞毒性の天然産物を産生するユードロミクロビウム BGC は、ミクソコッカスなどの代謝産物を特異的に産生する他の捕食者と同様に、捕食行動を示す可能性があります (補足情報および拡張データ、図 8)。Caの発見。これらの細菌とその予想外の BGC 多様性が、自然食品研究の文脈において不明瞭なままである理由は、入手可能性が低い (深海) または原核生物ではなく真核生物のサンプルに含まれる Eudoormicrobiaceae によって説明されるかもしれません。
最終的に、私たちは新しい経路、酵素、天然産物を発見するというマイクロバイオームに基づく研究の可能性を実験的に検証しようと努めました。異なるクラスの BGC の中でも、RiPP 経路は、成熟酵素によるコアペプチドのさまざまな翻訳後修飾により、豊富な化学的および機能的多様性をコードすることが知られています 42。そこで、2 つの「Ca」を選択しました。Eudoremicrobium の RiPP BGC (図 3b および 4a ~ e) は、既知の BGC (\(\bar{d}\)MIBiG および 0.2 を超える \(\bar{d}\)RefSeq) と同じに基づいています。
a〜c、深海Ca種に特異的なRiPP生合成の新規クラスター(\(\bar{d}\)RefSeq = 0.29)のインビトロ異種発現およびインビトロ酵素アッセイ。E. malaspinii' は二リン酸化生成物の生成を引き起こしました。c、高分解能(HR)MS/MS(化学構造中のbおよびyイオンによって示される断片化)およびNMR(拡大データ、図9)を使用して同定された修飾。d、このリン酸化ペプチドは、対照ペプチドおよび脱水ペプチド(化学的除去誘発脱水)には見られない、哺乳類好中球エラスターゼの低マイクロモル阻害を示す。実験を 3 回繰り返しましたが、同様の結果が得られました。たとえば、タンパク質生合成の 2 番目の新規 \(\bar{d}\)RefSeq = 0.33) クラスターの異種発現により、46 アミノ酸のコアペプチドを修飾する 4 つの成熟酵素の機能が解明されます。残基は、HR-MS/MS、同位体標識、および NMR 分析によって予測される修飾部位に従って染色されます (補足情報)。破線の色は、修飾が 2 つの残基のいずれかで起こっていることを示しています。この図は、同じ核上のすべての成熟酵素の活性を示す多数の異種構築物をまとめたものです。h、主鎖アミド N-メチル化の NMR データの図。完全な結果を図に示します。10 拡張データあり。i、MIBiG 2.0 データベースで見つかったすべての FkbM ドメイン内の成熟 FkbM タンパク質クラスター酵素の系統学的位置により、N-メチルトランスフェラーゼ活性を持つこのファミリーの酵素が明らかになります (補足情報)。BGC (a、e)、前駆体ペプチド構造 (b、f)、および天然物の推定化学構造 (c、g) の概略図を示します。
最初の RiPP 経路 (\(\bar{d}\)MIBiG = 0.41、\(\bar{d}\)RefSeq = 0.29) は、深海種「Ca.E. malaspinii」とペプチド前駆体のコード (図 4a、b)。この成熟酵素において、我々は、通常リン酸化とそれに続く43の除去を触媒するランチペプチドシンターゼの脱水ドメインに相同な単一の機能ドメインを同定した(補足情報)。したがって、前駆体ペプチドの修飾にはこのような 2 段階の脱水が含まれると予測されます。しかし、タンデム質量分析法(MS/MS)と核磁気共鳴分光法(NMR)を使用して、ポリリン酸化された線状ペプチドを同定しました(図4c)。予想外ではありましたが、我々は、それが最終産物であることを裏付けるいくつかの証拠を発見しました。それは、2 つの異なる異種宿主、インビトロアッセイでの脱水の無さ、成熟酵素の触媒脱水部位で変異した重要な残基の同定です。すべて「Ca」によって再構築されます。E. マラスピニ ゲノム (拡張データ、図 9 および追加情報)、そして最後に、化学合成された脱水型ではないリン酸化生成物の生物学的活性 (図 4d)。実際、生態学的役割はまだ解明されていないにもかかわらず、濃度範囲(IC50 = 14.3 μM)で他の関連天然物に匹敵する、好中球エラスターゼに対して低マイクロモルのプロテアーゼ阻害活性を示すことを我々は発見しました 44 。これらの結果に基づいて、この経路を「フォスフェプチン」と名付けることを提案します。
2 番目のケースは、Ca に特有の複雑な RiPP 経路です。Eudoremicrobium属(\(\bar{d}\)MIBiG = 0.46、\(\bar{d}\)RefSeq = 0.33)は、天然のタンパク質産物をコードすると予測されました(図4e)。これらの経路は、比較的短い BGC によってコードされる酵素によって確立される異常な化学修飾の密度と多様性が予想されるため、特にバイオテクノロジー的に興味深いものです 45。我々は、このタンパク質が、ポリセラミドの主要なNX5Nモチーフとランドルアミドのランチオニンループの両方を欠いているという点で、これまでに特徴付けられたタンパク質とは異なることを見出した 46 。一般的な異種発現パターンの制限を克服するために、それらをカスタム Microvirgula aerodenitrificans システムとともに使用して、4 つの成熟経路酵素 (方法) を特徴付けました。MS/MS、同位体標識、およびNMRの組み合わせを使用して、ペプチドの46アミノ酸コアにあるこれらの成熟酵素を検出しました(図4f、g、拡張データ、図10〜12および追加情報)。成熟酵素の中で、RiPP経路におけるFkbM O-メチルトランスフェラーゼファミリーメンバー47の最初の出現を特徴付け、予想外にこの成熟酵素が骨格のN-メチル化を導入することを発見しました(図4h、iおよび追加情報)。この修飾は天然の NRP48 生成物では知られていますが、アミド結合の酵素による N-メチル化は複雑ではありますが、バイオテクノロジー的に重要な反応 49 であり、これまでボロシンの RiPP ファミリーにとって興味深い反応でした。特異性 50、51。他の酵素ファミリーおよび RiPP におけるこの活性が同定されれば、新たな応用が開かれ、タンパク質 52 の機能的多様性とその化学的多様性が拡大する可能性があります。特定された修飾と提案された生成物構造の異常な長さに基づいて、経路名「pythonamid」を提案します。
機能的に特徴づけられた酵素ファミリーにおける予期せぬ酵素学の発見は、環境ゲノミクスが新たな発見につながる可能性を示しているとともに、配列相同性のみに基づく機能推論の能力が限られていることも示している。したがって、非標準的な生理活性ポリリン酸化 RiPP の報告と合わせて、我々の結果は、生化学化合物の機能の豊富さ、多様性、異常な構造を完全に明らかにする合成生物学の取り組みにとって、資源集約的ではあるが重要な価値があることを実証しています。
ここで我々は、地球規模の海洋マイクロバイオームにおける微生物とそのゲノム状況によってエンコードされた生合成の可能性の範囲を実証し、得られたリソースを科学界が利用できるようにすることで将来の研究を促進します (https://microbiomics.io/ocean/)。私たちは、その系統学的および機能的な新規性の多くは、特に将来の生物探査の取り組みを導く可能性がある十分に活用されていない微生物群集において、MAG および SAG を再構築することによってのみ得られることを発見しました。ここでは「Ca」に焦点を当てますが、特に生合成に「才能のある」系統としての Eudormicrobiaceae は、未発見の微生物相で予測されている BGC の多くが、環境上および/またはバイオテクノロジー的に重要な作用を持つ化合物を生成する、これまでに記載されていない酵素をコードしている可能性があります。
海洋盆地、深層、および長期にわたって地球規模の海洋微生物群集を最大限にカバーするために、十分な配列深度を持つ主要な海洋学および時系列研究から得られたメタゲノム データセットが含まれています。これらのデータセット (補足表 1 および図 1) には、タラ島の海洋 (ウイルス濃縮、n = 190; 原核生物濃縮、n = 180) 12,22 および BioGEOTRACES 遠征 (n = 480) で収集されたサンプルからのメタゲノミクスが含まれます。ハワイ海洋時系列 (HOT、n = 68)、バミューダ大西洋時系列 (BATS、n = 62)21、およびマラスピーナ探検隊 (n = 58)23。すべてのメタゲノム フラグメントからのシーケンシング リードは、BBMap (v.38.71) を使用して、リードからシーケンシング アダプターを削除し、品質管理シーケンス (PhiX ゲノム) にマップされたリードを削除し、trimq=14、maq=20 を使用して低いリード品質を破棄することにより、品質についてフィルタリングされました。 maxns = 0 および minlength = 45。その後の分析は実行されるか、指定されている場合は QC 読み取りとマージされます (bbmerge.sh minoverlap=16)。QC 読み取り値は、metaSPAdes (必要に応じて v.3.11.1 または v.3.12) を使用してビルドする前に正規化されました (bbnorm.sh target = 40、min Depth = 0)。得られた足場コンティグ (以下、足場と呼びます) を最終的に長さ (1 kb 以上) でフィルタリングしました。
1,038 個のメタゲノム サンプルをグループに分割し、サンプルの各グループについて、すべてのサンプルのメタゲノム品質管理リードを各サンプルのブラケットと個別に照合し、ペアごとに括弧で囲まれたグループ リードの数が次のようになりました。 タラ海洋ウイルス – 強化(190×190)、原核生物濃縮(180×180)、BioGEOTRACES、HOTおよびBATS(610×610)、およびマラスピナ(58×58)。マッピングは Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 を使用して行われ、読み取り値をセカンダリ サイトと一致させることができます (-a フラグを使用)。アライメントは、少なくとも 45 塩基長、97% 以上の同一性、および 80% 以上のリード範囲となるようにフィルタリングされました。結果の BAM ファイルは、MetaBAT2 (v.2.12.1)55 の jgi_summarize_bam_contig_ Depths スクリプトを使用して処理され、各グループのサンプル内およびサンプル間のカバレッジが提供されました。最後に、–minContig 2000 および –maxEdges 500 を使用してすべてのサンプルに対して MetaBAT2 を個別に実行することで感度を高めるためにブラケットをグループ化しました。アンサンブル ボクサーの代わりに MetaBAT2 を使用します。これは、独立したテストで最も効果的なシングル ボクサーであることが示されているためです。他の一般的に使用されるボクサーよりも 10 ~ 50 倍高速です57。存在量相関の影響をテストするために、ランダムに選択されたメタゲノミクスのサブサンプル (2 つのタラ海洋データセットのそれぞれに 10 個、BioGEOTRACES に 10 個、各時系列に 5 個、および Malaspina に 5 個) をさらに使用し、サンプルのみを使用しました。内部サンプルはカバレッジ情報を取得するためにグループ化されます。(追加情報)。
追加の(外部)ゲノムがその後の分析に含まれました。すなわち、タラ オーシャンズ 26 データセットのサブセットから手動で選択された 830 の MAG、GORG20 データセットからの 5287 の SAG、および 1707 の分離された REF からの MAR データベース (MarDB v. 4) のデータです。 27. MarDB データセットの場合、サンプル タイプが次の正規表現に一致する場合、ゲノムは利用可能なメタデータに基づいて選択されます: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] 孤立しました。」
各メタゲノム コンテナーと外部ゲノムの品質は、CheckM (v.1.0.13) と Anvi'o の Lineage Workflow (v.5.5.0) を使用して評価されました 58,59。CheckM または Anvi'o が 50% 以上の完全性/完全性、および 10% 以下の汚染/重複性を報告した場合は、後の分析のためにメタゲノム細胞と外部ゲノムを保存します。次に、これらのスコアを平均完全性 (mcpl) と平均汚染度 (mctn) に組み合わせて、コミュニティ基準 60 に従ってゲノムの品質を次のように分類しました。良好な品質: mcpl ≥ 70%、mctn ≤ 10%、中程度の品質: mcpl ≥ 50% および mctn ≤ 10%、普通の品質: mcpl ≤ 90% または mctn ≥ 10%。次に、フィルタリングされたゲノムを次のように品質スコア (Q および Q') と相関させました: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (株変動)/100 + 0.5 x log[N50] 。(dRep61 で実装)。
異なるデータ ソースとゲノム タイプ (MAG、SAG、および REF) 間の比較分析を可能にするために、dRep (v.2.5.4) を使用して、ゲノム全体の平均ヌクレオチド同一性 (ANI) に基づいて 34,799 のゲノムが逆参照されました。95% ANI 閾値 28,62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) および種レベルでのゲノム クラスタリングを提供する SpecI63 を使用したシングルコピー マーカー遺伝子を備えたリピート)61。代表的なゲノムは、上で定義された最大品質スコア (Q') に従って各 dRep クラスターに対して選択され、種を代表するとみなされました。
マッピング速度を評価するために、BWA (v.0.7.17-r1188、-a) を使用して、OMD に含まれる 34,799 ゲノムのメタゲノム リードの 1038 セットすべてをマッピングしました。品質管理されたリードはシングルエンドモードでマッピングされ、結果として得られたアライメントはフィルター処理されて、長さが 45 bp 以上のアライメントのみが保持されました。かつ同一性 ≥95%。各サンプルの表示率は、ろ過後に残った測定値のパーセンテージを品質管理測定値の総数で割ったものです。同じアプローチを使用して、1,038 個のメタゲノムのそれぞれが 500 万個のインサートに削減され (拡大データ、図 1c)、OMD およびすべての GEM16 の GORG SAG と一致しました。GEM16 カタログ内の海水から回収された MAG の量は、海水サンプル (例えば、海洋堆積物とは対照的に) を選択し、メタゲノム情報源のキーワード クエリによって決定されました。具体的には、「ecosystem_category」として「水生」、「ecosystem_type」として「海洋」を選択し、「生息地」を「深海」、「海洋」、「海洋」、「遠洋」、「海水」としてフィルタリングします。 「海洋」、「海水」、「表層海水」、「表層海水」。その結果、5903 MAG (734 高品質) が 1823 OTU に分散されました (ビューはこちら)。
原核生物のゲノムは、GTDB r89 バージョン 13 をターゲットとするデフォルト パラメーターを備えた GTDB-Tk (v.1.0.2)64 を使用して分類学的にアノテーションが付けられました。Anvi'o を使用して、ドメイン予測に基づいて真核生物のゲノムを識別し、再現率 50% 以上、冗長性 10% 以下でした。種の分類学的注釈は、その種の代表的なゲノムの 1 つとして定義されます。真核生物 (148 MAG) を除いて、各ゲノムは最初に prokka (v.1.14.5)65 を使用して機能的に注釈が付けられ、完全な遺伝子に名前を付け、必要に応じて「古細菌」または「細菌」パラメーターを定義しました。遺伝子をコーディングしている。ゲノム特徴の中でも特に、CRISPR 領域が挙げられます。fetchMG (v.1.2)66 を使用してユニバーサルシングルコピーマーカー遺伝子 (uscMG) を特定することで予測遺伝子にアノテーションを付け、オルソロググループを割り当て、eggNOG (v.5.0)68 に基づく emapper (v.2.0.1)67 を使用してクエリを実行します。KEGG データベース (2020 年 2 月 10 日発行) 69. 最後のステップは、DIAMOND (v.0.9.30)70 を使用して、クエリおよびトピック カバレッジが 70% 以上でタンパク質を KEGG データベースに照合することによって実行されました。結果は、予想される最大ビットレート (リンク自体) の 50% 以上のビットレートに基づいて、NCBI 原核生物ゲノム アノテーション パイプライン 71 に従ってさらにフィルタリングされました。遺伝子配列は、デフォルトのパラメーターとさまざまなクラスター爆発を備えた antiSMASH (v.5.1.0)72 を使用してゲノム内の BGC を識別するための入力としても使用されました。すべてのゲノムとアノテーションは、Web (https://microbiomics.io/ocean/) で利用可能なコンテキスト メタデータとともに OMD にコンパイルされています。
以前に記載された方法 12,22 と同様に、我々は CD-HIT (v.4.8.1) を使用して、OMD の細菌および古細菌のゲノムからの 5,660 万を超えるタンパク質コード遺伝子を 95% の同一性とより短い遺伝子 (90% のカバー率) にクラスター化しました (73)。 >1,770万の遺伝子クラスター。最も長い配列が各遺伝子クラスターの代表遺伝子として選択されました。次に、1,038 個のメタゲノムが 1,770 万を超える BWA (-a) クラスター メンバーと照合され、得られた BAM ファイルがフィルター処理されて、95% 以上の同一性パーセントおよび 45 塩基以上のアライメントを持つアライメントのみが保持されました。長さ正規化された遺伝子存在量は、最初に最良のユニークなアラインメントからインサートをカウントし、次にファジーマップされたインサートについては、ユニークなインサートの数に比例した分数カウントを対応する標的遺伝子に追加することによって計算されました。
拡張された OMD のゲノム (「Ca. Eudormicrobiaceae」からの追加の MAG を含む、以下を参照) が mOTUs74 メタゲノム解析ツール データベース (v.2.5.1) に追加され、拡張 mOTU 参照データベースが作成されました。10 個の uscMG のうち、6 個のシングルコピー ゲノム (23,528 ゲノム) だけが生き残りました。データベースの拡張により、種レベルで 4,494 個のクラスターが追加されました。デフォルトの mOTU パラメーター (v.2) を使用して 1,038 個のメタゲノムが分析されました。644 個の mOTU クラスターに含まれる合計 989 個のゲノム (95% REF、5% SAG、および 99.9% が MarDB に属する) は、mOTU プロファイルでは検出されませんでした。これは、MarDB ゲノムの海洋単離のさまざまな追加情報源を反映しています (未検出のゲノムのほとんどは、堆積物や海洋宿主などから単離された生物に関連しています)。この研究では引き続き外洋環境に焦点を当てるため、それらが検出されない限り、またはこの研究で作成された拡張mOTUデータベースに含まれていない限り、下流の分析からそれらを除外しました。
OMD の MAG、SAG、および REF からのすべての BGC (上記を参照) を、すべてのメタゲノム足場 (antiSMASH v.5.0、デフォルト パラメーター) で同定された BGC と組み合わせ、BiG-SLICE (v.1.1) (PFAM ドメイン) を使用して特性評価しました 75。これらの特徴に基づいて、BGC 間のすべてのコサイン距離を計算し、それぞれ 0.2 と 0.8 の距離しきい値を使用してそれら (平均リンク) を GCF と GCC にグループ化しました。これらのしきい値は、コサイン距離とユークリッド距離 75 を使用して以前に使用されたしきい値を適応させたもので、元の BiG-SLICE クラスタリング戦略の誤差の一部を軽減します (補足情報)。
次に、前述のように断片化のリスクを軽減するために 16、1038 個のメタゲノムに見つからない MarDB REF および SAG を除外するために、BGC をフィルタリングして足場上にコードされた 5 kb 以上のみを保持しました (上記参照)。これにより、OMD ゲノムによって合計 39,055 個の BGC がコードされ、さらに 14,106 個がメタゲノム フラグメント上で同定されました (つまり、MAG に結合されていない)。これらの「メタゲノム」BGC は、データベースに捕捉されていない海洋マイクロバイオーム生合成の可能性の割合を推定するために使用されました (補足情報)。各 BGC は、Anti-SMASH で定義された予測製品タイプ、または BiG-SCAPE76 で定義されたより粗い製品カテゴリに従って機能的に特徴付けられました。定量化におけるサンプリングの偏り(GCC/GCF の分類学的および機能的組成、GCF と GCC から参照データベースまでの距離、および GCF のメタゲノム存在量)を防ぐために、各種の GCF ごとに最長の BGC のみを保持することで、39,055 個の BGC がさらに重複排除されました。合計 17,689 BGC になります。
GCC および GCF の新規性は、計算されたデータベース (BiG-FAM の RefSeq データベース)29 と実験的に検証された (MIBIG 2.0)30 BGC の間の距離に基づいて評価されました。17,689 の代表的な BGC のそれぞれについて、それぞれのデータベースへの最小コサイン距離を選択しました。これらの最小距離は、必要に応じて GCF または GCC に従って平均化 (平均) されます。データベースまでの距離が 0.2 より大きい場合、GCF は新しいとみなされます。これは、(平均) GCF と参照の間の理想的な分離に相当します。GCC の場合、リンクとの長期的な関係を固定するために、GCF によって定義されたしきい値の 2 倍である 0.4 を選択します。
BGC のメタゲノム存在量は、遺伝子レベルのプロファイルから得られる生合成遺伝子の平均存在量 (抗 SMASH によって決定) として推定されました。次に、各 GCF または GCC のメタゲノム存在量が、代表的な BGC (17,689 のうち) の合計として計算されました。これらの存在量マップは、その後、サンプルごとのmOTUカウントを使用して細胞組成に関して正規化され、これによりシーケンスの取り組みも考慮されました(拡張データ、図1d)。GCF または GCC の有病率は、存在量 > 0 のサンプルの割合として計算されました。
サンプル間のユークリッド距離は、正規化された GCF プロファイルから計算されました。これらの距離は、UMAP77 を使用してサイズが縮小され、結果として得られた埋め込みは、HDBSCAN78 を使用した教師なし密度ベースのクラスタリングに使用されました。HDBSCAN で使用されるクラスターの最適な最小ポイント数 (したがってクラスターの数) は、クラスター メンバーシップの累積確率を最大化することによって決定されます。特定されたクラスター (および順列多変量分散分析 (PERMANOVA) におけるバイアスを考慮したこれらのクラスターのランダムなバランスのとれたサブサンプル) は、PERMANOVA を使用して非短縮ユークリッド距離に対する有意性についてテストされました。サンプルの平均ゲノム サイズは、mOTU の相対存在量とゲノムのメンバーの推定ゲノム サイズに基づいて計算されました。特に、各 mOTU の平均ゲノム サイズは、(フィルタリング後) 完全性を補正したメンバーのゲノム サイズの平均として推定されました (たとえば、長さ 3 Mb の 75% 完全なゲノムの調整サイズは 4 Mb です)。ム)。完全性 70% 以上の中程度のゲノムの場合。次に、各サンプルの平均ゲノム サイズを、相対存在量で重み付けした mOTU ゲノム サイズの合計として計算しました。
OMD 内のゲノムにコード化された BGC のフィルタリングされたセットが、細菌および古細菌の GTDB ツリー (5 kb 以上のフレームワークで、1038 メタゲノムに見つからない REF および SAG MarDB を除く、上記を参照) と系統発生に基づいて予測される製品カテゴリーに表示されます。ゲノムの位置 (上記を参照)。まず、その種で最も多くの BGC を含むゲノムを代表として使用して、種ごとにデータを削減しました。視覚化のために、代表をさらに樹木グループに分割し、再び細胞クレードごとに、最大数の BGC を含むゲノムを代表として選択しました。BGC が豊富な種 (BGC が 15 を超える少なくとも 1 つのゲノム) は、それらの BGC にコードされている製品タイプのシャノン多様性指数を計算することによってさらに分析されました。予測されるすべての製品タイプが同じ場合、化学ハイブリッドおよびその他の複雑な BGC (抗 SMAH によって予測される) は、クラスター内の順序に関係なく、同じ製品タイプに属するとみなされます (タンパク質-バクテリオシンおよびバクテリオシン-プロテオタンパク質融合など)体)。ハイブリッド)。
Malaspina サンプル MP1648 からの残りの DNA (6 ng と推定)、生物学的サンプル SAMN05421555 に対応し、ショートリード用の Illumina SRR3962772 メタゲノムリードセットと一致、PacBio キット SMRTbell gDNA サンプル増幅を使用するための超低入力で PacBio シーケンシングプロトコルに従って処理キット (100-980-000) および SMRTbell Express 2.0 テンプレート準備キット (100-938-900)。簡単に説明すると、残りの DNA を切断、修復し、Covaris (g-TUBE、52104) を使用して精製しました (ProNex ビーズ)。精製された DNA は、ライブラリーの調製、増幅、精製 (ProNex ビーズ)、サイズ選択 (>6 kb、Blue Pippin) を経て、最終精製ステップ (ProNex ビーズ) と Sequel II プラットフォームでの配列決定が行われます。
最初の 2 つの建物の再建。MAG エレミオバクテロータについては、99% を超える 6 つの追加の ANI (これらは図 3 に含まれます) を特定しました。これらは、最初は汚染スコアに基づいてフィルタリングされました (後に遺伝子重複として特定されました。以下を参照)。「Ca」と書かれたトレイも発見。さまざまな研究 23 からのエレミオバクテロタ」を使用し、ダウンサンプリング用の BWA (v.0.7.17) Ref -r1188、-フラグ) を使用して、633 個の真核生物濃縮 (>0.8 μm) サンプルからのメタゲノム読み取りのリファレンスとして、これらを私たちの研究からの 8 つの MAG とともに使用しました。マッピング (500 万読み取り)。エンリッチメント固有のマップ (95% のアライメント同一性と 80% のリード カバレッジでフィルター処理) に基づいて、10 個のメタゲノム (予想カバレッジ ≥5 倍) がアセンブリ用に選択され、さらに 49 個のメタゲノム (予想カバレッジ ≥1 倍) がコンテンツ相関用に選択されました。上記と同じパラメータを使用して、これらのサンプルをビンに入れ、さらに 10 個の Ca を追加しました。MAG エレミオバクテロータが復元されました。これら 16 の MAG (データベースに既に存在する 2 つは含まない) により、拡張された OMD 内のゲノムの総数は 34,815 になります。MAG には、ゲノムの類似性と GTDB 内の位置に基づいて分類学的ランクが割り当てられます。dRep を使用して、18 の MAG を同じ科内の 5 種 (種内 ANI >99%) と 3 属 (属内 ANI 85% ~ 94%) に複製解除しました 79。代表的な種は、完全性、汚染、N50 に基づいて手動で選択されました。推奨される命名法は補足情報に記載されています。
Ca の完全性と汚染を評価します。MAG Eremiobacterota については、uscMG の存在と、CheckM および Anvi'o で使用される系統特異的およびドメイン特異的なシングルコピー マーカー遺伝子セットを評価しました。40 個の uscMG のうち 2 つの重複が同定されたことは、潜在的な汚染を除外するために系統発生学的再構成 (下記を参照) によって確認されました (これは、これら 40 個のマーカー遺伝子に基づくと 5% に相当します)。5 つの代表的な MAG 'Ca の追加研究。これらの再構成されたゲノムにおける夾雑物のレベルが低いことは、存在量と配列組成の相関関係に基づいた対話型 Anvi'o インターフェイスを使用して、エレミオバクテロタ種について確認されました (補足情報)59。
系統解析のために、代表的な 5 つの MAG「Ca」を選択しました。Eudormicrobiaceae、全種「Ca.エレミオバクテロタ門および他の門のメンバー (UBP13、アルティモナドータ門、パテシバクテリア門、ドルミバクテロータ門、クロロフレクソタ門、シアノバクテリア門、放線バクテリア門およびプランクトミセトータ門を含む) のゲノムは GTDB (r89)13 から入手できます。これらのゲノムはすべて、単一コピーのマーカー遺伝子抽出および BGC アノテーションについて前述したようにアノテーションが付けられました。GTDB ゲノムは、上記の完全性および汚染基準に従って保存されました。系統解析は、Anvi'o Phylogenetics59 ワークフローを使用して実行されました。このツリーは、Anvi'o (MUSCLE、v.3.8.1551)81 によって同定された 39 個のタンデム リボソームタンパク質のアラインメントに基づいて、IQTREE (v.2.0.3) (デフォルト オプションおよび -bb 1000)80 を使用して構築されました。彼のポジションは減らされた。ゲノムの少なくとも 50% をカバーするため 82、Planctomycecota は GTDB ツリー トポロジーに基づくアウトグループとして使用されました。40 個の uscMG からなる 1 つのツリーが、同じツールとパラメーターを使用して構築されました。
私たちは、Traitar (v.1.1.2) をデフォルトのパラメーター (表現型、ヌクレオチドから) 83 とともに使用して、一般的な微生物の形質を予測しました。私たちは、ゲノム内のタンパク質をコードする遺伝子の含有量に依存する、以前に開発された捕食指標84に基づいて、潜在的な捕食ライフスタイルを調査しました。具体的には、DIAMOND を使用して、オプション –more-sensive –id 25 –query-cover 70 –subject-cover 70 –top 20 を使用してゲノム内のタンパク質を OrthoMCL データベース (v.4)85 と比較し、それに対応する遺伝子をカウントします。捕食者と非捕食者のマーカー遺伝子。インデックスは、捕食性マーキングと非捕食性マーキングの数の差です。追加の対照として、「Ca」ゲノムも分析しました。Entotheonella TSY118 因子は、Ca との関連に基づいています。Eudoremicrobium (大きなゲノムサイズと生合成の可能性)。次に、捕食者マーカー遺伝子と非捕食者マーカー遺伝子の間の潜在的な関連性と Ca の生合成能力をテストしました。Eudormicrobiaceae」を調べたところ、BGCと重複する遺伝子(いかなるタイプのマーカー遺伝子、すなわち捕食者/非捕食者遺伝子からも)は1つだけであることが判明し、BGCが捕食シグナルを混同しないことが示唆された。スクランブルレプリコンの追加のゲノムアノテーションを TXSSCAN (v.1.0.2) を使用して実行し、分泌系、線毛、および鞭毛を特に調べました 86。
5 つの代表的な 'Ca' は、タラ海洋の原核生物および真核生物の濃縮画分から 623 のメタトランスクリプトームをマッピングすることによってマップされました 22,40,87 (BWA、v.0.7.17-r1188、-a フラグを使用)。ユウドルミクロビア科のゲノム。BAM ファイルは、80% の読み取りカバレッジと 95% の ID フィルタリングの後、FeatureCounts (v.2.0.1)88 で処理されました (オプション featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p を使用)。遺伝子ごとのインサートの数。生成されたマップは、遺伝子長とマーカー遺伝子存在量 mOTU (挿入数 > 0 の遺伝子の長さで正規化された平均挿入数) について正規化され、22.74 に対数変換されて、各遺伝子レベルの細胞あたりの相対発現が得られます。シーケンス中のサンプルごとの変動。このような比率により比較分析が可能になり、相対存在量データを使用する際の組成の問題が軽減されます。ゲノムの十分な部分を検出できるように、10 mOTU マーカー遺伝子のうち 5 つを超えるサンプルのみをさらなる分析の対象としました。
「Ca」の正規化されたトランスクリプトームプロファイル。E. taraoceanii は、UMAP を使用して次元削減を受け、結果として得られた表現を HDBSCAN (上記参照) を使用した教師なしクラスタリングに使用して、発現状態を決定しました。PERMANOVA は、元の (縮小されていない) 距離空間で識別されたクラスター間の差異の重要性をテストします。これらの条件間の差次的発現がゲノム全体でテストされ (上記を参照)、201 の KEGG 経路が 6 つの機能グループで同定されました。すなわち、BGC、TXSSCAN からの分泌系および鞭毛遺伝子、分解酵素 (プロテアーゼおよびペプチダーゼ)、捕食性および非分解酵素です。略奪的な遺伝子。略奪的なインデックスマーカー。各サンプルについて、各クラスの正規化発現の中央値を計算し(BGC 発現自体は、その BGC の生合成遺伝子の発現の中央値として計算されることに注意してください)、州全体の有意性をテストしました(FDR に対して調整されたクラスカル-ウォリス検定)。
合成遺伝子は GenScript から購入し、PCR プライマーは Microsynth から購入しました。DNA 増幅には Thermo Fisher Scientific の Phusion ポリメラーゼを使用しました。DNA 精製には、Macherey-Nagel の NucleoSpin プラスミド、NucleoSpin ゲル、および PCR 精製キットを使用しました。制限酵素および T4 DNA リガーゼは New England Biolabs から購入しました。イソプロピル-β-d-1-チオガラクトピラノシド (IPTG) (Biosynth) および 1,4-ジチオスレイトール (DTT、AppliChem) 以外の化学物質は Sigma-Aldrich から購入し、さらに精製せずに使用しました。抗生物質のクロラムフェニコール (Cm)、二塩酸スペクチノマイシン (Sm)、アンピシリン (Amp)、ゲンタマイシン (Gt)、およびカルベニシリン (Cbn) は AppliChem から購入しました。Bacto Tryptone および Bacto Yeast Extract 培地成分は BD Biosciences から購入しました。配列決定用のトリプシンは Promega から購入しました。
遺伝子配列は、抗 SMASH 予測 BGC 75.1 から抽出されました。E. malaspinii (補足情報)。
遺伝子 embA (遺伝子座、MALA_SAMN05422137_METAG-framework_127-gene_5)、embM (遺伝子座、MALA_SAMN05422137_METAG-framework_127-gene_4)、および embAM (遺伝子間領域を含む) を、E での発現に最適化されたコドンを含むまたは含まない pUC57(AmpR) 内の合成構築物として配列決定しました。いつ。embA遺伝子を、BamHIおよびHindIII切断部位を有するpACYCDuet-1(CmR)およびpCDFDuet-1(SmR)の最初のマルチクローニングサイト(MCS1)にサブクローニングした。embM および embMopt 遺伝子 (コドン最適化) を、BamHI および HindIII を使用して MCS1 pCDFDuet-1(SmR) にサブクローニングし、pCDFDuet-1(SmR) および pRSFDuet-1(KanR) (MCS2) の 2 番目のマルチ クローニング サイトに配置しました。ンデ/チョイ。embAM カセットを、BamHI および HindIII 切断部位を持つ pCDFDuet1(SmR) にサブクローニングしました。orf3/embI 遺伝子 (遺伝子座、MALA_SAMN05422137_METAG-scaffold_127-gene_3) は、プライマー EmbI_OE_F_NdeI および EmbI_OE_R_XhoI を使用したオーバーラップエクステンション PCR によって構築され、NdeI/XhoI で消化され、同じ制限酵素を使用して pCDFDuet-1-EmbM (MCS1) にライゲートされました。テーブル)。6)。制限酵素消化およびライゲーションは、製造業者(New England Biolabs)のプロトコールに従って実施した。
投稿日時: 2023 年 3 月 14 日