304 Keluli tahan karat dikimpal tiub bergelung / tiub zhemical zompon, Potensi Biosintetik Mikrobiom Marin Global

Terima kasih kerana melawat Nature.com.Anda menggunakan versi penyemak imbas dengan sokongan CSS terhad.Untuk pengalaman terbaik, kami mengesyorkan agar anda menggunakan penyemak imbas yang dikemas kini (atau lumpuhkan Mod Keserasian dalam Internet Explorer).Di samping itu, untuk memastikan sokongan berterusan, kami menunjukkan tapak tanpa gaya dan JavaScript.
Peluncur menunjukkan tiga artikel setiap slaid.Gunakan butang belakang dan seterusnya untuk bergerak melalui slaid, atau butang pengawal slaid di hujung untuk bergerak melalui setiap slaid.

Penerangan produk terperinci

304 Keluli tahan karat dikimpal tiub bergelung / tiub
1. Spesifikasi: Tiub gegelung keluli tahan karat / tiub
2. Jenis: dikimpal atau lancar
3. Standard: ASTM A269, ASTM A249
4. Tiub gegelung keluli tahan karat OD: 6mm hingga 25.4MM
5. Panjang: 600-3500MM atau mengikut keperluan pelanggan.
6. Ketebalan dinding: 0.2mm hingga 2.0mm.

7. Toleransi: OD: +/-0.01mm;Ketebalan: +/-0.01%.

8. Saiz lubang dalam gegelung: 500MM-1500MM (boleh dilaraskan mengikut keperluan pelanggan)

9. Ketinggian gegelung: 200MM-400MM (boleh dilaraskan mengikut keperluan pelanggan)

10. Permukaan: Cerah atau anil
11. Bahan: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, aloi 625, 825, 2205, 2507, dsb.
12. Pembungkusan: beg tenunan dalam kes kayu, palet kayu, aci kayu, atau mengikut keperluan pelanggan
13. Ujian : komponen kimia, kekuatan hasil, kekuatan tegangan, ukuran kekerasan
14. Jaminan: Pemeriksaan pihak ketiga (contohnya :SGS TV), dsb.
15. Aplikasi: Hiasan, perabot, pengangkutan minyak, penukar haba, pembuatan pagar, pembuatan kertas, kereta, pemprosesan makanan, perubatan, dll.

Semua Komposisi Kimia dan Sifat Fizikal untuk Keluli Tahan Karat seperti di bawah:

bahan ASTM A269 Komposisi Kimia % Maks
C Mn P S Si Cr Ni Mo NB Nb Ti
TP304 0.08 2.00 0.045 0.030 1.00 18.0-20.0 8.0-11.0 ^ ^ ^ . ^
TP304L 0.035 2.00 0.045 0.030 1.00 18.0-20.0 8.0-12.0 ^ ^ ^ ^
TP316 0.08 2.00 0.045 0.030 1.00 16.0-18.0 10.0-14.0 2.00-3.00 ^ ^ ^
TP316L 0.035 D 2.00 0.045 0.030 1.00 16.0-18.0 10.0-15.0 2.00-3.00 ^ ^ ^
TP321 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 ^ ^ ^ 5C -0.70
TP347 0.08 2.00 0.045 0.030 1.00 17.0-19.0 9.0-12.0 10C -1.10 ^

 

bahan Rawatan haba Suhu F (C) Min. Kekerasan
Brinell Rockwell
TP304 Penyelesaian 1900 (1040) 192HBW/200HV 90HRB
TP304L Penyelesaian 1900 (1040) 192HBW/200HV 90HRB
TP316 Penyelesaian 1900(1040) 192HBW/200HV 90HRB
TP316L Penyelesaian 1900(1040) 192HBW/200HV 90HRB
TP321 Penyelesaian 1900(1040) F 192HBW/200HV 90HRB
TP347 Penyelesaian 1900(1040) 192HBW/200HV 90HRB

 

OD, inci Toleransi OD inci (mm) Toleransi WT % Toleransi Panjang inci(mm)
+ -
≤ 1/2 ± 0.005 ( 0.13 ) ± 15 1 / 8 ( 3.2 ) 0
> 1 / 2 ~1 1 / 2 ± 0.005(0.13) ± 10 1 / 8 (3.2) 0
> 1 1 / 2 ~< 3 1 / 2 ± 0.010(0.25) ± 10 3 / 16 (4.8) 0
> 3 1 / 2 ~< 5 1 / 2 ± 0.015(0.38) ± 10 3 / 16 (4.8) 0
> 5 1 / 2 ~< 8 ± 0.030(0.76) ± 10 3 / 16 (4.8) 0
8~< 12 ± 0.040(1.01) ± 10 3 / 16 (4.8) 0
12~< 14 ± 0.050(1.26) ± 10 3 / 16 (4.8) 0

Komuniti mikrob semulajadi adalah pelbagai dari segi filogenetik dan metabolik.Selain kumpulan organisma yang kurang dikaji1, kepelbagaian ini juga mempunyai potensi yang kaya untuk penemuan enzim dan sebatian biokimia yang penting dari segi ekologi dan bioteknologi.Walau bagaimanapun, mengkaji kepelbagaian ini untuk menentukan laluan genom yang mensintesis sebatian tersebut dan mengikatnya kepada perumah masing-masing tetap menjadi cabaran.Potensi biosintetik mikroorganisma di lautan terbuka sebahagian besarnya masih tidak diketahui kerana batasan dalam analisis data resolusi genom keseluruhan pada skala global.Di sini, kami meneroka kepelbagaian dan kepelbagaian kelompok gen biosintetik di lautan dengan menyepadukan kira-kira 10,000 genom mikrob daripada sel berbudaya dan sel tunggal dengan lebih daripada 25,000 genom draf yang baru dibina semula daripada lebih 1,000 sampel air laut.Usaha ini telah mengenal pasti kira-kira 40,000 kluster gen biosintetik yang kebanyakannya diduga baru, beberapa daripadanya telah ditemui dalam kumpulan filogenetik yang tidak disyaki sebelum ini.Dalam populasi ini, kami mengenal pasti keturunan yang diperkaya dalam kelompok gen biosintetik ("Candidatus Eudormicrobiaceae") yang tergolong dalam filum bakteria yang tidak ditanam dan termasuk beberapa mikroorganisma yang paling biosintetik pelbagai dalam persekitaran ini.Daripada jumlah ini, kami telah mencirikan laluan fosfatase-peptida dan pytonamide, masing-masing mengenal pasti contoh struktur sebatian bioaktif dan enzimologi yang luar biasa.Kesimpulannya, kajian ini menunjukkan bagaimana strategi berasaskan mikrobiom boleh membolehkan penerokaan enzim dan makanan semula jadi yang tidak diterangkan sebelum ini dalam mikrobiota dan persekitaran yang kurang difahami.
Mikrob memacu kitaran biogeokimia global, mengekalkan siratan makanan, dan memastikan tumbuh-tumbuhan dan haiwan sihat5.Kepelbagaian filogenetik, metabolik dan fungsi mereka yang besar mewakili potensi yang kaya untuk penemuan takson1 baharu, enzim dan sebatian biokimia, termasuk produk semula jadi6.Dalam komuniti ekologi, molekul ini menyediakan mikroorganisma dengan pelbagai fungsi fisiologi dan ekologi, daripada komunikasi kepada persaingan 2, 7 .Sebagai tambahan kepada fungsi asalnya, produk semula jadi ini dan laluan pengeluaran berkod genetiknya memberikan contoh untuk aplikasi bioteknologi dan terapeutik2,3.Pengenalpastian laluan dan sambungan sedemikian telah dipermudahkan oleh kajian mikrob berbudaya.Walau bagaimanapun, kajian taksonomi persekitaran semula jadi telah menunjukkan bahawa sebahagian besar mikroorganisma belum ditanam8.Bias budaya ini mengehadkan keupayaan kita untuk mengeksploitasi kepelbagaian fungsi yang dikodkan oleh banyak mikrob4,9.
Untuk mengatasi batasan ini, kemajuan teknologi sepanjang dekad yang lalu telah membenarkan penyelidik untuk secara langsung (iaitu, tanpa budaya terdahulu) mengurutkan serpihan DNA mikrob daripada keseluruhan komuniti (metagenomik) atau sel tunggal.Keupayaan untuk memasang serpihan ini menjadi serpihan genom yang lebih besar dan membina semula berbilang genom yang dipasang secara metagenomik (MAG) atau genom diperkuatkan tunggal (SAGs), masing-masing membuka peluang penting untuk kajian taksosentrik mikrobiom (iaitu, komuniti mikrob dan mikrobiom).membuka jalan baru.bahan genetik sendiri dalam persekitaran tertentu) 10,11,12.Sesungguhnya, kajian baru-baru ini telah meluaskan perwakilan filogenetik kepelbagaian mikrob di Earth1, 13 dan telah mendedahkan banyak kepelbagaian fungsi dalam komuniti mikrob individu yang tidak pernah diliputi oleh jujukan genom rujukan mikroorganisma berbudaya (REFs)14.Keupayaan untuk meletakkan kepelbagaian fungsi yang belum ditemui dalam konteks genom perumah (iaitu, resolusi genom) adalah penting untuk meramalkan garisan mikrob yang belum dicirikan yang mungkin mengekod produk semula jadi baharu15,16 atau untuk mengesan sebatian tersebut kembali kepada pengeluar asalnya17.Sebagai contoh, gabungan pendekatan analisis genomik metagenomik dan sel tunggal telah membawa kepada pengenalpastian Candidatus Entotheonella, sekumpulan bakteria yang berkaitan dengan span yang kaya dengan metabolik, sebagai pengeluar pelbagai potensi dadah18.Walau bagaimanapun, walaupun percubaan baru-baru ini pada penerokaan genomik komuniti mikrob yang pelbagai,16,19 lebih daripada dua pertiga daripada data metagenomik global untuk lautan ekosistem terbesar di Bumi16,20 masih hilang.Oleh itu, secara amnya, potensi biosintetik mikrobiom marin dan potensinya sebagai repositori produk enzimatik dan semula jadi novel masih kurang dikaji.
Untuk meneroka potensi biosintetik mikrobiom marin pada skala global, kami mula-mula mengumpulkan genom mikrob marin yang diperoleh menggunakan kaedah yang bergantung kepada budaya dan bukan kultur untuk mencipta pangkalan data filogenetik dan fungsi gen yang luas.Pemeriksaan pangkalan data ini mendedahkan pelbagai jenis kluster gen biosintetik (BGC), yang kebanyakannya tergolong dalam keluarga kluster gen (GCF) yang belum dicirikan.Di samping itu, kami mengenal pasti keluarga bakteria yang tidak diketahui yang mempamerkan kepelbagaian BGC yang diketahui paling tinggi di lautan terbuka setakat ini.Kami memilih dua laluan sintesis ribosom dan peptida (RiPP) yang diubah suai selepas translasi untuk pengesahan eksperimen berdasarkan perbezaan genetik mereka daripada laluan yang diketahui sekarang.Pencirian fungsi laluan ini telah mendedahkan contoh enzimologi yang tidak dijangka serta sebatian luar biasa dari segi struktur dengan aktiviti perencatan protease.
Pada mulanya, kami menyasarkan untuk mencipta sumber data global untuk analisis genom, memfokuskan pada komponen bakteria dan arkeologinya.Untuk tujuan ini, kami mengumpulkan data metagenomik dan 1038 sampel air laut daripada 215 tapak pensampelan yang diedarkan secara global (julat latitud = 141.6°) dan beberapa lapisan dalam (dari 1 hingga 5600 m secara mendalam, meliputi zon pelagik, mesopelagik dan abyssal).Latar belakang21,22,23 (Rajah 1a, data lanjutan, Rajah 1a dan Jadual Tambahan 1).Di samping menyediakan liputan geografi yang luas, sampel yang ditapis terpilih ini membolehkan kami membandingkan pelbagai komponen mikrobiom marin, termasuk kaya virus (<0.2 µm), kaya prokariotik (0.2–3 µm), kaya zarah (0.8 µm). ).–20 µm) dan koloni habis virus (>0.2 µm).
a, Sebanyak 1038 genom (metagenomik) komuniti mikrob marin yang tersedia secara terbuka dikumpul dari 215 lokasi yang diedarkan secara global (62°S hingga 79°U dan 179°W hingga 179°E.).Jubin peta © Esri.Sumber: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ dan Esri.b, metagenom ini digunakan untuk membina semula MAG (kaedah dan maklumat tambahan), yang berbeza dalam kuantiti dan kualiti (kaedah) dalam dataset (ditandakan dalam warna).MAG yang dibina semula telah ditambah dengan genom (luaran) yang tersedia secara umum, termasuk MAG26, SAG27 dan REF buatan tangan.27 Susun OMD.c, berbanding laporan sebelumnya hanya berdasarkan SAG (GORG)20 atau MAG (GEM)16, OMD meningkatkan pencirian genomik komuniti mikrob marin (kadar pemetaan bacaan metagenomik; kaedah) sebanyak dua hingga tiga kali dengan perwakilan yang lebih konsisten secara mendalam dan latitud..<0.2, n=151, 0.2-0.8, n=67, 0.2-3, n=180, 0.8-20, n=30, >0.2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, pengelompokan OMD ke dalam tahap kelompok spesies (95% min identiti nukleotida) mengenal pasti sejumlah kira-kira 8300 spesies, lebih separuh daripadanya belum pernah dicirikan mengikut anotasi taksonomi menggunakan GTDB (versi 89) e, pengelasan spesies mengikut jenis genom menunjukkan bahawa MAG, SAG dan REF saling melengkapi dengan baik dalam mencerminkan kepelbagaian filogenetik mikrobiom marin.Khususnya, 55%, 26% dan 11% daripada spesies adalah khusus untuk MAG, SAG dan REF, masing-masing.BATS, Siri Masa Atlantik Bermuda;PERMATA, genom mikrobiom Bumi;GORG, genom rujukan lautan global;HOT, siri masa Lautan Hawaii.
Menggunakan set data ini, kami membina semula sejumlah 26,293 MAG, kebanyakannya bakteria dan arkeologi (Rajah 1b dan data berkembang, Rajah 1b).Kami mencipta MAG ini daripada perhimpunan daripada sampel metagenomik yang berasingan dan bukannya terkumpul untuk mengelakkan keruntuhan variasi jujukan semula jadi antara sampel dari lokasi atau titik masa (kaedah) yang berbeza.Di samping itu, kami mengumpulkan serpihan genomik berdasarkan korelasi kelaziman mereka merentasi sejumlah besar sampel (dari 58 hingga 610 sampel, bergantung pada tinjauan; kaedah).Kami mendapati bahawa ini adalah langkah yang memakan masa tetapi penting24 yang telah dilangkau dalam beberapa kerja pembinaan semula MAG16, 19, 25 berskala besar dan meningkatkan kuantiti (purata 2.7 kali ganda) dan kualiti (+20% secara purata) dengan ketara. genom.dibina semula daripada metagenom marin yang dikaji di sini (data lanjutan, Rajah 2a dan maklumat tambahan).Secara keseluruhan, usaha ini menghasilkan peningkatan 4.5 kali ganda dalam MAG mikrob marin (6 kali ganda jika hanya MAG berkualiti tinggi dipertimbangkan) berbanding dengan sumber MAG paling komprehensif yang tersedia hari ini16 (Kaedah).Set MAG yang baru dicipta ini kemudiannya digabungkan dengan 830 MAG26 yang dipilih sendiri, 5969 SAG27 dan 1707 REF.Dua puluh tujuh spesies bakteria marin dan archaea membentuk koleksi gabungan 34,799 genom (Rajah 1b).
Kami kemudian menilai sumber yang baru dicipta untuk meningkatkan keupayaannya untuk mewakili komuniti mikrob marin dan menilai kesan penyepaduan jenis genom yang berbeza.Secara purata, kami mendapati bahawa ia meliputi kira-kira 40-60% data metagenomik marin (Rajah 1c), dua hingga tiga kali ganda liputan laporan MAG sahaja sebelumnya dalam kedua-dua kedalaman dan latitud Lebih bersiri 16 atau SAG20.Di samping itu, untuk mengukur kepelbagaian taksonomi secara sistematik dalam koleksi yang telah ditetapkan, kami menganotasi semua genom menggunakan kit alat (kaedah) Pangkalan Data Taksonomi Genom (GTDB) dan menggunakan purata identiti nukleotida seluruh genom sebanyak 95%.28 untuk mengenal pasti 8,304 kelompok spesies (spesies).Dua pertiga daripada spesies ini (termasuk klad baharu) tidak pernah muncul dalam GTDB sebelum ini, di mana 2790 daripadanya ditemui menggunakan MAG yang dibina semula dalam kajian ini (Rajah 1d).Di samping itu, kami mendapati bahawa pelbagai jenis genom adalah saling melengkapi: 55%, 26%, dan 11% spesies terdiri sepenuhnya daripada MAG, SAG, dan REF, masing-masing (Rajah 1e).Selain itu, MAG meliputi kesemua 49 jenis yang terdapat dalam lajur air, manakala SAG dan REF hanya mewakili 18 dan 11 daripadanya, masing-masing.Walau bagaimanapun, SAG lebih baik mewakili kepelbagaian klad yang paling biasa (data dikembangkan, Rajah 3a), seperti Pelagic Bacteriales (SAR11), dengan SAG meliputi hampir 1300 spesies dan MAG hanya 390 spesies.Terutamanya, REF jarang bertindih dengan MAG atau SAG pada peringkat spesies dan mewakili> 95% daripada kira-kira 1000 genom yang tidak ditemui dalam set metagenomik lautan terbuka yang dikaji di sini, terutamanya disebabkan oleh interaksi dengan jenis spesimen marin wakil terpencil yang lain (contohnya sedimen ) .atau sekutu hos).Untuk menjadikannya tersedia secara meluas kepada komuniti saintifik, sumber genom marin ini, yang juga termasuk serpihan yang tidak dikelaskan (cth, daripada faj yang diramalkan, pulau genomik dan serpihan genom yang tidak mempunyai data yang mencukupi untuk pembinaan semula MAG), boleh dibandingkan dengan data taksonomi. .Akses anotasi bersama-sama dengan fungsi gen dan parameter kontekstual dalam Pangkalan Data Mikrobiologi Lautan (OMD; https://microbiomics.io/ocean/).
Kami kemudiannya menerokai kekayaan dan kebaharuan potensi biosintetik dalam mikrobiom lautan terbuka.Untuk tujuan ini, kami mula-mula menggunakan antiSMASH untuk semua MAG, SAG, dan REF yang terdapat dalam 1038 metagenom marin (kaedah) untuk meramalkan sejumlah 39,055 BGC.Kami kemudian mengumpulkannya kepada 6907 GCF yang tidak berlebihan dan 151 populasi kluster gen (GCC; Jadual Tambahan 2 dan kaedah) untuk mengambil kira redundansi yang wujud (iaitu, BGC yang sama boleh dikodkan dalam berbilang genom) dan data metagenomik Pecahan BGC pekat .BGC yang tidak lengkap tidak meningkat dengan ketara, jika ada (Maklumat Tambahan), bilangan GCF dan GCC, masing-masing, mengandungi sekurang-kurangnya seorang ahli BGC utuh dalam 44% dan 86% kes.
Di peringkat GCC, kami menemui pelbagai jenis RiPP yang diramalkan dan produk semula jadi lain (Rajah 2a).Antaranya, sebagai contoh, arilpoliena, karotenoid, ektoin, dan siderofor tergolong dalam GCC dengan taburan filogenetik yang luas dan kelimpahan metagenom lautan yang tinggi, yang mungkin menunjukkan penyesuaian luas mikroorganisma kepada persekitaran marin, termasuk penentangan terhadap spesies oksigen reaktif, tekanan oksidatif dan osmotik..atau penyerapan zat besi (maklumat lanjut).Kepelbagaian fungsi ini berbeza dengan analisis terbaru kira-kira 1.2 juta BGC di antara kira-kira 190,000 genom yang disimpan dalam pangkalan data NCBI RefSeq (BiG-FAM/RefSeq, selepas ini dirujuk sebagai RefSeq)29, yang menunjukkan bahawa peptida Synthetase bukan ribosom (NRPS) dan sintase poliketide (PKS) BGC (Maklumat Tambahan).Kami juga mendapati 44 (29%) GCC hanya berkaitan jauh dengan mana-mana RefSeq BGC (\(\bar{d}\)RefSeq > 0.4; Rajah 2a dan kaedah) dan 53 (35%) GCC sahaja dalam MAG , menonjolkan potensi untuk mengesan bahan kimia yang tidak diterangkan sebelum ini dalam OMD.Memandangkan setiap GCC ini berkemungkinan mewakili fungsi biosintetik yang sangat pelbagai, kami selanjutnya menganalisis data di peringkat GCF dalam usaha untuk menyediakan kumpulan BGC yang lebih terperinci yang diramalkan untuk mengekodkan produk semula jadi yang serupa29.Sebanyak 3861 (56%) GCF yang dikenal pasti tidak bertindih dengan RefSeq, dan> 97% daripada GCF tidak terdapat dalam MIBiG, salah satu pangkalan data terbesar BGC yang disahkan secara eksperimen (Rajah 2b).Walaupun tidak menghairankan untuk menemui banyak laluan novel yang berpotensi dalam tetapan yang tidak diwakili dengan baik oleh genom rujukan, kaedah kami untuk menyahreplikasi BGC ke dalam GCF sebelum penandaarasan berbeza daripada laporan 16 sebelumnya dan membolehkan kami memberikan penilaian kebaharuan yang tidak berat sebelah.Kebanyakan kepelbagaian baharu (3012 GCF atau 78%) sepadan dengan ramalan terpenes, RiPP atau produk semula jadi lain, dan kebanyakan (1815 GCF atau 47%) dikodkan dalam jenis yang tidak diketahui kerana potensi biosintetiknya.Tidak seperti kelompok PKS dan NRPS, BGC padat ini kurang berkemungkinan berpecah semasa pemasangan metagenomik 31 dan membenarkan lebih banyak pencirian fungsian intensif masa dan sumber bagi produk mereka.
Sebanyak 39,055 BGC telah dikumpulkan kepada 6,907 GCF dan 151 GCC.a, perwakilan data (luaran dalaman).Pengelompokan hierarki jarak BGC berdasarkan GCC, 53 daripadanya ditetapkan oleh MAG sahaja.GCC mengandungi BGC daripada takson yang berbeza (frekuensi gerbang ln-transformed) dan kelas BGC yang berbeza (saiz bulatan sepadan dengan kekerapannya).Bagi setiap GCC, lapisan luar mewakili bilangan BGC, prevalens (peratusan sampel) dan jarak (jarak kosinus BGC minimum (min(dMIBiG))) dari BiG-FAM ke BGC.GCC dengan BGC yang berkait rapat dengan BGC yang disahkan secara eksperimen (MIBiG) diserlahkan dengan anak panah.b Membandingkan GCF dengan ramalan (BiG-FAM) dan BGC yang disahkan secara eksperimen (MIBiG), 3861 GCF baharu (d–>0.2) ditemui.Kebanyakan (78%) daripada kod ini untuk RiPP, terpenes dan produk semula jadi yang lain.c, semua genom dalam OMD yang terdapat dalam 1038 metagenom marin diletakkan di dalam pokok asas GTDB untuk menunjukkan liputan filogenetik OMD.Klad tanpa sebarang genom dalam OMD ditunjukkan dalam warna kelabu.Bilangan BGC sepadan dengan bilangan terbesar BGC yang diramalkan setiap genom dalam klad tertentu.Untuk kejelasan, 15% nod terakhir telah runtuh.Anak panah menunjukkan klad yang kaya dengan BGC (>15 BGC), kecuali Mycobacterium, Gordonia (kedua selepas Rhodococcus) dan Crocosphaera (kedua selepas Synechococcus).d, Tidak diketahui c.Eremiobacterota menunjukkan kepelbagaian biosintetik tertinggi (indeks Shannon berdasarkan jenis produk semula jadi).Setiap band mewakili genom dengan BGC terbanyak dalam spesies.T1PKS, PKS jenis I, T2/3PKS, PKS jenis II dan jenis III.
Sebagai tambahan kepada kekayaan dan kebaharuan, kami meneroka struktur biogeografi potensi biosintetik mikrobiom marin.Pengelompokan sampel mengikut purata pengedaran nombor salinan GCF metagenomik (Kaedah) menunjukkan bahawa komuniti latitud rendah, permukaan, kaya prokariotik dan miskin virus, kebanyakannya dari permukaan atau perairan yang lebih dalam, kaya dengan terpenes RiPP dan BGC.Sebaliknya, komuniti kutub, laut dalam, virus dan kaya zarah dikaitkan dengan kelimpahan NRPS dan PKS BGC yang lebih tinggi (data dikembangkan, Rajah 4 dan maklumat tambahan).Akhirnya, kami mendapati bahawa komuniti tropika dan pelagik yang dikaji dengan baik adalah sumber terpene baharu yang paling menjanjikan (Rajah Data Tambahan).Potensi tertinggi untuk PKS, RiPP dan produk semula jadi lain (Rajah 5a dengan data yang dikembangkan).
Untuk melengkapkan kajian kami tentang potensi biosintetik mikrobiom marin, kami menyasarkan untuk memetakan taburan filogenetik mereka dan mengenal pasti klad diperkaya BGC baharu.Untuk tujuan ini, kami meletakkan genom mikrob marin ke dalam pokok filogenetik bakteria dan archaeal GTDB13 yang dinormalkan dan menindih laluan biosintetik yang diduga yang dikodkan (Rajah 2c).Kami telah dengan mudah mengesan beberapa klad diperkaya BGC (diwakili oleh lebih 15 BGC) dalam sampel air laut (kaedah) yang terkenal dengan potensi biosintetiknya, seperti bakteria cyanobacteria (Synechococcus) dan Proteus, seperti Tistrella32,33, atau baru-baru ini menarik perhatian kerana mereka produk semulajadi.seperti Myxococcota (Sandaracinaceae), Rhodococcus dan Planctomycetota34,35,36.Menariknya, kami menemui beberapa keturunan yang belum diterokai sebelum ini dalam klad ini.Sebagai contoh, spesies yang mempunyai potensi biosintetik terkaya dalam phyla Planctomycetota dan Myxococcota tergolong dalam pesanan calon dan genera yang tidak dicirikan (Jadual Tambahan 3).Secara keseluruhan, ini menunjukkan bahawa OMD menyediakan akses kepada maklumat filogenetik yang tidak diketahui sebelum ini, termasuk mikroorganisma, yang mungkin mewakili sasaran baharu untuk penemuan enzim dan produk semula jadi.
Seterusnya, kami mencirikan klad diperkaya BGC dengan bukan sahaja mengira bilangan maksimum BGC yang dikodkan oleh ahlinya, tetapi juga dengan menilai kepelbagaian BGC ini, yang menerangkan kekerapan pelbagai jenis produk calon semula jadi (Rajah 2c dan kaedah). )..Kami mendapati bahawa spesies yang paling pelbagai secara biosintetik diwakili oleh MAG bakteria yang direka khas dalam kajian ini.Bakteria ini tergolong dalam filum Candidatus Eremiobacterota yang tidak ditanam, yang sebahagian besarnya masih belum diterokai selain daripada beberapa kajian genomik37,38.Perlu diperhatikan bahawa "ca.Genus Eremiobacterota hanya dianalisis dalam persekitaran darat39 dan tidak diketahui termasuk mana-mana ahli yang diperkayakan dalam BGC.Di sini kami telah membina semula lapan MAG daripada spesies yang sama (identiti nukleotida > 99%) 23. Oleh itu, kami mencadangkan nama spesies "Candidatus Eudoremicrobium malaspinii", dinamakan sempena nereid (nimfa laut), hadiah yang indah dalam mitologi dan ekspedisi Yunani.'Ka.Menurut anotasi filogenetik 13, E. malaspinii tidak mempunyai saudara yang diketahui sebelum ini di bawah tahap jujukan dan oleh itu tergolong dalam keluarga bakteria baru yang kami cadangkan "Ca.E. malaspinii” sebagai spesies jenis dan “Ca.Eudormicrobiaceae” sebagai nama rasmi (Maklumat Tambahan).Pembinaan semula metagenomik ringkas 'Ca.Projek genom E. malaspinii telah disahkan oleh input yang sangat rendah, penjujukan metagenomik membaca panjang dan pemasangan sasaran sampel tunggal (Kaedah) sebagai kromosom linear tunggal 9.63 Mb dengan pertindihan 75 kb.sebagai satu-satunya kekaburan yang tinggal.
Untuk mewujudkan konteks filogenetik spesies ini, kami mencari 40 spesies yang berkait rapat dalam sampel metagenomik yang diperkaya eukariotik tambahan dari ekspedisi Lautan Tara melalui pembinaan semula genom yang disasarkan.Secara ringkas, kami telah menghubungkan bacaan metagenomik kepada serpihan genom yang dikaitkan dengan "Ca.E. malaspinii” dan membuat hipotesis bahawa kadar pengambilan yang meningkat dalam sampel ini menunjukkan kehadiran saudara-mara lain (kaedah).Hasilnya, kami menemui 10 MAG, gabungan 19 MAG yang mewakili lima spesies dalam tiga genera dalam keluarga yang baru ditakrifkan (iaitu "Ca. Eudormicrobiaceae").Selepas pemeriksaan manual dan kawalan kualiti (data yang dikembangkan, Rajah 6 dan maklumat tambahan), kami mendapati bahawa "Ca.Spesies Eudormicrobiaceae membentangkan genom yang lebih besar (8 Mb) dan potensi biosintetik yang lebih kaya (14 hingga 22 BGC setiap spesies) daripada ahli "Ca" yang lain.Clade Eremiobacterota (sehingga 7 BGC) (Rajah 3a–c).
a, Kedudukan filogenetik lima 'Ca.Spesies Eudormicrobiaceae menunjukkan kekayaan BGC khusus untuk garis marin yang dikenal pasti dalam kajian ini.Pokok filogenetik merangkumi semua 'Ca.MAG Eremiobacterota dan ahli filum lain (nombor genom dalam kurungan) yang disediakan dalam GTDB (versi 89) digunakan untuk latar belakang evolusi (Kaedah).Lapisan paling luar mewakili klasifikasi pada peringkat keluarga (“Ca. Eudormicrobiaceae” dan “Ca. Xenobiaceae”) dan pada peringkat kelas (“Ca. Eremiobacteria”).Lima spesies yang diterangkan dalam kajian ini diwakili oleh kod alfanumerik dan nama binomial yang dicadangkan (Maklumat Tambahan).b, ok.Spesies Eudormicrobiaceae berkongsi tujuh nukleus BGC biasa.Ketiadaan BGC dalam klad A2 adalah disebabkan oleh ketidaklengkapan MAG wakil (Jadual Tambahan 3).BGC adalah khusus untuk "Ca.Amphithomicrobium" dan "Ca.Amphithomicrobium” (klade A dan B) tidak ditunjukkan.c, Semua BGC dikodkan sebagai "Ca.Eudoremicrobium taraoceanii didapati dinyatakan dalam 623 metatranskriptom yang diambil dari lautan Tara.Bulatan pepejal menunjukkan transkripsi aktif.Bulatan jingga menandakan perubahan lipatan diubah log2 di bawah dan di atas kadar ekspresi gen pengemasan (kaedah).d, keluk kelimpahan relatif (kaedah) yang menunjukkan 'Ca.Spesies Eudormicrobiaceae tersebar luas di kebanyakan lembangan lautan dan di seluruh lajur air (dari permukaan hingga kedalaman sekurang-kurangnya 4000 m).Berdasarkan anggaran ini, kami mendapati bahawa 'Ca.E. malaspinii' menyumbang sehingga 6% daripada sel prokariotik dalam komuniti berkaitan bijirin pelagik laut dalam.Kami menganggap spesies hadir di tapak jika ia ditemui dalam mana-mana pecahan saiz lapisan kedalaman tertentu.IO – Lautan Hindi, NAO – Atlantik Utara, NPO – Pasifik Utara, RS – Laut Merah, SAO – Atlantik Selatan, SO – Lautan Selatan, SPO – Pasifik Selatan.
Mengkaji kelimpahan dan taburan Ca.Eudormicrobiaceae, yang, seperti yang kami dapati, mendominasi kebanyakan lembangan lautan, serta dalam keseluruhan lajur air (Rajah 3d).Di peringkat tempatan, mereka membentuk 6% daripada komuniti mikrob marin, menjadikannya bahagian penting dalam mikrobiom marin global.Di samping itu, kami mendapati kandungan relatif Ca.Spesies Eudormicrobiaceae dan tahap ekspresi BGC mereka adalah tertinggi dalam pecahan diperkaya eukariotik (Rajah 3c dan data lanjutan, Rajah 7), menunjukkan kemungkinan interaksi dengan bahan zarahan, termasuk plankton.Pemerhatian ini mempunyai beberapa persamaan dengan 'Ca.Eudoremicrobium BGCs yang menghasilkan produk semulajadi sitotoksik melalui laluan yang diketahui mungkin menunjukkan tingkah laku pemangsa (Maklumat Tambahan dan Data Dikembangkan, Rajah 8), sama dengan pemangsa lain yang secara khusus menghasilkan metabolit seperti Myxococcus41.Penemuan Ca.Eudormicrobiaceae dalam sampel yang kurang tersedia (lautan dalam) atau eukariotik dan bukannya prokariotik mungkin menjelaskan mengapa bakteria ini dan kepelbagaian BGC yang tidak dijangka mereka masih tidak jelas dalam konteks penyelidikan makanan semula jadi.
Akhirnya, kami berusaha untuk mengesahkan secara eksperimen janji kerja berasaskan mikrobiom kami dalam menemui laluan baharu, enzim dan produk semula jadi.Di antara kelas BGC yang berbeza, laluan RiPP diketahui mengekodkan kepelbagaian kimia dan fungsi yang kaya disebabkan oleh pelbagai pengubahsuaian pasca penterjemahan peptida teras oleh enzim matang42.Jadi kami memilih dua 'Ca.Eudoremicrobium' RiPP BGCs (Rajah 3b dan 4a-e) adalah berdasarkan sama seperti mana-mana BGC yang diketahui (\(\bar{d}\)MIBiG dan \(\bar{d}\)RefSeq di atas 0.2) .
a–c, Ungkapan heterolog in vitro dan ujian enzim in vitro novel (\(\ bar{d}\)RefSeq = 0.29) gugusan biosintesis RiPP khusus untuk spesies Ca laut dalam.E. malaspinii' membawa kepada penghasilan produk difosforilasi.c, pengubahsuaian yang dikenal pasti menggunakan resolusi tinggi (HR) MS/MS (pemecahan yang ditunjukkan oleh ion b dan y dalam struktur kimia) dan NMR (data dikembangkan, Rajah 9).d, peptida terfosforilasi ini mempamerkan perencatan mikromolar rendah elastase neutrofil mamalia, yang tidak terdapat dalam peptida kawalan dan peptida penyahhidratan (dehidrasi akibat penyingkiran kimia).Eksperimen diulang tiga kali dengan keputusan yang sama.Sebagai contoh, ungkapan heterolog novel kedua \(\bar{d}\)RefSeq = 0.33) kelompok biosintesis protein menjelaskan fungsi empat enzim matang yang mengubah suai 46 peptida teras asid amino.Sisa diwarnakan mengikut tapak pengubahsuaian yang diramalkan oleh HR-MS/MS, pelabelan isotop, dan analisis NMR (Maklumat Tambahan).Warna putus-putus menunjukkan bahawa pengubahsuaian berlaku pada salah satu daripada dua residu.Angka tersebut ialah kompilasi pelbagai binaan heterolog untuk menunjukkan aktiviti semua enzim matang pada nukleus yang sama.h, Ilustrasi data NMR untuk tulang belakang amida N-metilasi.Keputusan penuh ditunjukkan dalam rajah.10 dengan data lanjutan.i, Kedudukan filogenetik enzim kelompok protein FkbM yang matang di kalangan semua domain FkbM yang terdapat dalam pangkalan data MIBiG 2.0 mendedahkan enzim keluarga ini dengan aktiviti N-methyltransferase (Maklumat Tambahan).Gambar rajah skematik BGC (a, e), struktur peptida prekursor (b, f), dan struktur kimia yang disangka-sangka produk semula jadi (c, g) ditunjukkan.
Laluan RiPP pertama (\(\bar{d}\)MIBiG = 0.41, \(\bar{d}\)RefSeq = 0.29) didapati hanya dalam spesies laut dalam "Ca.E. malaspinii” dan kod untuk Peptida- prekursor (Rajah 4a, b).Dalam enzim matang ini, kami telah mengenal pasti satu domain berfungsi homolog dengan domain dehidrasi sintase lantipeptida yang biasanya memangkinkan fosforilasi dan penyingkiran seterusnya 43 (Maklumat Tambahan).Oleh itu, kami meramalkan bahawa pengubahsuaian peptida prekursor melibatkan dehidrasi dua langkah sedemikian.Walau bagaimanapun, menggunakan spektrometri jisim tandem (MS/MS) dan spektroskopi resonans magnetik nuklear (NMR), kami mengenal pasti peptida linear polifosforilasi (Rajah 4c).Walaupun tidak dijangka, kami menjumpai beberapa baris bukti untuk menyokong ia menjadi produk akhir: dua hos heterolog yang berbeza dan tiada dehidrasi dalam ujian in vitro, pengenalpastian sisa utama yang bermutasi dalam tapak dehidrasi pemangkin enzim matang.semuanya dibina semula oleh "Ca".Genom E. malaspinii (data berkembang, Rajah 9 dan maklumat tambahan) dan, akhirnya, aktiviti biologi produk terfosforilasi, tetapi bukan bentuk dehidrasi yang disintesis secara kimia (Rajah 4d).Malah, kami mendapati bahawa ia mempamerkan aktiviti perencatan protease mikromolar yang rendah terhadap elastase neutrofil, setanding dengan produk semula jadi lain yang berkaitan dalam julat kepekatan (IC50 = 14.3 μM) 44, walaupun pada hakikatnya peranan ekologi masih perlu dijelaskan.Berdasarkan keputusan ini, kami mencadangkan untuk menamakan laluan "phospheptin".
Kes kedua ialah laluan RiPP kompleks khusus untuk 'Ca.Genus Eudoremicrobium (\(\bar{d}\)MIBiG = 0.46, \(\bar{d}\)RefSeq = 0.33) telah diramalkan untuk mengekod produk protein semulajadi (Rajah 4e).Laluan ini mempunyai kepentingan bioteknologi tertentu kerana ketumpatan yang dijangkakan dan pelbagai pengubahsuaian kimia luar biasa yang ditubuhkan oleh enzim yang dikodkan oleh BGCs45 yang agak pendek.Kami mendapati bahawa protein ini berbeza daripada protein yang dicirikan sebelum ini kerana ia tidak mempunyai kedua-dua motif NX5N utama polyceramides dan gelung lantionin landornamides 46 .Untuk mengatasi batasan corak ekspresi heterolog biasa, kami menggunakannya bersama-sama dengan sistem Microvirgula aerodenitrificans tersuai untuk mencirikan empat enzim laluan matang (kaedah).Menggunakan gabungan MS/MS, pelabelan isotop dan NMR, kami mengesan enzim matang ini dalam teras asid 46-amino peptida (Rajah 4f,g, data yang diperluaskan, Rajah 10-12 dan maklumat tambahan).Di antara enzim matang, kami mencirikan penampilan pertama ahli keluarga FkbM O-methyltransferase 47 dalam laluan RiPP dan secara tidak dijangka mendapati bahawa enzim matang ini memperkenalkan N-metilasi tulang belakang (Rajah 4h, i dan maklumat tambahan).Walaupun pengubahsuaian ini diketahui dalam produk NRP48 semula jadi, enzimatik N-metilasi ikatan amida ialah tindak balas yang kompleks tetapi penting dari segi bioteknologi49 yang setakat ini menarik minat keluarga borosin RiPP.Kekhususan 50,51.Pengenalpastian aktiviti ini dalam keluarga enzim dan RiPP lain mungkin membuka aplikasi baharu dan mengembangkan kepelbagaian fungsi protein 52 dan kepelbagaian kimianya.Berdasarkan pengubahsuaian yang dikenal pasti dan panjang luar biasa struktur produk yang dicadangkan, kami mencadangkan nama laluan "pythonamide".
Penemuan enzimologi yang tidak dijangka dalam keluarga enzim berciri fungsi menggambarkan janji genomik alam sekitar untuk penemuan baharu, dan juga menggambarkan kapasiti terhad untuk inferens berfungsi berdasarkan homologi jujukan sahaja.Oleh itu, bersama-sama dengan laporan RiPP polifosforilasi bioaktif bukan kanonik, keputusan kami menunjukkan nilai intensif sumber tetapi kritikal kepada usaha biologi sintetik untuk mendedahkan sepenuhnya kekayaan fungsian, kepelbagaian dan struktur luar biasa sebatian biokimia.
Di sini kami menunjukkan pelbagai potensi biosintetik yang dikodkan oleh mikrob dan konteks genomnya dalam mikrobiom marin global, memudahkan penyelidikan masa depan dengan menyediakan sumber yang terhasil kepada komuniti saintifik (https://microbiomics.io/ocean/).Kami mendapati bahawa kebanyakan kebaharuan filogenetik dan fungsinya hanya boleh diperolehi dengan membina semula MAG dan SAG, terutamanya dalam komuniti mikrob yang kurang digunakan yang boleh membimbing usaha bioprospek masa depan.Walaupun kita akan fokus di sini pada 'Ca.Eudormicrobiaceae" sebagai keturunan terutamanya "berbakat" secara biosintetik, kebanyakan BGC yang diramalkan dalam mikrobiota yang belum ditemui berkemungkinan menyandikan enzim yang tidak diterangkan sebelum ini yang menghasilkan sebatian dengan tindakan penting alam sekitar dan/atau bioteknologi.
Dataset metagenomik daripada kajian oseanografi dan siri masa utama dengan kedalaman penjujukan yang mencukupi dimasukkan untuk memaksimumkan liputan komuniti mikrob marin global di lembangan lautan, lapisan dalam dan dari semasa ke semasa.Dataset ini (Jadual Tambahan 1 dan Rajah 1) termasuk metagenomik daripada sampel yang dikumpul di lautan Tara (diperkaya virus, n = 190; diperkaya prokariotik, n = 180) 12, 22 dan ekspedisi BioGEOTRACES ( n = 480).Siri Masa Lautan Hawaii (HOT, n = 68), Siri Masa Bermuda-Atlantik (BATS, n = 62)21 dan Ekspedisi Malaspina (n = 58)23.Bacaan jujukan daripada semua serpihan metagenomik telah ditapis untuk kualiti menggunakan BBMap (v.38.71) dengan mengalih keluar penyesuai jujukan daripada bacaan, mengalih keluar bacaan yang dipetakan kepada jujukan kawalan kualiti (genom PhiX) dan menggunakan trimq=14, maq=20 membuang kualiti bacaan yang lemah, maxns = 0 dan minlength = 45. Analisis seterusnya dijalankan atau digabungkan dengan bacaan QC jika dinyatakan (bbmerge.sh minoverlap=16).Bacaan QC telah dinormalkan (sasaran bbnorm.sh = 40, minddepth = 0) sebelum membina menggunakan metaSPAdes (v.3.11.1 atau v.3.12 jika perlu)53.Contigs scaffold yang terhasil (selepas ini dirujuk sebagai scaffolds) akhirnya ditapis mengikut panjang (≥1 kb).
1038 sampel metagenomik dibahagikan kepada kumpulan, dan bagi setiap kumpulan sampel, bacaan kawalan kualiti metagenomik semua sampel dipadankan dengan kurungan setiap sampel secara berasingan, menghasilkan bilangan kumpulan kurungan berpasangan berikut: Virus Laut Tara – Diperkaya (190×190 ), Prokariot Diperkaya (180×180), BioGEOTRACES, HOT dan BATS (610×610) dan Malaspina (58×58).Pemetaan dilakukan menggunakan Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54 yang membolehkan bacaan dipadankan dengan tapak sekunder (menggunakan bendera -a).Penjajaran telah ditapis untuk sekurang-kurangnya 45 tapak panjang, mempunyai ≥97% identiti, dan rentang ≥80% bacaan.Fail BAM yang terhasil telah diproses menggunakan skrip jgi_summarize_bam_contig_depths untuk MetaBAT2 (v.2.12.1)55 untuk menyediakan liputan intra dan antara sampel untuk setiap kumpulan.Akhirnya, kurungan dikumpulkan untuk meningkatkan kepekaan dengan menjalankan MetaBAT2 secara individu pada semua sampel dengan –minContig 2000 dan –maxEdges 500. Kami menggunakan MetaBAT2 dan bukannya peninju ensemble kerana ia telah ditunjukkan dalam ujian bebas sebagai petinju tunggal yang paling berkesan.dan 10 hingga 50 kali lebih pantas daripada peninju lain yang biasa digunakan57.Untuk menguji kesan korelasi kelimpahan, subsampel metagenomik yang dipilih secara rawak (10 untuk setiap dua set data Lautan Tara, 10 untuk BioGEOTRACES, 5 untuk setiap siri masa dan 5 untuk Malaspina) menggunakan sampel tambahan sahaja.Sampel dalaman dikumpulkan untuk mendapatkan maklumat liputan.(Maklumat tambahan).
Genom tambahan (luaran) dimasukkan dalam analisis seterusnya, iaitu 830 MAG yang dipilih secara manual daripada subset dataset Tara Oceans26, 5287 SAG daripada dataset GORG20 dan data daripada pangkalan data MAR (MarDB v. 4) daripada 1707 REF terpencil dan 682 SAG) 27. Untuk set data MarDB, genom dipilih berdasarkan metadata yang tersedia jika jenis sampel sepadan dengan ungkapan biasa berikut: '[S|s]ingle.?[C|c]ell|[C|c]kultur| [I|i] diasingkan'.
Kualiti setiap bekas metagenomik dan genom luaran dinilai menggunakan CheckM (v.1.0.13) dan Aliran Kerja Keturunan Anvi'o (v.5.5.0)58,59.Jika CheckM atau Anvi'o melaporkan ≥50% kesempurnaan/kesempurnaan dan ≤10% pencemaran/lebihan, maka simpan sel metagenomik dan genom luaran untuk analisis kemudian.Markah ini kemudiannya digabungkan menjadi min kesempurnaan (mcpl) dan min pencemaran (mctn) untuk mengklasifikasikan kualiti genom mengikut kriteria komuniti60 seperti berikut: kualiti tinggi: mcpl ≥ 90% dan mctn ≤ 5%;kualiti yang baik: mcpl ≥ 70%, mctn ≤ 10%, kualiti sederhana: mcpl ≥ 50% dan mctn ≤ 10%, kualiti saksama: mcpl ≤ 90% atau mctn ≥ 10%.Genom yang ditapis kemudiannya dikaitkan dengan skor kualiti (Q dan Q') seperti berikut: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (variability strain)/100 + 0.5 x log[N50] .(dilaksanakan dalam dRep61).
Untuk membolehkan analisis perbandingan antara sumber data dan jenis genom yang berbeza (MAG, SAG dan REF), 34,799 genom telah dinyahrujuk berdasarkan identiti purata nukleotida (ANI) seluruh genom menggunakan dRep (v.2.5.4).Berulang)61 ​​dengan 95% ambang ANI28,62 (-comp 0 -con 1000 -sa 0.95 -nc 0.2) dan gen penanda salinan tunggal menggunakan SpecI63 yang menyediakan pengelompokan genom pada peringkat spesies.Genom perwakilan dipilih untuk setiap kluster dRep mengikut skor kualiti maksimum (Q') yang ditakrifkan di atas, yang dianggap mewakili spesies.
Untuk menilai kelajuan pemetaan, BWA (v.0.7.17-r1188, -a) digunakan untuk memetakan semua 1038 set bacaan metagenomik dengan 34,799 genom yang terkandung dalam OMD.Bacaan terkawal kualiti dipetakan dalam mod satu hujung dan penjajaran yang terhasil ditapis untuk mengekalkan hanya penjajaran ≥45 bp panjang.dan identiti ≥95%.Nisbah paparan bagi setiap sampel ialah peratusan bacaan yang tinggal selepas penapisan dibahagikan dengan jumlah bilangan bacaan kawalan kualiti.Menggunakan pendekatan yang sama, setiap satu daripada 1038 metagenom dikurangkan kepada 5 juta sisipan (data dikembangkan, Rajah 1c) dan dipadankan dengan GORG SAG dalam OMD dan dalam semua GEM16.Jumlah MAG yang diperoleh daripada air laut dalam katalog GEM16 ditentukan oleh pertanyaan kata kunci sumber metagenomik, memilih sampel air laut (cth, berbanding dengan sedimen marin).Khususnya, kami memilih "akuatik" sebagai "kategori_ekosistem", "marin" sebagai "jenis_ekosistem", dan menapis "habitat" sebagai "lautan dalam", "marin", "lautan maritim", "marin pelagik", "air marin" , "Lautan", "Air Laut", "Air Laut Permukaan", "Air Laut Permukaan".Ini menghasilkan 5903 MAG (734 kualiti tinggi) yang diedarkan kepada 1823 OTU (lihat di sini).
Genom prokariotik diberi anotasi secara taksonomi menggunakan GTDB-Tk (v.1.0.2)64 dengan parameter lalai yang menyasarkan GTDB r89 versi 13. Anvi'o digunakan untuk mengenal pasti genom eukariotik berdasarkan ramalan domain dan mengingat semula ≥50% dan redundansi ≤ 10%.Anotasi taksonomi spesies ditakrifkan sebagai salah satu genom perwakilannya.Kecuali eukariota (148 MAG), setiap genom pertama kali diberi anotasi secara fungsional menggunakan prokka (v.1.14.5)65, menamakan gen lengkap, mentakrifkan parameter "archaea" atau "bakteria" mengikut keperluan, yang juga dilaporkan untuk bukan- pengekodan gen.dan kawasan CRISPR, antara ciri genomik yang lain.Anotasi gen yang diramalkan dengan mengenal pasti gen penanda salinan tunggal universal (uscMG) menggunakan fetchMG (v.1.2)66, tetapkan kumpulan ortolog dan pertanyaan menggunakan emapper (v.2.0.1)67 berdasarkan eggNOG (v.5.0)68.Pangkalan data KEGG (diterbitkan 10 Februari 2020) 69. Langkah terakhir dilakukan dengan memadankan protein dengan pangkalan data KEGG menggunakan DIAMOND (v.0.9.30)70 dengan liputan pertanyaan dan topik ≥70%.Keputusan ditapis selanjutnya mengikut NCBI Prokaryotic Genome Annotation Pipeline71 berdasarkan kadar bit ≥ 50% daripada kadar bit maksimum yang dijangkakan (pautan itu sendiri).Urutan gen juga digunakan sebagai input untuk mengenal pasti BGC dalam genom menggunakan antiSMASH (v.5.1.0)72 dengan parameter lalai dan letupan kelompok yang berbeza.Semua genom dan anotasi telah disusun ke dalam OMD bersama-sama dengan metadata kontekstual yang tersedia di web (https://microbiomics.io/ocean/).
Sama seperti kaedah yang diterangkan sebelum ini12,22 kami menggunakan CD-HIT (v.4.8.1) untuk mengelompokkan >56.6 juta gen pengekodan protein daripada genom bakteria dan arkeologi daripada OMD kepada 95% identiti dan gen yang lebih pendek (liputan 90%)73 sehingga >17.7 juta kluster gen.Urutan terpanjang dipilih sebagai gen perwakilan untuk setiap kelompok gen.1038 metagenom kemudiannya dipadankan dengan> 17.7 juta ahli kluster BWA (-a) dan fail BAM yang terhasil ditapis untuk mengekalkan hanya penjajaran dengan ≥95% peratus identiti dan ≥45 penjajaran asas.Kelimpahan gen ternormal panjang telah dikira dengan mengira sisipan pertama daripada penjajaran unik terbaik dan kemudian, untuk sisipan yang dipetakan kabur, menambah kiraan pecahan kepada gen sasaran yang sepadan berkadar dengan bilangan sisipan unik mereka.
Genom daripada OMD yang diperluaskan (dengan MAG tambahan daripada "Ca. Eudormicrobiaceae", lihat di bawah) telah ditambahkan pada pangkalan data alat analisis metagenomik mOTUs74 (v.2.5.1) untuk mencipta pangkalan data rujukan mOTU lanjutan.Hanya enam genom salinan tunggal (23,528 genom) terselamat daripada sepuluh uscMG.Pengembangan pangkalan data menghasilkan 4,494 kelompok tambahan pada peringkat spesies.1038 metagenom telah dianalisis menggunakan parameter mOTU lalai (v.2).Sebanyak 989 genom yang terkandung dalam 644 kluster mOTU (95% REF, 5% SAG dan 99.9% milik MarDB) tidak dikesan oleh profil mOTU.Ini mencerminkan pelbagai sumber tambahan pengasingan marin bagi genom MarDB (kebanyakan genom yang tidak dikesan dikaitkan dengan organisma yang diasingkan daripada sedimen, perumah marin, dsb.).Untuk terus memfokuskan pada persekitaran lautan terbuka dalam kajian ini, kami mengecualikan mereka daripada analisis hiliran melainkan ia dikesan atau dimasukkan dalam pangkalan data mOTU lanjutan yang dibuat dalam kajian ini.
Semua BGC daripada MAG, SAG dan REF dalam OMD (lihat di atas) telah digabungkan dengan BGC yang dikenal pasti dalam semua perancah metagenomik (antiSMASH v.5.0, parameter lalai) dan dicirikan menggunakan BiG-SLICE (v.1.1) (domain PFAM )75.Berdasarkan ciri ini, kami mengira semua jarak kosinus antara BGC dan mengumpulkannya (pautan min) ke dalam GCF dan GCC menggunakan ambang jarak 0.2 dan 0.8 masing-masing.Ambang ini adalah penyesuaian ambang yang digunakan sebelum ini menggunakan jarak Euclidean75 bersama-sama dengan jarak kosinus, yang mengurangkan beberapa ralat dalam strategi pengelompokan BiG-SLICE asal (Maklumat Tambahan).
BGC kemudiannya ditapis untuk mengekalkan hanya ≥5 kb yang dikodkan pada perancah untuk mengurangkan risiko pemecahan seperti yang diterangkan sebelum ini16 dan untuk mengecualikan REF dan SAG MarDB yang tidak terdapat dalam 1038 metagenom (lihat di atas).Ini mengakibatkan sejumlah 39,055 BGC dikodkan oleh genom OMD, dengan tambahan 14,106 dikenal pasti pada serpihan metagenomik (iaitu tidak digabungkan menjadi MAG).BGC "metagenomik" ini digunakan untuk menganggarkan perkadaran potensi biosintesis mikrobiom marin yang tidak ditangkap dalam pangkalan data (Maklumat Tambahan).Setiap BGC dicirikan secara fungsional mengikut jenis produk ramalan yang ditakrifkan oleh kategori produk anti-SMASH atau lebih kasar yang ditakrifkan dalam BiG-SCAPE76.Untuk mengelakkan bias pensampelan dalam kuantifikasi (komposisi taksonomi dan fungsi GCC/GCF, jarak GCF dan GCC ke pangkalan data rujukan, dan kelimpahan metagenomik GCF), dengan mengekalkan hanya BGC terpanjang bagi setiap GCF bagi setiap spesies, 39,055 BGC telah dinyahduplikasi lagi, menghasilkan sejumlah 17,689 BGC.
Kebaharuan GCC dan GCF dinilai berdasarkan jarak antara pangkalan data yang dikira (pangkalan data RefSeq dalam BiG-FAM)29 dan yang disahkan secara eksperimen (MIBIG 2.0)30 BGC.Bagi setiap 17,689 wakil BGC, kami memilih jarak kosinus terkecil ke pangkalan data masing-masing.Jarak minimum ini kemudiannya dipuratakan (min) mengikut GCF atau GCC, mengikut kesesuaian.GCF dianggap baharu jika jarak ke pangkalan data lebih besar daripada 0.2, yang sepadan dengan pemisahan ideal antara GCF (purata) dan rujukan.Untuk GCC, kami memilih 0.4, iaitu dua kali ganda ambang yang ditakrifkan oleh GCF, untuk mengunci hubungan jangka panjang dengan pautan.
Kelimpahan metagenomik BGC dianggarkan sebagai kelimpahan purata gen biosintetiknya (seperti yang ditentukan oleh anti-SMASH) yang tersedia daripada profil peringkat gen.Kelimpahan metagenomik setiap GCF atau GCC kemudiannya dikira sebagai jumlah wakil BGC (daripada 17, 689).Peta kelimpahan ini kemudiannya dinormalkan untuk komposisi selular menggunakan kiraan mOTU setiap sampel, yang juga menyumbang kepada usaha penjujukan (data yang dikembangkan, Rajah 1d).Kelaziman GCF atau GCC dikira sebagai peratusan sampel dengan kelimpahan > 0.
Jarak Euclidean antara sampel dikira daripada profil GCF yang dinormalkan.Jarak ini dikurangkan dalam saiz menggunakan UMAP77 dan pembenaman yang terhasil digunakan untuk pengelompokan berasaskan kepadatan tanpa pengawasan menggunakan HDBSCAN78.Bilangan mata minimum yang optimum untuk kluster (dan seterusnya bilangan kluster) yang digunakan oleh HDBSCAN ditentukan dengan memaksimumkan kebarangkalian kumulatif keahlian kluster.Kluster yang dikenal pasti (dan subsampel seimbang rawak bagi kluster ini untuk mengambil kira bias dalam analisis multivariat permutasi bagi varians (PERMANOVA)) telah diuji untuk kepentingan terhadap jarak Euclidean yang tidak dikurangkan menggunakan PERMANOVA.Saiz genom purata sampel dikira berdasarkan kelimpahan relatif mOTU dan anggaran saiz genom ahli genom.Khususnya, purata saiz genom setiap mOTU dianggarkan sebagai purata saiz genom ahlinya diperbetulkan untuk kesempurnaan (selepas penapisan) (contohnya, genom lengkap 75% dengan panjang 3 Mb mempunyai saiz terlaras 4 Mb).untuk genom sederhana dengan integriti ≥70%.Saiz genom purata bagi setiap sampel kemudiannya dikira sebagai jumlah saiz genom mOTU yang ditimbang dengan kelimpahan relatif.
Satu set ditapis BGC yang dikodkan genom dalam OMD ditunjukkan dalam pokok GTDB bakteria dan arkeologi (dalam rangka kerja ≥5 kb, tidak termasuk REF dan SAG MarDB yang tidak ditemui dalam 1038 metagenom, lihat di atas) dan kategori produk yang diramalkan berdasarkan filogenetik kedudukan genom (lihat di atas).Kami mula-mula mengurangkan data mengikut spesies, menggunakan genom dengan paling BGC dalam spesies itu sebagai wakil.Untuk visualisasi, wakil-wakil itu dibahagikan lagi kepada kumpulan pokok, dan sekali lagi, untuk setiap klad sel, genom yang mengandungi bilangan terbesar BGC telah dipilih sebagai wakil.Spesies yang diperkaya BGC (sekurang-kurangnya satu genom dengan> 15 BGC) dianalisis selanjutnya dengan mengira Indeks Kepelbagaian Shannon untuk jenis produk yang dikodkan dalam BGC tersebut.Jika semua jenis produk yang diramalkan adalah sama, hibrid kimia dan BGC kompleks lain (seperti yang diramalkan oleh anti-SMAH) dianggap tergolong dalam jenis produk yang sama, tanpa mengira susunannya dalam kelompok (cth protein-bacteriocin dan bacteriocin-proteoprotein fusion badan).hibrid).
Baki DNA (dianggarkan 6 ng) daripada sampel Malaspina MP1648, sepadan dengan sampel biologi SAMN05421555 dan dipadankan dengan set bacaan metagenomik Illumina SRR3962772 untuk bacaan pendek, diproses mengikut protokol penjujukan PacBio dengan input ultra rendah untuk menggunakan sampel PacBio SMRTlification gDNA kit (100-980-000) dan kit penyediaan templat SMRTbell Express 2.0 (100-938-900).Secara ringkas, baki DNA dipotong, dibaiki dan ditulenkan (manik ProNex) menggunakan Covaris (g-TUBE, 52104).DNA yang telah disucikan kemudiannya tertakluk kepada penyediaan perpustakaan, penguatan, penulenan (manik ProNex) dan pemilihan saiz (>6 kb, Pippin Biru) sebelum langkah penulenan terakhir (manik ProNex) dan penjujukan pada platform Sekuel II.
Pembinaan semula dua ca.Untuk MAG Eremiobacterota, kami mengenal pasti enam ANI tambahan> 99% (ini termasuk dalam Rajah 3), yang pada mulanya ditapis berdasarkan skor pencemaran (kemudian dikenal pasti sebagai pertindihan gen, lihat di bawah).Kami juga menemui dulang berlabel "Ca".Eremiobacterota” daripada pelbagai kajian23 dan menggunakannya bersama-sama dengan lapan MAG daripada kajian kami sebagai rujukan untuk bacaan metagenomik daripada 633 sampel yang diperkaya eukariotik (>0.8 µm) menggunakan BWA (v.0.7.17) Ref -r1188, – bendera) untuk sampel yang dikurangkan. pemetaan (5 juta bacaan).Berdasarkan peta khusus pengayaan (ditapis oleh identiti penjajaran 95% dan liputan bacaan 80%), 10 metagenom (liputan dijangka ≥5×) telah dipilih untuk pemasangan dan tambahan 49 metagenom (liputan dijangka ≥1×) untuk korelasi kandungan.Menggunakan parameter yang sama seperti di atas, sampel ini telah dibin dan 10 'Ca' tambahan telah ditambah.MAG Eremiobacterota telah dipulihkan.16 MAG ini (tidak mengira dua yang sudah ada dalam pangkalan data) menjadikan jumlah genom dalam OMD yang diperluaskan kepada 34,815.MAG diberikan pangkat taksonomi berdasarkan persamaan dan kedudukan genomnya dalam GTDB.18 MAG telah dinyahreplikasi menggunakan dRep kepada 5 spesies (ANI intraspesifik>99%) dan 3 genera (ANI intragenerik 85% hingga 94%) dalam keluarga yang sama79.Wakil spesies dipilih secara manual berdasarkan integriti, pencemaran, dan N50.Nomenklatur yang dicadangkan disediakan dalam Maklumat Tambahan.
Menilai integriti dan pencemaran 'Ca.MAG Eremiobacterota, kami menilai kehadiran uscMG, serta set gen penanda salinan tunggal keturunan dan domain khusus yang digunakan oleh CheckM dan Anvi'o.Pengenalpastian 2 pendua daripada 40 uscMG telah disahkan oleh pembinaan semula filogenetik (lihat di bawah) untuk menolak sebarang potensi pencemaran (ini sepadan dengan 5% berdasarkan 40 gen penanda ini).Kajian tambahan terhadap lima wakil MAG 'Ca.Tahap pencemar yang rendah dalam genom yang dibina semula ini telah disahkan untuk spesies Eremiobacterota menggunakan antara muka Anvi'o interaktif berdasarkan kelimpahan dan korelasi komposisi jujukan (Maklumat Tambahan)59.
Untuk analisis filogenomik, kami memilih lima MAG wakil "Ca".Eudormicrobiaceae", semua spesies "Ca.Genom Eremiobacterota dan ahli filum lain (termasuk UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria dan Planctomycetota) boleh didapati daripada GTDB (r89)13.Kesemua genom ini telah diberi anotasi seperti yang diterangkan sebelum ini untuk pengekstrakan gen penanda salinan tunggal dan anotasi BGC.Genom GTDB telah dipelihara mengikut kriteria integriti dan pencemaran di atas.Analisis filogenetik dilakukan menggunakan aliran kerja Anvi'o Phylogenetics59.Pokok itu telah dibina menggunakan IQTREE (v.2.0.3) (pilihan lalai dan -bb 1000)80 pada penjajaran 39 protein ribosom tandem yang dikenal pasti oleh Anvi'o (MUSCLE, v.3.8.1551)81.Kedudukannya dikurangkan.untuk meliputi sekurang-kurangnya 50% daripada genom82 dan Planctomycecota digunakan sebagai kumpulan luar berdasarkan topologi pokok GTDB.Satu pokok daripada 40 uscMG telah dibina menggunakan alat dan parameter yang sama.
Kami menggunakan Traitar (v.1.1.2) dengan parameter lalai (fenotip, daripada nukleotida)83 untuk meramalkan ciri mikrob biasa.Kami meneroka gaya hidup pemangsa yang berpotensi berdasarkan indeks pemangsa yang dibangunkan sebelum ini 84 yang bergantung pada kandungan gen pengekodan protein dalam genom.Khususnya, kami menggunakan DIAMOND untuk membandingkan protein dalam genom dengan pangkalan data OrthoMCL (v.4)85 menggunakan pilihan –lebih sensitif –id 25 –kulit pertanyaan 70 –kulit subjek 70 – atas 20 DAN mengira gen yang sepadan dengan gen penanda bagi pemangsa dan bukan pemangsa.Indeks ialah perbezaan antara bilangan tanda pemangsa dan bukan pemangsa.Sebagai kawalan tambahan, kami juga menganalisis genom "Ca".Faktor Entotheonella TSY118 adalah berdasarkan perkaitannya dengan Ca.Eudoremicrobium (saiz genom besar dan potensi biosintetik).Seterusnya, kami menguji hubungan berpotensi antara gen penanda pemangsa dan bukan pemangsa dan potensi biosintetik Ca.Eudormicrobiaceae” dan mendapati bahawa tidak lebih daripada satu gen (daripada sebarang jenis gen penanda, iaitu gen pemangsa/bukan pemangsa) bertindih dengan BGC, menunjukkan bahawa BGC tidak mengelirukan isyarat pemangsa.Anotasi genomik tambahan bagi replika hancur telah dilakukan menggunakan TXSSCAN (v.1.0.2) untuk memeriksa secara khusus sistem rembesan, pili, dan flagella86.
Lima wakil 'Ca telah dipetakan dengan memetakan 623 metatranskriptom daripada pecahan pengayaan prokariotik dan eukariotik lautan Tara22,40,87 (menggunakan BWA, v.0.7.17-r1188, -a bendera).Genom Eudormicrobiaceae.Fail BAM telah diproses dengan FeatureCounts (v.2.0.1)88 selepas liputan bacaan 80% dan penapisan identiti 95% (dengan pilihan featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Mengira bilangan sisipan setiap gen.Peta yang dihasilkan telah dinormalisasi untuk panjang gen dan kelimpahan gen penanda mOTU (kiraan sisipan purata ternormal panjang untuk gen dengan kiraan sisipan> 0) dan diubah log kepada 22.74 untuk mendapatkan ungkapan relatif setiap sel bagi setiap tahap gen, yang juga menerangkan kebolehubahan daripada sampel kepada sampel semasa penjujukan.Nisbah sedemikian membolehkan analisis perbandingan, mengurangkan masalah komposisi apabila menggunakan data kelimpahan relatif.Hanya sampel dengan> 5 daripada 10 gen penanda mOTU dipertimbangkan untuk analisis lanjut bagi membolehkan bahagian genom yang cukup besar dikesan.
Profil transkrip yang dinormalisasi 'Ca.E. taraoceanii tertakluk kepada pengurangan dimensi menggunakan UMAP dan perwakilan yang terhasil digunakan untuk pengelompokan tanpa pengawasan menggunakan HDBSCAN (lihat di atas) untuk menentukan status ekspresi.PERMANOVA menguji kepentingan perbezaan antara kelompok yang dikenal pasti dalam ruang jarak asal (tidak dikurangkan).Ekspresi pembezaan antara keadaan ini telah diuji merentasi genom (lihat di atas) dan 201 laluan KEGG telah dikenal pasti dalam 6 kumpulan berfungsi, iaitu: BGC, sistem rembesan dan gen flagellar daripada TXSSCAN, enzim degradasi (protease dan peptidases), dan pemangsa dan bukan- gen pemangsa.penanda indeks pemangsa.Untuk setiap sampel, kami mengira ungkapan normal median untuk setiap kelas (perhatikan bahawa ungkapan BGC itu sendiri dikira sebagai ungkapan median gen biosintetik untuk BGC itu) dan diuji untuk kepentingan merentas negeri (ujian Kruskal-Wallis diselaraskan untuk FDR).
Gen sintetik dibeli daripada GenScript dan primer PCR dibeli daripada Microsynth.Phusion polimerase daripada Thermo Fisher Scientific digunakan untuk penguatan DNA.Plasmid NucleoSpin, gel NucleoSpin dan kit penulenan PCR daripada Macherey-Nagel digunakan untuk penulenan DNA.Enzim sekatan dan ligase DNA T4 telah dibeli dari New England Biolabs.Bahan kimia selain daripada isopropyl-β-d-1-thiogalactopyranoside (IPTG) (Biosynth) dan 1,4-dithiothreitol (DTT, AppliChem) telah dibeli daripada Sigma-Aldrich dan digunakan tanpa penulenan selanjutnya.Antibiotik kloramfenikol (Cm), spectinomycin dihydrochloride (Sm), ampicillin (Amp), gentamicin (Gt), dan carbenicillin (Cbn) dibeli daripada AppliChem.Komponen media Bacto Tryptone dan Bacto Yeast Extract telah dibeli daripada BD Biosciences.Trypsin untuk penjujukan telah dibeli daripada Promega.
Urutan gen telah diekstrak daripada anti-SMASH yang diramalkan BGC 75.1.E. malaspinii (Maklumat tambahan).
Gen embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4), dan embAM (termasuk kawasan intergene) disusun mengikut konstruk pdonUC57 dan A (yang dioptimumkan dalam bentuk sintetik pmpR57) bila.Gen embA telah disubklonkan ke dalam tapak pengklonan berganda pertama (MCS1) pACYCDuet-1(CmR) dan pCDFDuet-1(SmR) dengan tapak belahan BamHI dan HindIII.Gen embM dan embMopt (dioptimumkan kodon) telah disubklonkan ke dalam MCS1 pCDFDuet-1(SmR) dengan BamHI dan HindIII dan diletakkan di tapak pengklonan berganda kedua pCDFDuet-1(SmR) dan pRSFDuet-1(KanR) (MCS2) dengan NdeI/ChoI.Kaset embAM telah disubklonkan ke dalam pCDFDuet1(SmR) dengan tapak belahan BamHI dan HindIII.Gen orf3/embI (locus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) telah dibina oleh PCR sambungan bertindih menggunakan primer EmbI_OE_F_NdeI dan EmbI_OE_R_XhoI, dicerna dengan NdeI/XhoI-FdM yang sama, dan diikat semula ke dalam enzim NdeI/XhoIFDE (1 pCD-FdM) yang sama (diikatkan semula ke dalam enzim pCD-1MC1) Tambahan meja).6).Pencernaan dan pengikatan enzim sekatan telah dilakukan mengikut protokol pengeluar (New England Biolabs).

 


Masa siaran: Mac-14-2023