Hvala vam što ste posjetili Nature.com.Koristite verziju pretraživača sa ograničenom podrškom za CSS.Za najbolje iskustvo, preporučujemo da koristite ažurirani pretraživač (ili onemogućite način kompatibilnosti u Internet Exploreru).Osim toga, kako bismo osigurali stalnu podršku, prikazujemo stranicu bez stilova i JavaScripta.
Klizači koji prikazuju tri članka po slajdu.Koristite dugmad za nazad i sledeće da se krećete kroz slajdove ili dugmad kontrolora slajdova na kraju za kretanje kroz svaki slajd.
Detaljan opis proizvoda
304 Zavarene namotane cijevi / cijevi od nehrđajućeg čelika
1. Specifikacija: cijev / cijevi od nehrđajućeg čelika
2. Tip: zavareni ili bešavni
3. Standard: ASTM A269, ASTM A249
4. Promjer cijevi zavojnice od nehrđajućeg čelika: 6 mm do 25,4 mm
5. Dužina: 600-3500MM ili prema zahtjevu kupca.
6. Debljina zida: 0,2 mm do 2,0 mm.
7. Tolerancija: OD: +/-0,01 mm;Debljina: +/-0,01%.
8. Veličina unutrašnje rupe zavojnice: 500MM-1500MM (može se podesiti prema zahtjevima kupca)
9. Visina zavojnice: 200MM-400MM (može se podesiti prema zahtjevima kupca)
10. Površina: svijetla ili žarena
11. Materijal: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, legura 625, 825, 2205, 2507, itd.
12. Pakovanje: pletene vreće u drvenom sanduku, drvena paleta, drvena osovina ili prema zahtjevu kupca
13. Test: hemijska komponenta, granica popuštanja, zatezna čvrstoća, merenje tvrdoće
14. Garancija: Inspekcija treće strane (na primjer: SGS TV), itd.
15. Primjena: dekoracija, namještaj, transport ulja, izmjenjivač topline, izrada ograda, izrada papira, automobili, prerada hrane, medicina itd.
Svi hemijski sastav i fizička svojstva za nerđajući čelik kao što je dole:
Materijal | ASTM A269 Hemijski sastav % Maks | ||||||||||
C | Mn | P | S | Si | Cr | Ni | Mo | NB | Nb | Ti | |
TP304 | 0.08 | 2.00 | 0,045 | 0,030 | 1.00 | 18.0-20.0 | 8.0-11.0 | ^ | ^ | ^ . | ^ |
TP304L | 0,035 | 2.00 | 0,045 | 0,030 | 1.00 | 18.0-20.0 | 8.0-12.0 | ^ | ^ | ^ | ^ |
TP316 | 0.08 | 2.00 | 0,045 | 0,030 | 1.00 | 16.0-18.0 | 10.0-14.0 | 2.00-3.00 | ^ | ^ | ^ |
TP316L | 0,035 D | 2.00 | 0,045 | 0,030 | 1.00 | 16.0-18.0 | 10.0-15.0 | 2.00-3.00 | ^ | ^ | ^ |
TP321 | 0.08 | 2.00 | 0,045 | 0,030 | 1.00 | 17.0-19.0 | 9.0-12.0 | ^ | ^ | ^ | 5C -0,70 |
TP347 | 0.08 | 2.00 | 0,045 | 0,030 | 1.00 | 17.0-19.0 | 9.0-12.0 | 10C -1.10 | ^ |
Materijal | Termičku obradu | Temperatura F (C) Min. | Tvrdoća | |
Brinell | Rockwell | |||
TP304 | Rješenje | 1900 (1040) | 192HBW/200HV | 90HRB |
TP304L | Rješenje | 1900 (1040) | 192HBW/200HV | 90HRB |
TP316 | Rješenje | 1900 (1040) | 192HBW/200HV | 90HRB |
TP316L | Rješenje | 1900 (1040) | 192HBW/200HV | 90HRB |
TP321 | Rješenje | 1900 (1040) F | 192HBW/200HV | 90HRB |
TP347 | Rješenje | 1900 (1040) | 192HBW/200HV | 90HRB |
OD, inč | OD tolerancija inča (mm) | WT tolerancija % | Tolerancija dužine inča (mm) | |
+ | - | |||
≤ 1 / 2 | ± 0,005 ( 0,13 ) | ± 15 | 1 / 8 ( 3.2 ) | 0 |
> 1 / 2 ~1 1 / 2 | ± 0,005 (0,13) | ± 10 | 1 / 8 (3.2) | 0 |
> 1 1 / 2 ~< 3 1 / 2 | ± 0,010 (0,25) | ± 10 | 3 / 16 (4.8) | 0 |
> 3 1 / 2 ~< 5 1 / 2 | ± 0,015 (0,38) | ± 10 | 3 / 16 (4.8) | 0 |
> 5 1 / 2 ~< 8 | ± 0,030 (0,76) | ± 10 | 3 / 16 (4.8) | 0 |
8~< 12 | ± 0,040 (1,01) | ± 10 | 3 / 16 (4.8) | 0 |
12~< 14 | ± 0,050 (1,26) | ± 10 | 3 / 16 (4.8) | 0 |
Prirodne mikrobne zajednice su filogenetski i metabolički raznolike.Pored nedovoljno istraženih grupa organizama1, ova raznolikost također ima bogat potencijal za otkrivanje ekološki i biotehnološki značajnih enzima i biohemijskih spojeva2,3.Međutim, proučavanje ove raznolikosti kako bi se odredili genomski putevi koji sintetiziraju takva jedinjenja i vezuju ih za odgovarajuće domaćine ostaje izazov.Biosintetski potencijal mikroorganizama u otvorenom okeanu ostaje uglavnom nepoznat zbog ograničenja u analizi podataka o rezoluciji cijelog genoma na globalnoj razini.Ovdje istražujemo raznolikost i raznolikost biosintetskih genskih klastera u oceanu integracijom oko 10.000 mikrobnih genoma iz kultiviranih stanica i pojedinačnih stanica s više od 25.000 novorekonstruiranih nacrt genoma iz preko 1.000 uzoraka morske vode.Ovim naporima identifikovano je oko 40.000 navodnih, uglavnom novih biosintetskih genskih klastera, od kojih su neki pronađeni u prethodno nesumnjivim filogenetskim grupama.U ovim populacijama identificirali smo lozu obogaćenu biosintetičkim genskim klasterima (“Candidatus Eudormicrobiaceae”) koji su pripadali nekultiviranoj bakterijskoj vrsti i uključivali neke od biosintetski najraznovrsnijih mikroorganizama u ovoj sredini.Od njih smo okarakterisali fosfatazno-peptidne i pitonamidne puteve, identifikujući slučajeve neobične strukture bioaktivnog jedinjenja i enzimologije, respektivno.U zaključku, ova studija pokazuje kako strategije zasnovane na mikrobiomu mogu omogućiti istraživanje prethodno neopisanih enzima i prirodne hrane u slabo shvaćenoj mikrobioti i okruženju.
Mikrobi pokreću globalne biogeokemijske cikluse, održavaju mreže hrane i održavaju zdravlje biljaka i životinja5.Njihova ogromna filogenetska, metabolička i funkcionalna raznolikost predstavlja bogat potencijal za otkrivanje novih taksona1, enzima i biohemijskih spojeva, uključujući prirodne proizvode6.U ekološkim zajednicama, ovi molekuli pružaju mikroorganizmima različite fiziološke i ekološke funkcije, od komunikacije do konkurencije 2, 7 .Pored svojih izvornih funkcija, ovi prirodni proizvodi i njihovi genetski kodirani proizvodni putevi daju primjere za biotehnološku i terapeutsku primjenu2,3.Identifikacija takvih puteva i veza uvelike je olakšana proučavanjem kultiviranih mikroba.Međutim, taksonomska istraživanja prirodnog okruženja su pokazala da velika većina mikroorganizama nije kultivisana8.Ova kulturološka pristranost ograničava našu sposobnost da iskoristimo funkcionalnu raznolikost koju kodiraju mnogi mikrobi4,9.
Da bi se prevazišla ova ograničenja, tehnološki napredak u protekloj deceniji omogućio je istraživačima da direktno (tj. bez prethodne kulture) sekvenciraju mikrobne DNK fragmente iz čitavih zajednica (metagenomika) ili pojedinačnih ćelija.Sposobnost sastavljanja ovih fragmenata u veće fragmente genoma i rekonstrukcije više metagenomski sastavljenih genoma (MAG) ili pojedinačnih amplificiranih genoma (SAG), respektivno, otvara važnu priliku za taksocentrične studije mikrobioma (tj. mikrobnih zajednica i mikrobioma).utrti nove puteve.sopstveni genetski materijal u datom okruženju) 10,11,12.Zaista, nedavne studije su uvelike proširile filogenetsku reprezentaciju mikrobne raznolikosti na Zemlji1, 13 i otkrile veliki dio funkcionalne raznolikosti u pojedinačnim mikrobnim zajednicama koje ranije nisu bile pokrivene sekvencama referentnog genoma kultiviranih mikroorganizama (REF)14.Sposobnost postavljanja neotkrivene funkcionalne raznolikosti u kontekst genoma domaćina (tj. rezolucija genoma) je kritična za predviđanje još nekarakterističnih mikrobnih linija koje vjerojatno kodiraju nove prirodne proizvode15,16 ili za praćenje takvih spojeva do njihovog originalnog proizvođača17.Na primjer, kombinovani pristup metagenomske i jednoćelijske genomske analize doveo je do identifikacije Candidatus Entotheonella, grupe metabolički bogatih bakterija povezanih s sunđerom, kao proizvođača različitih potencijala lijekova18.Međutim, uprkos nedavnim pokušajima genomskog istraživanja različitih mikrobnih zajednica,16,19 još uvijek nedostaje više od dvije trećine globalnih metagenomskih podataka za najveći okean ekosistema na Zemlji16,20.Stoga, općenito, biosintetski potencijal morskog mikrobioma i njegov potencijal kao spremišta novih enzimskih i prirodnih proizvoda ostaju u velikoj mjeri nedovoljno istraženi.
Kako bismo istražili biosintetski potencijal morskih mikrobioma na globalnoj razini, prvo smo udružili morske mikrobne genome dobivene korištenjem metoda koje ovise o kulturi i metodama bez kulture kako bismo stvorili opsežnu bazu podataka o filogenetici i funkciji gena.Ispitivanje ove baze podataka otkrilo je širok spektar biosintetskih genskih klastera (BGC), od kojih većina pripada još neobilježenim porodicama genskih klastera (GCF).Pored toga, identifikovali smo nepoznatu porodicu bakterija koja pokazuje najveću poznatu raznolikost BGC-a u otvorenom okeanu do sada.Odabrali smo dva puta ribosomske sinteze i post-translacijsko modificiranog peptida (RiPP) za eksperimentalnu validaciju na osnovu njihovih genetskih razlika od trenutno poznatih puteva.Funkcionalna karakterizacija ovih puteva otkrila je neočekivane primjere enzimologije, kao i strukturno neobične spojeve s inhibitornom aktivnošću proteaze.
U početku smo imali za cilj stvoriti globalni izvor podataka za analizu genoma, fokusirajući se na njegove bakterijske i arhealne komponente.U tu svrhu prikupili smo metagenomske podatke i 1038 uzoraka morske vode sa 215 globalno raspoređenih mjesta uzorkovanja (raspon geografske širine = 141,6°) i nekoliko dubokih slojeva (od 1 do 5600 m dubine, koji pokrivaju pelagičnu, mezopelagičnu i ponornu zonu).Pozadina 21,22,23 (slika 1a, prošireni podaci, slika 1a i dodatna tabela 1).Osim što pružaju široku geografsku pokrivenost, ovi selektivno filtrirani uzorci omogućili su nam da uporedimo različite komponente morskog mikrobioma, uključujući bogate virusima (<0,2 µm), bogate prokariotima (0,2-3 µm), bogate česticama (0,8 µm). ).–20 µm) i kolonije osiromašene virusom (>0,2 µm).
a, Ukupno 1038 javno dostupnih genoma (metagenomika) morskih mikrobnih zajednica prikupljenih sa 215 globalno distribuiranih lokacija (62°S do 79°N i 179°W do 179°E.).Pločice karte © Esri.Izvori: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ i Esri.b, ovi metagenomi su korišteni za rekonstrukciju MAG-ova (metode i dodatne informacije), koji se razlikuju po količini i kvalitetu (metode) u skupovima podataka (označeni bojom).Rekonstruisani MAG-ovi su dopunjeni javno dostupnim (spoljnim) genomima, uključujući ručno izrađene MAG26, SAG27 i REF.27 Sastavite OMD.c, u poređenju sa prethodnim izveštajima zasnovanim samo na SAG (GORG)20 ili MAG (GEM)16, OMD poboljšava genomsku karakterizaciju morskih mikrobnih zajednica (metagenomska stopa mapiranja čitanja; metoda) za dva do tri puta uz konzistentnije predstavljanje u dubini i geografska širina..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, OMD grupisanje u klastere vrsta (95% srednji nukleotidni identitet) identifikuje ukupno približno 8300 vrsta, od kojih više od polovice nije prethodno okarakterisano prema taksonomskim napomenama koristeći GTDB (verzija 89) e, klasifikacija vrsta prema tipu genoma pokazala je da se MAG, SAG i REF međusobno dobro nadopunjuju u odražavanju filogenetske raznolikosti morski mikrobiom.Konkretno, 55%, 26% i 11% vrsta bilo je specifično za MAG, SAG i REF, respektivno.BATS, Bermuda Atlantic Time Series;GEM, genomi Zemljinog mikrobioma;GORG, globalni referentni genom okeana;VRUĆE, vremenska serija Havajskog okeana.
Koristeći ovaj skup podataka, rekonstruirali smo ukupno 26.293 MAG-a, uglavnom bakterijskih i arhealnih (slika 1b i prošireni podaci, slika 1b).Napravili smo ove MAG-ove iz sklopova iz odvojenih, a ne iz skupnih metagenomskih uzoraka kako bismo spriječili kolaps varijacije prirodnih sekvenci između uzoraka sa različitih lokacija ili vremenskih tačaka (metoda).Osim toga, grupisali smo genomske fragmente na osnovu njihove korelacije prevalencije u velikom broju uzoraka (od 58 do 610 uzoraka, ovisno o istraživanju; metodi).Utvrdili smo da je ovo dugotrajan, ali važan korak24 koji je preskočen u nekoliko velikih radova na rekonstrukciji MAG16, 19, 25 i značajno poboljšava kvantitet (2,7 puta u prosjeku) i kvalitet (+20% u prosjeku) genom.rekonstruirano iz ovdje proučavanog morskog metagenoma (prošireni podaci, slika 2a i dodatne informacije).Sveukupno, ovi napori su rezultirali 4,5 puta povećanjem morskih mikrobnih MAG-ova (6-struko ako se uzmu u obzir samo visokokvalitetni MAG-ovi) u usporedbi s najsveobuhvatnijim MAG resursom koji je danas dostupan16 (Metode).Ovaj novostvoreni MAG set je zatim kombinovan sa 830 ručno odabranih MAG26, 5969 SAG27 i 1707 REF.Dvadeset sedam vrsta morskih bakterija i arheja činilo je kombinatornu kolekciju od 34.799 genoma (slika 1b).
Zatim smo procijenili novostvoreni resurs kako bismo poboljšali njegovu sposobnost predstavljanja morskih mikrobnih zajednica i procijenili utjecaj integracije različitih tipova genoma.U prosjeku smo otkrili da pokriva otprilike 40-60% morskih metagenomskih podataka (Slika 1c), što je dva do tri puta veća pokrivenost prethodnih izvještaja samo za MAG iu dubini iu geografskoj širini More serial 16 ili SAG20.Osim toga, da bismo sistematski izmjerili taksonomsku raznolikost u uspostavljenim zbirkama, označili smo sve genome koristeći komplet alata (metode) baze podataka taksonomije genoma (GTDB) i koristili prosječan nukleotidni identitet za cijeli genom od 95%.28 za identifikaciju 8.304 klastera vrsta (vrsta).Dvije trećine ovih vrsta (uključujući nove klade) se ranije nisu pojavljivale u GTDB, od kojih je 2790 otkriveno pomoću MAG-a rekonstruisanog u ovoj studiji (slika 1d).Osim toga, otkrili smo da su različiti tipovi genoma visoko komplementarni: 55%, 26% i 11% vrsta se u potpunosti sastoji od MAG, SAG, odnosno REF (slika 1e).Osim toga, MAG je obuhvatio svih 49 tipova pronađenih u vodenom stupcu, dok su SAG i REF predstavljali samo njih 18 odnosno 11.Međutim, SAG bolje predstavlja raznolikost najčešćih klada (prošireni podaci, slika 3a), kao što su Pelagic Bacteriales (SAR11), pri čemu SAG pokriva skoro 1300 vrsta, a MAG samo 390 vrsta.Značajno je da su se REF-ovi rijetko preklapali s MAG-ovima ili SAG-ovima na nivou vrste i predstavljali su >95% od približno 1000 genoma koji nisu pronađeni u metagenomskim skupovima otvorenog oceana koji su ovdje proučavani, uglavnom zbog interakcije s drugim tipovima izoliranih reprezentativnih morskih primjeraka (npr. sedimenti) .ili domaćin-saradnik).Kako bi bio široko dostupan znanstvenoj zajednici, ovaj resurs morskog genoma, koji također uključuje neklasificirane fragmente (npr. iz predviđenih faga, genomskih otoka i fragmenata genoma za koje nema dovoljno podataka za MAG rekonstrukciju), može se uporediti s taksonomskim podacima .Pristupite napomenama zajedno s funkcijom gena i kontekstualnim parametrima u bazi podataka o mikrobiologiji oceana (OMD; https://microbiomics.io/ocean/).
Zatim smo krenuli u istraživanje bogatstva i novosti biosintetskog potencijala u mikrobiomima otvorenog oceana.U tu svrhu, prvo smo koristili antiSMASH za sve MAG-ove, SAG-ove i REF-ove pronađene u 1038 morskih metagenoma (metoda) da bismo predvidjeli ukupno 39.055 BGC-a.Zatim smo ih grupisali u 6907 neredundantnih GCF-a i 151 populaciju klastera gena (GCC; Dodatna tabela 2 i metode) da bismo uzeli u obzir inherentnu redundantnost (tj. isti BGC može biti kodiran u više genoma) i metagenomske podatke Fragmentacija koncentriranih BGC-a.Nepotpuni BGC-ovi nisu značajno povećali, ako ih ima (dodatne informacije), broj GCF-a i GCC-a, respektivno, koji sadrže najmanje jednog netaknutog člana BGC-a u 44% i 86% slučajeva.
Na nivou GCC-a, pronašli smo širok spektar predviđenih RiPP-ova i drugih prirodnih proizvoda (slika 2a).Među njima, na primjer, arilpolieni, karotenoidi, ektoini i siderofori pripadaju GCC-ima sa širokom filogenetskom distribucijom i velikom zastupljenošću u okeanskim metagenomima, što može ukazivati na široku adaptaciju mikroorganizama na morsku sredinu, uključujući otpornost na reaktivne vrste kisika, oksidativni i osmotski stres..ili apsorpciju gvožđa (više informacija).Ova funkcionalna raznolikost je u suprotnosti sa nedavnom analizom od približno 1,2 miliona BGC-a među približno 190.000 genoma pohranjenih u bazi podataka NCBI RefSeq (BiG-FAM/RefSeq, u daljem tekstu RefSeq)29, koja je pokazala da neribosomalni sintetazni peptidi i sintetaza popeptide (NRPS) (PKS) BGC (dodatne informacije).Također smo pronašli 44 (29%) GCC-a koji su samo u daljini povezani sa bilo kojim RefSeq BGC (\(\bar{d}\)RefSeq > 0,4; slika 2a i metode) i 53 (35%) GCC-a samo u MAG-u, naglašavajući potencijal za otkrivanje prethodno neopisanih hemikalija u OMD-u.S obzirom na to da svaki od ovih GCC-a vjerovatno predstavlja vrlo različite biosintetičke funkcije, dalje smo analizirali podatke na nivou GCF-a u nastojanju da pružimo detaljnije grupiranje BGC-a za koje se predviđa da će kodirati slične prirodne proizvode29.Ukupno 3861 (56%) identifikovanih GCF-ova nije se preklapalo sa RefSeq-om, a >97% GCF-ova nije bilo prisutno u MIBiG-u, jednoj od najvećih baza podataka eksperimentalno potvrđenih BGC-a (Slika 2b).Iako nije iznenađujuće otkriti mnoge potencijalne nove puteve u okruženjima koja nisu dobro predstavljena referentnim genomom, naša metoda za dereplikaciju BGC-a u GCF-ove prije benčmarkinga razlikuje se od prethodnih izvještaja 16 i omogućava nam da pružimo nepristrasnu procjenu novosti.Većina novog diverziteta (3012 GCF ili 78%) odgovara predviđenim terpenima, RiPP ili drugim prirodnim proizvodima, a većina (1815 GCF ili 47%) je kodirana u nepoznatim tipovima zbog njihovog biosintetskog potencijala.Za razliku od PKS i NRPS klastera, manje je vjerovatno da će ovi kompaktni BGC biti fragmentirani tokom metagenomskog sastavljanja 31 i omogućavaju funkcionalnu karakterizaciju njihovih proizvoda koja zahtijeva više vremena i resursa.
Ukupno 39.055 BGC je grupisano u 6.907 GCF i 151 GCC.a, predstavljanje podataka (interno eksterno).Hijerarhijsko grupisanje BGC udaljenosti na osnovu GCC-a, od kojih 53 fiksira samo MAG.GCC sadrži BGC iz različitih taksona (ln-transformisana frekvencija kapije) i različitih BGC klasa (veličina kruga odgovara njegovoj frekvenciji).Za svaki GCC, vanjski sloj predstavlja broj BGC-ova, prevalence (procenat uzoraka) i udaljenost (minimalna BGC kosinusna udaljenost (min(dMIBiG))) od BiG-FAM-a do BGC-a.GCC sa BGC-ovima koji su blisko povezani sa eksperimentalno verifikovanim BGC-ovima (MIBiG) su označeni strelicama.b Upoređujući GCF sa predviđenim (BiG-FAM) i eksperimentalno potvrđenim (MIBiG) BGC, pronađeno je 3861 novih (d–>0,2) GCF.Većina (78%) ovih kodova za RiPP, terpene i druge navodne prirodne proizvode.c, svi genomi u OMD pronađeni u 1038 morskih metagenoma smješteni su u GTDB osnovno stablo kako bi pokazali filogenetsku pokrivenost OMD-a.Klade bez ikakvih genoma u OMD-u su prikazane sivom bojom.Broj BGC odgovara najvećem broju predviđenih BGC po genomu u datoj kladi.Radi jasnoće, zadnjih 15% čvorova je skupljeno.Strelice označavaju klade bogate BGC (>15 BGC), sa izuzetkom Mycobacterium, Gordonia (drugi samo Rhodococcus) i Crocosphaera (drugi samo Synechococcus).d, nepoznato c.Eremiobacterota je pokazala najveću biosintetičku raznovrsnost (Shannonov indeks zasnovan na vrsti prirodnog proizvoda).Svaka traka predstavlja genom sa najviše BGC u vrsti.T1PKS, PKS tip I, T2/3PKS, PKS tip II i tip III.
Osim bogatstva i novosti, istražujemo biogeografsku strukturu biosintetskog potencijala morskog mikrobioma.Grupiranje uzoraka prema prosječnoj metagenomskoj raspodjeli broja kopija GCF-a (Metode) pokazalo je da su zajednice niske geografske širine, površine, prokariotski bogate i siromašne virusima, uglavnom iz površinskih ili dubljih voda obasjanih suncem, bogate RiPP i BGC terpenima.Nasuprot tome, polarne, dubokomorske zajednice bogate virusima i česticama bile su povezane s većom zastupljenošću NRPS i PKS BGC (prošireni podaci, slika 4 i dodatne informacije).Konačno, otkrili smo da su dobro proučene tropske i pelagične zajednice izvori novih terpena koji najviše obećavaju (slika proširenih podataka).Najveći potencijal za PKS, RiPP i druge prirodne proizvode (slika 5a sa proširenim podacima).
Kako bismo upotpunili naše proučavanje biosintetskog potencijala morskih mikrobioma, željeli smo mapirati njihovu filogenetičku distribuciju i identificirati nove klade obogaćene BGC-om.U tu svrhu, postavili smo genome morskih mikroba u normalizirano GTDB13 bakterijsko i arhealno filogenetsko stablo i prekrili pretpostavljene biosintetske puteve koje oni kodiraju (slika 2c).Lako smo otkrili nekoliko BGC-obogaćenih klada (predstavljenih sa preko 15 BGC-a) u uzorcima morske vode (metode) poznatim po svom biosintetskom potencijalu, kao što su cijanobakterije (Synechococcus) i bakterije Proteus, kao što je Tistrella32,33, ili su nedavno privukle pažnju svojim prirodni proizvodi.kao što su Myxococcota (Sandaracinaceae), Rhodococcus i Planctomycetota34,35,36.Zanimljivo je da smo u ovim kladama pronašli nekoliko ranije neistraženih linija.Na primjer, one vrste s najbogatijim biosintetskim potencijalom u tipu Planctomycetota i Myxococcota pripadale su neharakteriziranim kandidatskim redovima i rodovima (dopunska tablica 3).Uzeto zajedno, ovo sugerira da OMD pruža pristup prethodno nepoznatim filogenetskim informacijama, uključujući mikroorganizme, koji mogu predstavljati nove mete za otkrivanje enzima i prirodnih proizvoda.
Zatim smo okarakterisali kladu obogaćenu BGC-om ne samo prebrojavanjem maksimalnog broja BGC-ova koje su kodirali njeni članovi, već i procenom raznolikosti ovih BGC-ova, što objašnjava učestalost različitih vrsta prirodnih proizvoda kandidata (slika 2c i metode )..Otkrili smo da su biosintetski najrazličitije vrste predstavljene specijalno dizajniranim bakterijskim MAG-ovima u ovoj studiji.Ove bakterije pripadaju nekultivisanom tipu Candidatus Eremiobacterota, koji ostaje uglavnom neistražen, osim u nekoliko genomskih studija37,38.Važno je napomenuti da je „ca.Rod Eremiobacterota je analiziran samo u kopnenom okruženju39 i nije poznato da uključuje članove obogaćene BGC-om.Ovdje smo rekonstruirali osam MAG-ova iste vrste (identitet nukleotida > 99%) 23. Stoga predlažemo naziv vrste “Candidatus Eudremicrobium malaspinii”, nazvan po nereidi (morska nimfa), prekrasnom daru u grčkoj mitologiji i ekspedicijama.'Ka.Prema filogenetskoj napomeni 13, E. malaspinii nema ranije poznatih srodnika ispod nivoa sekvence i stoga pripada novoj bakterijskoj porodici koju predlažemo “Ca.E. malaspinii” kao tipska vrsta i “Ca.Eudormicrobiaceae” kao službeni naziv (dodatne informacije).Kratka metagenomska rekonstrukcija 'Ca.Projekat genoma E. malaspinii potvrđen je vrlo malim unosom, dugo čitanim metagenomskim sekvenciranjem i ciljanim sastavljanjem jednog uzorka (Metode) kao jednog linearnog hromozoma od 9,63 Mb sa duplikacijom od 75 kb.kao jedina preostala nejasnoća.
Da bismo utvrdili filogenetski kontekst ove vrste, tražili smo 40 blisko povezanih vrsta u dodatnim metagenomskim uzorcima obogaćenim eukariotima iz ekspedicije Tara Ocean kroz ciljanu rekonstrukciju genoma.Ukratko, povezali smo metagenomska očitavanja sa genomskim fragmentima povezanim sa “Ca.E. malaspinii” i pretpostavio da povećana stopa regrutacije u ovom uzorku ukazuje na prisustvo drugih srodnika (metode).Kao rezultat toga, pronašli smo 10 MAG-ova, kombinaciju 19 MAG-ova koji predstavljaju pet vrsta u tri roda unutar novodefinirane porodice (tj. “Ca. Eudormicrobiaceae”).Nakon ručne inspekcije i kontrole kvaliteta (prošireni podaci, sl. 6 i dodatne informacije), ustanovili smo da je “Ca.Vrste Eudormicrobiaceae imaju veće genome (8 Mb) i bogatiji biosintetski potencijal (14 do 22 BGC po vrsti) od ostalih članova „Ca“.Clade Eremiobacterota (do 7 BGC) (sl. 3a–c).
a, Filogenetski položaji pet 'Ca.Vrste Eudormicrobiaceae pokazale su bogatstvo BGC specifično za morske linije identificirane u ovoj studiji.Filogenetsko stablo uključuje sve 'Ca.MAG Eremiobacterota i članovi drugih tipova (brojevi genoma u zagradama) dati u GTDB (verzija 89) korišteni su za evolucionu pozadinu (Metode).Najudaljeniji slojevi predstavljaju klasifikacije na nivou porodice (“Ca. Eudormicrobiaceae” i “Ca. Xenobiaceae”) i na nivou klase (“Ca. Eremiobacteria”).Pet vrsta opisanih u ovoj studiji predstavljeno je alfanumeričkim kodovima i predloženim binomnim imenima (dodatne informacije).b, ok.Vrste Eudormicrobiaceae dijele sedam zajedničkih BGC jezgara.Odsustvo BGC-a u kladi A2 nastalo je zbog nepotpunosti reprezentativnog MAG-a (dopunska tabela 3).BGC-ovi su specifični za “Ca.Amphithomicrobium” i “Ca.Amphithomicrobium” (klasovi A i B) nisu prikazani.c, Svi BGC-ovi kodirani kao “Ca.Utvrđeno je da je Eudremicrobium taraoceanii izražen u 623 metatranskriptoma uzetih iz okeana Tare.Puni krugovi označavaju aktivnu transkripciju.Narandžasti krugovi označavaju log2-transformirane promjene nabora ispod i iznad stope ekspresije gena za domaćinstvo (metode).d, krive relativne zastupljenosti (metode) koje pokazuju 'Ca.Vrste Eudormicrobiaceae rasprostranjene su u većini okeanskih basena i u cijelom vodenom stupcu (od površine do dubine od najmanje 4000 m).Na osnovu ovih procjena, ustanovili smo da je 'Ca.E. malaspinii' čini do 6% prokariotskih ćelija u dubokomorskim pelagijskim zajednicama povezanim sa žitaricama.Smatrali smo da je vrsta prisutna na lokaciji ako je pronađena u bilo kojem dijelu veličine datog dubinskog sloja.IO – Indijski okean, NAO – Sjeverni Atlantik, NPO – Sjeverni Pacifik, RS – Crveno more, SAO – Južni Atlantik, SO – Južni okean, SPO – Južni Pacifik.
Proučavajući obilje i distribuciju Ca.Eudormicrobiaceae, koja, kako smo utvrdili, dominira u većini okeanskih basena, kao iu cijelom vodenom stupcu (slika 3d).Lokalno, oni čine 6% morske mikrobne zajednice, što ih čini važnim dijelom globalnog morskog mikrobioma.Osim toga, pronašli smo relativni sadržaj Ca.Vrste Eudormicrobiaceae i nivoi njihove ekspresije BGC bili su najviši u frakciji obogaćenoj eukariotima (slika 3c i prošireni podaci, slika 7), što ukazuje na moguću interakciju sa česticama, uključujući plankton.Ovo zapažanje ima neke sličnosti sa 'Ca.Eudremicrobium BGC-i koji proizvode citotoksične prirodne proizvode poznatim putevima mogu pokazati predatorsko ponašanje (dodatne informacije i prošireni podaci, slika 8), slično drugim grabežljivcima koji specifično proizvode metabolite kao što je Myxococcus41.Otkriće Ca.Eudormicrobiaceae u manje dostupnim (duboki ocean) ili eukariotskim, a ne prokariotskim uzorcima mogu objasniti zašto ove bakterije i njihova neočekivana raznolikost BGC ostaju nejasni u kontekstu istraživanja prirodne hrane.
Na kraju, pokušali smo eksperimentalno potvrditi obećanje našeg rada zasnovanog na mikrobiomu u otkrivanju novih puteva, enzima i prirodnih proizvoda.Među različitim klasama BGC-a, poznato je da RiPP put kodira bogatu hemijsku i funkcionalnu raznolikost zbog različitih post-translacionih modifikacija jezgra peptida od strane zrelih enzima42.Tako smo odabrali dva 'Ca.Eudoremicrobium' RiPP BGC (Slike 3b i 4a-e) su zasnovane na istom kao i bilo koji poznati BGC (\(\bar{d}\)MIBiG i \(\bar{d}\)RefSeq iznad 0,2) .
a–c, In vitro heterologna ekspresija i in vitro enzimski testovi novog (\(\bar{d}\)RefSeq = 0,29) klastera RiPP biosinteze specifične za dubokomorske vrste Ca.E. malaspinii' dovela je do proizvodnje difosforiliranih proizvoda.c, modifikacije identifikovane korišćenjem MS/MS visoke rezolucije (HR) (fragmentacija označena b i y jonima u hemijskoj strukturi) i NMR (prošireni podaci, slika 9).d, ovaj fosforilirani peptid pokazuje nisku mikromolarnu inhibiciju neutrofilne elastaze sisara, koja se ne nalazi u kontrolnom peptidu i dehidrirajućem peptidu (dehidracija izazvana hemijskim uklanjanjem).Eksperiment je ponovljen tri puta sa sličnim rezultatima.Na primjer, heterologna ekspresija drugog novog \(\bar{d}\)RefSeq = 0,33) klastera biosinteze proteina razjašnjava funkciju četiri zrela enzima koji modificiraju peptid jezgre od 46 aminokiselina.Ostaci su obojeni prema mjestu modifikacije predviđenom HR-MS/MS, označavanjem izotopa i NMR analizom (dodatne informacije).Isprekidana boja označava da se modifikacija dešava na bilo kojem od dva ostatka.Slika je kompilacija brojnih heterolognih konstrukata koji pokazuju aktivnost svih zrelih enzima na istom jezgru.h, Ilustracija NMR podataka za N-metilaciju amida kičme.Potpuni rezultati su prikazani na sl.10 sa proširenim podacima.i, Filogenetski položaj enzima klastera zrelog proteina FkbM među svim FkbM domenima pronađenim u bazi podataka MIBiG 2.0 otkriva enzim ove porodice sa aktivnošću N-metiltransferaze (dodatne informacije).Prikazani su šematski dijagrami BGC (a, e), prekursorskih peptidnih struktura (b, f) i pretpostavljenih hemijskih struktura prirodnih proizvoda (c, g).
Prvi RiPP put (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) pronađen je samo kod dubokomorskih vrsta “Ca.E. malaspinii” i kodovi za Peptide-prekursor (slika 4a, b).U ovom zrelom enzimu identifikovali smo jednu funkcionalnu domenu homolognu domenu dehidratacije lantipeptid sintaze koja normalno katalizira fosforilaciju i naknadno uklanjanje 43 (dodatne informacije).Stoga predviđamo da modifikacija prekursora peptida uključuje takvu dehidraciju u dva koraka.Međutim, korištenjem tandem masene spektrometrije (MS/MS) i spektroskopije nuklearne magnetne rezonance (NMR), identificirali smo polifosforilirani linearni peptid (slika 4c).Iako neočekivano, pronašli smo nekoliko dokaza koji potvrđuju da je to krajnji proizvod: dva različita heterologna domaćina i bez dehidracije u in vitro testovima, identifikacija ključnih ostataka mutiranih na mjestu katalitičke dehidracije zrelog enzima.sve rekonstruisano od strane “Ca”.Genom E. malaspinii (prošireni podaci, slika 9 i dodatne informacije) i, konačno, biološka aktivnost fosforiliranog proizvoda, ali ne i hemijski sintetizovanog dehidriranog oblika (slika 4d).U stvari, otkrili smo da pokazuje nisku mikromolarnu inhibitornu aktivnost proteaze protiv neutrofilne elastaze, uporedivu s drugim srodnim prirodnim proizvodima u rasponu koncentracija (IC50 = 14,3 μM) 44, unatoč činjenici da ekološka uloga tek treba biti razjašnjena.Na osnovu ovih rezultata, predlažemo da se put nazove "fosfeptin".
Drugi slučaj je složen RiPP put specifičan za 'Ca.Predviđeno je da rod Eudremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) kodira prirodne proteinske proizvode (slika 4e).Ovi putevi su od posebnog biotehnološkog interesa zbog očekivane gustine i raznovrsnosti neobičnih hemijskih modifikacija koje uspostavljaju enzimi koje kodiraju relativno kratki BGC45.Otkrili smo da se ovaj protein razlikuje od prethodno okarakteriziranih proteina po tome što mu nedostaje i glavni NX5N motiv policeramida i lantioninska petlja landornamida 46 .Da bismo prevazišli ograničenja uobičajenih heterolognih obrazaca ekspresije, koristili smo ih zajedno sa prilagođenim Microvirgula aerodenitrificans sistemom za karakterizaciju četiri zrela enzima (metoda).Koristeći kombinaciju MS/MS, označavanja izotopa i NMR, otkrili smo ove zrele enzime u jezgri peptida od 46 aminokiselina (slika 4f,g, prošireni podaci, slike 10-12 i dodatne informacije).Među zrelim enzimima, okarakterizirali smo prvu pojavu člana porodice FkbM O-metiltransferaze 47 u RiPP putu i neočekivano otkrili da ovaj zreli enzim uvodi N-metilaciju kičme (slika 4h, i i dodatne informacije).Iako je ova modifikacija poznata u prirodnim NRP48 proizvodima, enzimska N-metilacija amidnih veza je složena, ali biotehnološki značajna reakcija49 koja je do sada bila od interesa za RiPP familiju borozina.Specifičnost 50,51.Identifikacija ove aktivnosti u drugim porodicama enzima i RiPP-a može otvoriti nove aplikacije i proširiti funkcionalnu raznolikost proteina 52 i njihovu hemijsku raznolikost.Na osnovu identifikovanih modifikacija i neobične dužine predložene strukture proizvoda, predlažemo naziv puta „pitonamida“.
Otkriće neočekivane enzimologije u funkcionalno okarakterisanoj porodici enzima ilustruje obećanje genomike životne sredine za nova otkrića, a takođe ilustruje ograničen kapacitet za funkcionalno zaključivanje samo na osnovu homologije sekvence.Stoga, zajedno sa izvještajima o nekanonskim bioaktivnim polifosforiliranim RiPP-ovima, naši rezultati pokazuju resursno intenzivnu, ali kritičnu vrijednost za napore sintetičke biologije da u potpunosti otkrije funkcionalno bogatstvo, raznolikost i neobične strukture biohemijskih spojeva.
Ovdje demonstriramo raspon biosintetskog potencijala koji kodiraju mikrobi i njihov genomski kontekst u globalnom morskom mikrobiomu, olakšavajući buduća istraživanja tako što će rezultirajući resurs učiniti dostupnim znanstvenoj zajednici (https://microbiomics.io/ocean/).Otkrili smo da se veći dio njegove filogenetske i funkcionalne novosti može dobiti samo rekonstrukcijom MAG-ova i SAG-ova, posebno u nedovoljno iskorištenim mikrobnim zajednicama koje bi mogle voditi buduće napore bioprospekcije.Iako ćemo se ovdje fokusirati na 'Ca.Eudormicrobiaceae” kao loza posebno biosintetički “talentovana”, mnogi od BGC-a predviđenih u neotkrivenoj mikrobioti vjerovatno kodiraju prethodno neopisane enzimologije koje daju jedinjenja sa ekološki i/ili biotehnološki značajnim djelovanjem.
Metagenomski skupovi podataka iz glavnih oceanografskih i studija vremenskih serija sa dovoljnom dubinom sekvenciranja su uključeni kako bi se maksimizirala pokrivenost globalnih morskih mikrobnih zajednica u okeanskim basenima, dubokim slojevima i tokom vremena.Ovi skupovi podataka (dopunska tabela 1 i slika 1) uključuju metagenomiku iz uzoraka prikupljenih u okeanima Tare (obogaćeni virusima, n=190; prokariotski obogaćeni, n=180)12,22 i ekspediciju BioGEOTRACES (n=480).Havajski oceanski vremenski niz (HOT, n = 68), bermudsko-atlantski vremenski niz (BATS, n = 62)21 i ekspedicija Malaspina (n = 58)23.Čitanja sekvencioniranja iz svih metagenomskih fragmenata filtrirana su za kvalitet pomoću BBMap-a (v.38.71) uklanjanjem adaptera za sekvenciranje iz čitanja, uklanjanjem očitavanja mapiranih u sekvence kontrole kvaliteta (PhiX genomi) i korištenjem trimq=14, maq=20 odbacuje loš kvalitet čitanja, maxns = 0 i minlength = 45. Naknadne analize su pokrenute ili spojene sa QC čitanjima ako je navedeno (bbmerge.sh minoverlap=16).QC očitavanja su normalizirana (bbnorm.sh cilj = 40, dubina uma = 0) prije izgradnje koristeći metaSPAdes (v.3.11.1 ili v.3.12 ako je potrebno)53.Rezultirajući kontigovi skele (u daljem tekstu skele) su konačno filtrirani po dužini (≥1 kb).
1038 metagenomskih uzoraka podijeljeno je u grupe, a za svaku grupu uzoraka očitavanja metagenomske kontrole kvaliteta svih uzoraka su usklađena sa zagradama svakog uzorka posebno, što je rezultiralo sljedećim brojem grupnih čitanja u parnim zagradama: Morski virusi Tara – obogaćeni (190×190), Prokarioti obogaćeni (180×180), BioGEOTRACES, HOT i BATS (610×610) i Malaspina (58×58).Mapiranje je urađeno pomoću Burrows-Wheeler-Aligner-a (BWA) (v.0.7.17-r1188)54 koji omogućava da se očitavanja upare sa sekundarnim lokacijama (koristeći -a zastavicu).Poravnanja su filtrirana tako da budu dugačka najmanje 45 baza, imaju ≥97% identiteta i raspon ≥80% čitanja.Rezultirajuće BAM datoteke su obrađene korištenjem skripte jgi_summarize_bam_contig_depths za MetaBAT2 (v.2.12.1)55 kako bi se osigurala pokrivenost unutar i između uzorka za svaku grupu.Konačno, zagrade su grupisane kako bi se povećala osjetljivost pojedinačnim pokretanjem MetaBAT2 na svim uzorcima sa –minContig 2000 i –maxEdges 500. Koristimo MetaBAT2 umjesto ansambl boksera jer se u nezavisnim testovima pokazalo da je najefikasniji pojedinačni bokser.i 10 do 50 puta brži od ostalih uobičajenih boksera57.Da bi se testirao učinak korelacije obilja, nasumično odabrani poduzorak metagenomike (10 za svaki od dva skupa podataka okeana Tara, 10 za BioGEOTRACES, 5 za svaku vremensku seriju i 5 za Malaspinu) dodatno je koristio samo uzorke.Interni uzorci se grupišu kako bi se dobile informacije o pokrivenosti.(Dodatne informacije).
Dodatni (eksterni) genomi su uključeni u kasniju analizu, odnosno 830 ručno odabranih MAG-ova iz podskupa skupa podataka Tara Oceans26, 5287 SAG-ova iz skupa podataka GORG20 i podaci iz MAR baze podataka (MarDB v. 4) iz 1707 izolovanih REF-ova i 682 SAGs) 27. Za MarDB skup podataka, genomi se biraju na osnovu dostupnih metapodataka ako tip uzorka odgovara sljedećem regularnom izrazu: '[S|s]single.?[C|c]ell|[C|c]ulture| [I|i] izolovan'.
Kvalitet svakog metagenomskog kontejnera i eksternih genoma je procijenjen korištenjem CheckM (v.1.0.13) i Anvi'o Lineage Workflow (v.5.5.0)58,59.Ako CheckM ili Anvi'o prijavi ≥50% potpunosti/potpunosti i ≤10% kontaminacije/redundantnosti, sačuvajte metagenomske ćelije i eksterne genome za kasniju analizu.Ovi rezultati su zatim kombinovani u srednju potpunost (mcpl) i srednju kontaminaciju (mctn) da bi se klasifikovao kvalitet genoma prema kriterijumima zajednice60 na sledeći način: visok kvalitet: mcpl ≥ 90% i mctn ≤ 5%;dobar kvalitet: mcpl ≥ 70%, mctn ≤ 10%, srednji kvalitet: mcpl ≥ 50% i mctn ≤ 10%, pošten kvalitet: mcpl ≤ 90% ili mctn ≥ 10%.Filtrirani genomi su zatim u korelaciji sa rezultatima kvaliteta (Q i Q') na sljedeći način: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (varijabilnost soja)/100 + 0,5 x log[N50] .(implementirano u dRep61).
Da bi se omogućila komparativna analiza između različitih izvora podataka i tipova genoma (MAG, SAG i REF), 34.799 genoma je dereferencirano na osnovu prosječnog nukleotidnog identiteta u cijelom genomu (ANI) koristeći dRep (v.2.5.4).Ponavlja)61 sa 95% ANI pragova28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) i markerski geni u jednoj kopiji koji koriste SpecI63 koji osigurava grupiranje genoma na nivou vrste.Reprezentativni genom je odabran za svaki dRep klaster u skladu sa maksimalnom ocenom kvaliteta (Q') definisanom iznad, što se smatralo reprezentativnim za vrstu.
Za procjenu brzine mapiranja, BWA (v.0.7.17-r1188, -a) je korišten za mapiranje svih 1038 setova metagenomskih očitavanja sa 34,799 genoma sadržanih u OMD-u.Čitanja kontrolirana kvalitetom su mapirana u single-ended modu i rezultirajuća poravnanja su filtrirana kako bi se zadržala samo poravnanja dužine ≥45 bp.i identitet ≥95%.Omjer prikaza za svaki uzorak je postotak očitanja preostalih nakon filtracije podijeljen s ukupnim brojem očitavanja kontrole kvaliteta.Koristeći isti pristup, svaki od 1038 metagenoma je smanjen na 5 miliona umetaka (prošireni podaci, slika 1c) i uparen sa GORG SAG u OMD-u i u svim GEM16.Količina MAG-ova prikupljenih iz morske vode u GEM16 katalogu određena je upitima ključnih riječi metagenomskih izvora, odabirom uzoraka morske vode (npr. za razliku od morskih sedimenata).Konkretno, odabiremo "vodeni" kao "kategorija_ekosistema", "morski" kao "tip_ekosistema", a filtriramo "stanište" kao "duboki ocean", "morsko", "pomorsko oceansko", "pelagično more", "morska voda" , “Ocean”, “Morska voda”, “Površinska morska voda”, “Površinska morska voda”.Ovo je rezultiralo sa 5903 MAG-a (734 visokog kvaliteta) raspoređenih u 1823 OTU-a (pogledajte ovdje).
Prokariotski genomi su taksonomski označeni korištenjem GTDB-Tk (v.1.0.2)64 sa zadanim parametrima koji ciljaju GTDB r89 verziju 13. Anvi'o je korišten za identifikaciju eukariotskih genoma na osnovu predviđanja domena i opoziva ≥50% i redundantnosti ≤ %.Taksonomska oznaka vrste definira se kao jedan od njenih reprezentativnih genoma.Sa izuzetkom eukariota (148 MAG), svaki genom je prvo funkcionalno označen korištenjem prokka (v.1.14.5)65, imenovanjem kompletnih gena, definiranjem parametara "arheje" ili "bakterije" prema potrebi, što je također prijavljeno za ne- kodirajućih gena.i CRISPR regije, između ostalih genomskih karakteristika.Označite predviđene gene identifikacijom univerzalnih gena markera u jednoj kopiji (uscMG) koristeći fetchMG (v.1.2)66, dodijelite ortološke grupe i postavite upit koristeći emapper (v.2.0.1)67 na osnovu eggNOG (v.5.0)68.KEGG baza podataka (objavljena 10. februara 2020.) 69. Posljednji korak je izveden upoređivanjem proteina sa KEGG bazom podataka pomoću DIAMOND (v.0.9.30)70 sa upitom i pokrivenošću teme od ≥70%.Rezultati su dalje filtrirani prema NCBI Prokariotskom Genomu Annotation Pipeline71 na osnovu bitrate ≥ 50% od maksimalnog očekivanog bitrate-a (sama veza).Genske sekvence su takođe korišćene kao ulaz za identifikaciju BGC-a u genomu koristeći antiSMASH (v.5.1.0)72 sa podrazumevanim parametrima i različitim eksplozijama klastera.Svi genomi i napomene su sastavljeni u OMD zajedno sa kontekstualnim metapodacima dostupnim na webu (https://microbiomics.io/ocean/).
Slično prethodno opisanim metodama12,22 koristili smo CD-HIT (v.4.8.1) da grupišemo >56,6 miliona gena koji kodiraju proteine iz genoma bakterija i arheja iz OMD-a u 95% identiteta i kraće gene (90% pokrivenost)73 do >17,7 miliona klastera gena.Najduža sekvenca je odabrana kao reprezentativni gen za svaki klaster gena.1038 metagenoma je zatim upareno sa >17,7 miliona BWA (-a) članova klastera i rezultirajući BAM fajlovi su filtrirani da zadrže samo poravnanja sa ≥95% procenta identiteta i ≥45 baznih poravnanja.Obilje gena normalizovano po dužini izračunato je prvo brojanjem umetaka iz najboljeg jedinstvenog poravnanja, a zatim, za neizrazito mapirane umetke, dodavanjem frakcionih brojanja odgovarajućim ciljnim genima proporcionalno njihovom broju jedinstvenih umetaka.
Genomi iz proširenog OMD-a (sa dodatnim MAG-ovima iz “Ca. Eudormicrobiaceae”, vidi dolje) dodani su u bazu podataka alata za metagenomsku analizu mOTUs74 (v.2.5.1) kako bi se stvorila proširena referentna baza podataka mOTU.Samo šest genoma u jednoj kopiji (23.528 genoma) je preživjelo od deset uscMG.Proširenje baze podataka rezultiralo je 4.494 dodatna klastera na nivou vrsta.1038 metagenoma je analizirano korištenjem zadanih mOTU parametara (v.2).Ukupno 989 genoma sadržanih u 644 mOTU klastera (95% REF, 5% SAG i 99,9% pripada MarDB) nije otkriveno mOTU profilom.Ovo odražava različite dodatne izvore morske izolacije MarDB genoma (većina neotkrivenih genoma povezana je s organizmima izoliranim iz sedimenata, morskim domaćinima, itd.).Kako bismo nastavili fokusirati se na okruženje otvorenog oceana u ovoj studiji, isključili smo ih iz nizvodne analize osim ako nisu otkriveni ili uključeni u proširenu bazu podataka mOTU kreiranu u ovoj studiji.
Svi BGC-ovi iz MAG-a, SAG-a i REF-a u OMD-u (vidi gore) su kombinovani sa BGC-ovima identifikovanim u svim metagenomskim skelama (antiSMASH v.5.0, podrazumevani parametri) i okarakterisani korišćenjem BiG-SLICE (v.1.1) (PFAM domen)75.Na osnovu ovih karakteristika, izračunali smo sve kosinusne udaljenosti između BGC-ova i grupisali ih (srednje veze) u GCF i GCC koristeći pragove udaljenosti od 0,2 i 0,8 respektivno.Ovi pragovi su adaptacija pragova koji su se prethodno koristili korištenjem Euklidske udaljenosti75 zajedno sa kosinusnom udaljenosti, što ublažava neke od grešaka u originalnoj strategiji grupiranja BiG-SLICE (dodatne informacije).
BGC-ovi su zatim filtrirani kako bi se zadržalo samo ≥5 kb kodiranih na skelama kako bi se smanjio rizik od fragmentacije kao što je prethodno opisano16 i da bi se isključili MarDB REF-ovi i SAG-ovi koji nisu pronađeni u 1038 metagenoma (vidi gore).Ovo je rezultiralo da je ukupno 39.055 BGC kodiranih OMD genomom, sa dodatnih 14.106 identifikovanih na metagenomskim fragmentima (tj. nisu kombinovani u MAG).Ovi "metagenomski" BGC-i korišteni su za procjenu udjela potencijala biosinteze morskog mikrobioma koji nije uhvaćen u bazi podataka (dodatne informacije).Svaki BGC je funkcionalno okarakteriziran prema prediktivnim tipovima proizvoda definiranim anti-SMASH ili grubljim kategorijama proizvoda definiranim u BiG-SCAPE76.Kako bi se spriječila pristranost uzorkovanja u kvantifikaciji (taksonomski i funkcionalni sastav GCC/GCF, udaljenost GCF i GCC do referentnih baza podataka i metagenomsko obilje GCF), zadržavanjem samo najdužeg BGC po GCF za svaku vrstu, 39 055 BGC je dalje deduplicirano, što je rezultiralo sa ukupno 17.689 BGC.
Novost GCC i GCF procijenjena je na osnovu udaljenosti između izračunate baze podataka (RefSeq baza podataka u BiG-FAM)29 i eksperimentalno verifikovane (MIBIG 2.0)30 BGC.Za svaki od 17.689 reprezentativnih BGC-a, izabrali smo najmanju kosinusnu udaljenost do odgovarajuće baze podataka.Ove minimalne udaljenosti se zatim prosječuju (srednja vrijednost) prema GCF ili GCC, prema potrebi.GCF se smatra novim ako je udaljenost do baze podataka veća od 0,2, što odgovara idealnom razdvajanju između (prosječnog) GCF-a i reference.Za GCC, biramo 0,4, što je dvostruko veći prag definiran GCF-om, kako bismo zaključali dugoročnu vezu s vezama.
Metagenomska zastupljenost BGC-a procijenjena je kao prosječna brojnost njegovih biosintetskih gena (kako je određeno anti-SMASH) dostupnih iz profila na nivou gena.Metagenomska zastupljenost svakog GCF-a ili GCC-a je tada izračunata kao zbir reprezentativnih BGC-a (od 17.689).Ove mape obilja su naknadno normalizovane za ćelijski sastav korišćenjem broja mOTU po uzorku, što je takođe uračunalo napore sekvenciranja (prošireni podaci, slika 1d).Prevalencija GCF ili GCC izračunata je kao procenat uzoraka sa obiljem > 0.
Euklidska udaljenost između uzoraka izračunata je iz normaliziranog GCF profila.Ove udaljenosti su smanjene u veličini pomoću UMAP77 i rezultirajuće ugradnje su korištene za nenadzirano grupiranje zasnovano na gustoći koristeći HDBSCAN78.Optimalni minimalni broj bodova za klaster (a samim tim i broj klastera) koji koristi HDBSCAN je određen maksimiziranjem kumulativne vjerovatnoće članstva u klasteru.Identifikovani klasteri (i nasumični izbalansirani poduzorak ovih klastera da bi se uzela u obzir pristrasnost u permutacionoj multivarijantnoj analizi varijanse (PERMANOVA)) su testirani na značaj u odnosu na neredukovane euklidske udaljenosti koristeći PERMANOVA.Prosječna veličina genoma uzoraka izračunata je na osnovu relativnog obilja mOTU i procijenjene veličine genoma članova genoma.Konkretno, prosječna veličina genoma svakog mOTU procijenjena je kao prosjek veličina genoma njegovih članova ispravljenih za potpunost (nakon filtriranja) (na primjer, 75% kompletan genom dužine 3 Mb ima prilagođenu veličinu od 4 Mb).za srednje genome sa integritetom ≥70%.Prosječna veličina genoma za svaki uzorak je zatim izračunata kao zbir veličina genoma mOTU ponderiranih relativnom zastupljenošću.
Filtrirani skup BGC kodiranih genomom u OMD-u prikazan je u bakterijskim i arhealnim GTDB stablima (u okvirima od ≥5 kb, isključujući REF i SAG MarDB koji nisu pronađeni u 1038 metagenoma, vidi gore) i njihovim predviđenim kategorijama proizvoda na osnovu filogenetske položaj genoma (vidi gore).Prvo smo smanjili podatke po vrstama, koristeći genom sa najviše BGC u toj vrsti kao reprezentativan.Za vizualizaciju, predstavnici su dalje podijeljeni u grupe stabala, i opet, za svaku ćelijsku kladu, genom koji sadrži najveći broj BGC je odabran kao predstavnik.Vrste obogaćene BGC-om (najmanje jedan genom sa >15 BGC) su dalje analizirane izračunavanjem Shannonovog indeksa raznolikosti za tipove proizvoda koji su kodirani u tim BGC-ovima.Ako su svi predviđeni tipovi proizvoda isti, smatra se da hemijski hibridi i drugi kompleksni BGC (kako predviđa anti-SMAH) pripadaju istoj vrsti proizvoda, bez obzira na njihov redosled u grupi (npr. fuzija protein-bakteriocin i bakteriocin-proteoprotein tijelo).hibrid).
Preostala DNK (procjenjuje se da je 6 ng) iz Malaspina uzorka MP1648, odgovara biološkom uzorku SAMN05421555 i uparen je sa Illumina SRR3962772 metagenomskim kompletom čitanja za kratko čitanje, obrađen prema PacBio protokolu sekvenciranja sa ultra-niskim unosom za korištenje PacBio uzorka za korištenje PacBio uzorka komplet (100-980-000) i SMRTbell Express 2.0 komplet za pripremu šablona (100-938-900).Ukratko, preostala DNK je isječena, popravljena i pročišćena (ProNex perle) pomoću Covarisa (g-TUBE, 52104).Prečišćena DNK se zatim podvrgava pripremi biblioteke, amplifikaciji, prečišćavanju (ProNex kuglice) i odabiru veličine (>6 kb, Blue Pippin) prije završnog koraka pročišćavanja (ProNex kuglice) i sekvenciranja na Sequel II platformi.
Rekonstrukcija prve dvije ca.Za MAG Eremiobacterota identifikovali smo šest dodatnih ANI>99% (ovi su uključeni na Slici 3), koji su prvobitno filtrirani na osnovu rezultata kontaminacije (kasnije identifikovani kao duplikacije gena, vidi dole).Pronašli smo i poslužavnik sa natpisom “Ca”.Eremiobacterota” iz različitih studija23 i koristio ih zajedno sa osam MAG-ova iz naše studije kao referencu za metagenomska očitavanja iz 633 eukariotski obogaćena (>0,8 µm) uzorka koristeći BWA (v.0.7.17) Ref -r1188, – zastavicu) za smanjenje uzorkovanja mapiranje (5 miliona čitanja).Na osnovu karata specifičnih za obogaćivanje (filtriranih 95% identiteta poravnanja i 80% pokrivenosti čitanjem), 10 metagenoma (očekivana pokrivenost ≥5×) je odabrano za sklapanje i dodatnih 49 metagenoma (očekivana pokrivenost ≥1×) za korelaciju sadržaja.Koristeći iste parametre kao gore, ovi uzorci su sakupljeni i dodano je 10 dodatnih 'Ca'.MAG Eremiobacterota je obnovljen.Ovih 16 MAG-ova (ne računajući dva koja su već u bazi podataka) dovodi ukupan broj genoma u proširenom OMD-u na 34.815.MAG-ovima se dodjeljuju taksonomski rangovi na osnovu njihove genomske sličnosti i pozicije u GTDB.18 MAG-ova je dereplicirano korištenjem dRep-a u 5 vrsta (intraspecifični ANI >99%) i 3 roda (intragenerički ANI 85% do 94%) unutar iste porodice79.Predstavnici vrsta su ručno odabrani na osnovu integriteta, kontaminacije i N50.Predložena nomenklatura je data u Dodatnim informacijama.
Procijenite integritet i kontaminaciju 'Ca.MAG Eremiobacterota, procijenili smo prisustvo uscMG, kao i setove markerskih gena specifičnih za lozu i domene koje su koristili CheckM i Anvi'o.Identifikacija 2 duplikata od 40 uscMG je potvrđena filogenetskom rekonstrukcijom (vidi dolje) kako bi se isključila svaka potencijalna kontaminacija (ovo odgovara 5% na osnovu ovih 40 markerskih gena).Dodatna studija pet reprezentativnih MAG-ova 'Ca.Nizak nivo zagađivača u ovim rekonstruisanim genomima potvrđen je za vrste Eremiobacterota korišćenjem interaktivnog Anvi'o interfejsa zasnovanog na korelaciji rasprostranjenosti i sastava sekvence (dodatne informacije)59.
Za filogenomsku analizu odabrali smo pet reprezentativnih MAG-ova „Ca“.Eudormicrobiaceae”, sve vrste “Ca.Genom Eremiobacterota i članova drugih tipova (uključujući UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria i Planctomycetota) dostupan je od GTDB (r89)13.Svi ovi genomi su označeni kao što je prethodno opisano za ekstrakciju gena markera jedne kopije i BGC anotaciju.GTDB genomi su konzervirani prema gore navedenim kriterijima integriteta i kontaminacije.Filogenetska analiza je izvršena korištenjem Anvi'o Phylogenetics59 toka rada.Stablo je konstruisano korišćenjem IQTREE (v.2.0.3) (podrazumevane opcije i -bb 1000)80 na poravnanju 39 tandem ribosomalnih proteina koje je identifikovao Anvi'o (MUSCLE, v.3.8.1551)81.Njegove pozicije su smanjene.da pokrije najmanje 50% genoma82, a Planctomycecota je korištena kao izlazna grupa zasnovana na topologiji GTDB stabla.Jedno stablo od 40 uscMG je napravljeno korištenjem istih alata i parametara.
Koristili smo Traitar (v.1.1.2) sa zadanim parametrima (fenotip, od nukleotida)83 da predvidimo uobičajene mikrobne osobine.Istražili smo potencijalni predatorski način života zasnovan na prethodno razvijenom predatorskom indeksu84 koji ovisi o sadržaju gena koji kodira protein u genomu.Konkretno, koristimo DIAMOND da bismo uporedili proteine u genomu sa OrthoMCL bazom podataka (v.4)85 koristeći opcije –osjetljiviji –id 25 –query-cover 70 –subject-cover 70 –top 20 I izbrojati gene koji odgovaraju markerski geni za predatore i nepredatore.Indeks je razlika između broja grabežljivih i nepredatorskih oznaka.Kao dodatnu kontrolu, analizirali smo i „Ca“ genom.Entotheonella TSY118 faktor se zasniva na njegovoj povezanosti sa Ca.Eudoremicrobium (velika veličina genoma i biosintetski potencijal).Zatim smo testirali potencijalne veze između predatorskih i nepredatorskih markerskih gena i biosintetskog potencijala Ca.Eudormicrobiaceae” i otkrili da se ne više od jednog gena (iz bilo koje vrste marker gena, tj. gena predatora/ne-predatora) preklapa sa BGC, što sugerira da BGC ne zbunjuje signale predatorstva.Dodatna genomska anotacija kodiranih replikona izvedena je korištenjem TXSSCAN (v.1.0.2) kako bi se posebno ispitao sistem sekrecije, pili i flagella86.
Pet reprezentativnih 'Ca je mapirano mapiranjem 623 metatranskriptoma iz frakcija obogaćenja prokariota i eukariota okeana Tare22,40,87 (koristeći BWA, v.0.7.17-r1188, -a flag).Genom Eudormicrobiaceae.BAM datoteke su obrađene sa FeatureCounts (v.2.0.1)88 nakon 80% pokrivenosti čitanja i 95% filtriranja identiteta (sa opcijama featureCounts –primarni -O –frakcija -t CDS,tRNA -F GTF -g ID -p ) Broji broj umetaka po genu.Generirane mape su normalizovane za dužinu gena i obilje marker gena mOTU (dužinom normalizovan prosečni broj umetanja za gene sa brojem umetanja >0) i log transformisane na 22,74 da bi se dobila relativna ekspresija po ćeliji svakog nivoa gena, što takođe objašnjava varijabilnost od uzorka do uzorka tokom sekvenciranja.Takvi omjeri omogućavaju komparativnu analizu, ublažavajući probleme sastava kada se koriste podaci o relativnom obilju.Samo uzorci sa >5 od 10 mOTU markerskih gena su uzeti u obzir za dalju analizu kako bi se omogućilo otkrivanje dovoljno velikog dijela genoma.
Normalizovani transkriptomski profil 'Ca.E. taraoceanii je podvrgnut redukciji dimenzionalnosti pomoću UMAP-a, a rezultirajuća reprezentacija je korištena za nenadzirano grupisanje pomoću HDBSCAN-a (vidi gore) za određivanje statusa ekspresije.PERMANOVA testira značajnost razlika između identifikovanih klastera u originalnom (ne redukovanom) prostoru udaljenosti.Diferencijalna ekspresija između ovih stanja je testirana u cijelom genomu (vidi gore) i identificiran je 201 KEGG put u 6 funkcionalnih grupa, a to su: BGC, sistem sekrecije i flagelarni geni iz TXSSCAN, enzimi razgradnje (proteaze i peptidaze) i predatorski i ne- predatorski geni.predatorski indeksni markeri.Za svaki uzorak smo izračunali medijan normalizovane ekspresije za svaku klasu (imajte na umu da se sama ekspresija BGC izračunava kao medijana ekspresije biosintetskih gena za taj BGC) i testirali značajnost između stanja (Kruskal-Wallisov test prilagođen za FDR).
Sintetički geni su kupljeni od GenScript-a, a PCR prajmeri su kupljeni od Microsynth-a.Za amplifikaciju DNK korištena je Phusion polimeraza iz Thermo Fisher Scientifica.Za prečišćavanje DNK korišteni su NucleoSpin plazmidi, NucleoSpin gel i PCR komplet za prečišćavanje iz Macherey-Nagel.Restrikcioni enzimi i T4 DNK ligaza su kupljeni od New England Biolabs.Hemikalije osim izopropil-β-d-1-tiogalaktopiranozida (IPTG) (Biosynth) i 1,4-ditiotreitola (DTT, AppliChem) su kupljene od Sigma-Aldrich i korištene bez daljeg prečišćavanja.Antibiotici hloramfenikol (Cm), spektinomicin dihidroklorid (Sm), ampicilin (Amp), gentamicin (Gt) i karbenicilin (Cbn) kupljeni su od AppliChem-a.Komponente medija Bacto Triptone i Bacto Yeast Extract kupljene su od BD Biosciences.Tripsin za sekvenciranje je kupljen od Promega.
Genske sekvence su ekstrahovane iz anti-SMASH predviđenog BGC 75.1.E. malaspinii (dodatne informacije).
Geni embA (lokus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (lokus, MALA_SAMN05422137_METAG-framework_127-gen_4) i embAM (uključujući sekvence konstruisane kao sekvence sa sintetikom 7 u p7 i bez C regiona) dons optimiziran za ekspresiju u E kada.Gen embA je subkloniran u prvo mjesto višestrukog kloniranja (MCS1) pACYCDuet-1(CmR) i pCDFDuet-1(SmR) sa BamHI i HindIII mjestima cijepanja.Geni embM i embMopt (optimizirani kodonom) su subklonirani u MCS1 pCDFDuet-1(SmR) sa BamHI i HindIII i smješteni na drugo mjesto višestrukog kloniranja pCDFDuet-1(SmR) i pRSFDuet-1(KanR) (MCS2) sa NdeI/ChoI.embAM kaseta je subklonirana u pCDFDuet1(SmR) sa BamHI i HindIII mjestima cijepanja.Orf3/embI gen (lokus, MALA_SAMN05422137_METAG-skela_127-gene_3) konstruiran je preklapajućim ekstenzijskim PCR-om korištenjem prajmera EmbI_OE_F_NdeI i EmbI_OE_R_XhoI, digestiranog sa NdeI/XhoI, digestiranim sa NdeI/XhoI, restriktivnim u istom pm-EmC i MMC, jonski enzimi (dodatni stol).6).Varenje i ligacija restrikcijskim enzima izvedeni su prema protokolu proizvođača (New England Biolabs).
Vrijeme objave: Mar-14-2023