Weit verbreitete somatische L1-Retrotransposition im normalen kolorektalen Epithel

Nachricht

HeimHeim / Nachricht / Weit verbreitete somatische L1-Retrotransposition im normalen kolorektalen Epithel

Mar 08, 2023

Weit verbreitete somatische L1-Retrotransposition im normalen kolorektalen Epithel

Naturband 617, Seiten

Nature Band 617, Seiten 540–547 (2023)Diesen Artikel zitieren

14.000 Zugriffe

161 Altmetrisch

Details zu den Metriken

Im Laufe des Lebens eines Individuums häufen sich genomische Veränderungen in somatischen Zellen1,2,3,4,5,6,7,8,9,10,11. Allerdings ist die Mutationslandschaft, die durch die Retrotransposition des lang eingestreuten Kernelements 1 (L1), eines weit verbreiteten mobilen Elements im menschlichen Genom, induziert wird, in normalen Zellen nur unzureichend verstanden. Hier haben wir die gesamten Genomsequenzen von 899 Einzelzellklonen untersucht, die aus drei verschiedenen Zelltypen von 28 Individuen stammen. Wir identifizierten 1.708 somatische L1-Retrotranspositionsereignisse, die mit kolorektalem Epithel angereichert waren und einen positiven Zusammenhang mit dem Alter zeigten. Der Fingerabdruck der Quellelemente zeigte 34 retrotranspositionsfähige L1s. Die mehrdimensionale Analyse zeigte, dass (1) somatische L1-Retrotranspositionen ab der frühen Embryogenese mit erheblicher Häufigkeit auftreten, (2) das epigenetische Ein-/Ausschalten eines Quellelements bevorzugt im frühen Organogenesestadium bestimmt wird, (3) retrotranspositionskompetente L1s mit einer geringeren Population Allele weisen eine höhere Retrotranspositionsaktivität auf und (4) nur ein kleiner Teil der L1-Transkripte im Zytoplasma wird schließlich in somatischen Zellen retrotransponiert. Die Analyse übereinstimmender Krebsarten legte außerdem nahe, dass die somatische L1-Retrotranspositionsrate während der kolorektalen Tumorentstehung erheblich erhöht ist. Zusammenfassend veranschaulicht diese Studie den durch L1-Retrotransposition induzierten somatischen Mosaikismus in normalen Zellen und liefert Einblicke in die genomische und epigenomische Regulation transponierbarer Elemente im Laufe des menschlichen Lebens.

Somatische Mutationen häufen sich spontan in normalen Zellen im Laufe des Lebens eines Individuums, beginnend mit der ersten Zellteilung2,3,4,5. Frühere Studien zum somatischen Mosaikismus konzentrierten sich hauptsächlich auf Nukleotidvarianten6,7,8,9,10,11. Komplexere Strukturereignisse werden bislang weniger erforscht, teilweise aufgrund ihres relativen Mangels und der technischen Herausforderungen bei der Erkennung, insbesondere bei der Auflösung einzelner Zellen.

Lange eingestreute nukleare Element-1 (L1)-Retrotransposons sind weit verbreitete transponierbare Elemente, die etwa 17 % des menschlichen Genoms ausmachen12,13,14. Evolutionär gesehen sind L1-Retrotransposons eine bemerkenswert erfolgreiche parasitäre Einheit in der Keimbahn, indem sie sich selbst an neuen genomischen Stellen „kopieren und einfügen“15. Die meisten der rund 500.000 L1 im menschlichen Referenzgenom können jedoch nicht weiter transponieren, da sie verkürzt sind und ihr funktionelles Potenzial verloren haben. Bisher wurden 264 retrotranspositionskompetente L1 (rc-L1)-Quellen in Krebsgenomen16,17 oder anderen experimentellen Studien12,13,18,19,20,21 entdeckt. Gelegentlich wurden L1-Retrotranspositionen bei der genetischen Analyse von Geweben bei mehreren Krankheiten gefunden22,23, was auf ihre Rolle bei der Entwicklung menschlicher Krankheiten schließen lässt und eine systematischere Charakterisierung erforderlich macht.

Somatische L1-Retrotranspositionsereignisse (soL1Rs) wurden systematisch in Krebsgeweben untersucht16,17,24. Bestimmte Krebsarten, darunter Adenokarzinome der Speiseröhre und des Darms, zeigten eine höhere Belastung durch soL1Rs, was häufig zu einer Veränderung der Krebsgene führt17. In polyklonalen normalen Geweben wurde soL1R noch nicht eindeutig untersucht, da es schwierig ist, Instanzen zu erkennen, die auf einen kleinen Teil der Zellen beschränkt sind. Obwohl bereits mehrere Techniken eingesetzt wurden, um soL1Rs in normalen Neuronen anzuzeigen, wurden in allen Studien inkonsistente soL1R-Raten berichtet, die zwischen 0,04 und 13,7 soL1Rs pro Neuron lagen25,26,27,28,29,30.

Um den soL1R-induzierten Mosaikismus in normalen Zellen systematisch zu untersuchen, untersuchten wir Gesamtgenomsequenzen von Kolonien, die aus einzelnen Zellen expandierten (im Folgenden als Klone bezeichnet)2,4. Unsere Ansätze ermöglichten außerdem die gleichzeitige Erstellung von Multi-Omics-Profilen aus identischen Klonen31 und die genaue Erkennung früher embryogener Ereignisse, die von mehreren Klonen geteilt wurden2,4,5.

Insgesamt untersuchten wir 899 Gesamtgenomsequenzen von Klonen (Abb. 1a), die aus kolorektalem Epithel (406 Klone von 19 Spendern), aus an verschiedenen Orten gesammelten Fibroblasten (341 Klone von sieben Spendern)4 sowie hämatopoetischen Stamm- und Vorläuferzellen (140) hergestellt wurden Klone von einem Spender)9 und MUTYH-assoziierte adenomatöse Polypen im Dickdarm (12 Klone von vier Polypen eines Spenders). Zusätzlich untersuchten wir 19 passende Darmkrebsgewebe von Spendern normaler kolorektaler Klone (Ergänzungstabelle 1). Anhand dieser Sequenzen haben wir somatisch erworbene Mutationen bewertet, einschließlich Einzelnukleotidvarianten (SNVs), Indels, Strukturvariationen und soL1Rs (Ergänzungstabelle 1). Diese Mutationen bestätigten, dass die überwiegende Mehrheit der Klone aus einer einzelnen nicht-neoplastischen Gründerzelle ohne häufige kulturassoziierte Artefakte entstanden waren (Extended Data Abb. 1a, b).

a, Experimentelles Design der Studie. HSC, hämatopoetische Stamm- und Vorläuferzellen. b, Anteil der Klone mit unterschiedlicher Anzahl an soL1Rs über verschiedene Zelltypen hinweg (Anzahl der Klone in Klammern angegeben). c, Anteil normaler kolorektaler Klone mit unterschiedlicher Anzahl an soL1Rs bei 19 Individuen (Anzahl der Klone in Klammern angegeben). d: Lineare Regression der durchschnittlichen Anzahl von soL1Rs pro Klon im Alter bei 19 Personen mit normalen kolorektalen Klonen. Die vertikale Linie, die jeden Punkt kreuzt, zeigt den Bereich der soL1R-Belastung pro Klon in jedem Individuum an. Die blaue Linie stellt die Regressionslinie dar und die schattierten Bereiche geben das 95-%-Konfidenzintervall an. Zwei Ausreißer (HC15 und HC06) sind rot hervorgehoben. e,f, Frühe klonale Phylogenien von HC14 (e) und HC19 (f), rekonstruiert durch somatische Punktmutation. Die Länge der Zweige ist proportional zur Anzahl der somatischen Mutationen, die durch Zahlen neben den Zweigen angezeigt werden. Frühe embryonale Zweige werden durch die variante Allelfraktion (VAF) früher embryonaler Mutationen (EEMs) im Blut gefärbt. Die Anzahl der erkannten soL1Rs wird in den gefüllten Kreisen an den Spitzen der Zweige angezeigt. Kreisdiagramme zeigen den Anteil der Blutzellen an, die EEM oder soL1R beherbergen. RT-Segment, retrotransponiertes Segment. g, Normalisierte soL1R-Raten in verschiedenen Stadien und Zelltypen.

Unter den 887 normalen und 12 MUTYH-assoziierten adenomatösen Klonen identifizierten wir 1.250 bzw. 458 soL1Rs durch eine kombinierte Analyse mit vier verschiedenen Bioinformatik-Tools (Extended Data Abb. 1c und Ergänzungstabellen 1 und 2). Bemerkenswert ist, dass soL1R-Ereignisse aufgrund der beiden kanonischen Merkmale der Retrotransposition – dem Poly-A-Schwanz und der Duplikation der Zielstelle (TSD; Extended Data Abb. 1d, e) – klar von anderen genomischen Umlagerungen unterschieden wurden. Mehrere Hinweise deuten darauf hin, dass es sich bei den meisten soL1Rs in Klonen eher um echte somatische Ereignisse als um kulturbedingte Ereignisse handelte (Ergänzende Diskussion 1 und ergänzende Abbildung 1). Darüber hinaus fanden wir 572 soL1Rs aus den 19 übereinstimmenden Krebsarten, von denen 97,2 % (n = 556) klonale Ereignisse waren, die allen Krebszellen im Gewebe gemeinsam waren. Für die anderen Retrotransposontypen konnten wir zusätzlich neun somatische Alu-Insertionen in normalen Klonen nachweisen (Ergänzungstabelle 2).

Von den 1.250 soL1Rs in den 887 gesunden Klonen wurden 98,9 % (n = 1.236) aus kolorektalem Epithel nachgewiesen und zeigten eine extreme Zelltypspezifität (P = 9,0 × 10–173, zweiseitiger exakter Fisher-Test). Die meisten normalen kolorektalen Klone (n = 359, 88 %) enthielten mindestens einen soL1R, durchschnittlich drei Ereignisse pro Klon (Abb. 1b). Bemerkenswerterweise waren soL1Rs häufiger anzutreffen als andere klassische Arten somatischer Strukturvariationen in Klonen (Extended Data, Abb. 1f).

Im kolorektalen Epithel fanden wir erhebliche Unterschiede in der soL1R-Belastung zwischen Klonen und Individuen. Die soL1R-Belastung in kolorektalen Klonen lag zwischen null und 18 pro Klon (Abb. 1c). Im Durchschnitt zeigten die soL1R-Belastungen einen breiten, aber positiven Zusammenhang mit dem Alter der Individuen (0,028 soL1Rs pro Klon und Jahr; Abb. 1d), ähnlich der uhrähnlichen Eigenschaft endogener somatischer SNVs und Indels (Extended Data Abb. 2a)32 . Dies impliziert, dass soL1Rs im Laufe des Lebens mit einer mehr oder weniger konstanten Hintergrundrate im kolorektalen Epithel erworben werden. Zwei Ausreißer weisen außerdem auf eine genetische Veranlagung und/oder Umwelteinflüsse hin, die L1-Aktivitäten stimulieren (Abb. 1d).

Die soL1R-Belastungen waren nicht stark mit anderen Merkmalen wie dem Geschlecht und der anatomischen Lage der Klone im Dickdarm verbunden (Extended Data Abb. 2b, c). Auf der Ebene einzelner Klone zeigte die soL1R-Belastung keinen deutlichen Zusammenhang mit anderen genomischen Merkmalen wie Punktmutationslast, Telomerlänge, Aktivität zellendogener SNV-Prozesse33 (SBS1 und SBS5/40; Standardsignaturen in der COSMIC-Datenbank) und Exposition zu reaktiven Sauerstoffspezies (SBS18) oder Colibactin aus pks+ Escherichia coli34 (SBS88) (Extended Data Abb. 2d – i).

SoL1Rs in normalen Zellen sind nicht auf das kolorektale Epithel beschränkt, da wir in 259 per Laser erfassten mikrodissezierten (LCM) Patches von 13 Organen weitere 37 entdeckt haben (Erweiterte Daten, Abb. 2j und Ergänzungstabelle 3). Diese Belastungen sollten jedoch nicht direkt mit denen von kolorektalen Klonen verglichen werden, da die Nachweisempfindlichkeit von soL1R bei der LCM-basierten Gesamtgenomsequenzierung beeinträchtigt ist (WGS; ergänzende Diskussion 2 und ergänzende Abbildungen 2 und 3).

Von den 1.250 soL1Rs in normalen Klonen wurden 30 von zwei oder mehr Klonen in einem Individuum gemeinsam genutzt (zehn Ereignisse bei Kollaps), was bedeutet, dass diese Ereignisse in den jüngsten gemeinsamen Vorfahrenzellen der Klone vorhanden waren. Entwicklungsphylogenien der Klone, die mithilfe postzygoter Mutationen rekonstruiert wurden, wie zuvor berichtet (Abb. 1e, f und Extended Data Abb. 3 und 4), zeigten deutlich, dass es sich bei diesen soL1Rs um embryonale Ereignisse handelte. Beispielsweise wurde ein soL1R-Ereignis in HC14, das von sechs kolorektalen Klonen (sechs von 19 Klonen, 32 % Klonhäufigkeit) gemeinsam genutzt wird, in einer Ahnenzelle am Knoten der zweiten Generation in der Phylogenie erfasst (Abb. 1e). Zusätzlich zur Position des Knotens stützte die Anzahl der postzygoten Punktmutationen (n = 5) im Ahnenknoten die Annahme, dass das Ereignis beim Embryo im Vier-Zellen-Stadium auftrat, da die ersten beiden Zellgenerationen in der menschlichen Entwicklung stattfanden erzeugen 2,4–3,8 Mutationen pro Zelle und Zellteilung (pcpcd) und spätere Zellgenerationen erzeugen 0,7–1,2 Mutationen pcpcd4,5. Wie für ein Prägastrulationsereignis erwartet, wurde soL1R in einer etwa 200-fachen Gesamtgenomsequenz des peripheren Blutes (mesodermaler Ursprung) mit einer Zellhäufigkeit von etwa 34 % jenseits des kolorektalen Epithels (endodermaler Ursprung; Abb. 1e) beobachtet. In ähnlicher Weise wurde wahrscheinlich auch eine somatische Alu-Insertion, die in HC04 gefunden wurde, im Prägastrulationsstadium erhalten (Extended Data Abb. 4).

Bei den anderen neun gemeinsamen soL1Rs handelte es sich wahrscheinlich um embryonale Ereignisse nach der Gastrulation, wenn man die stromabwärts gelegenen Positionen und die molekulare Zeit ihrer angestammten Knoten in der Phylogenie berücksichtigt (16–56 Punktmutationen der molekularen Zeit, entsprechend der 11.–78. Zellgeneration unter der Annahme der oben genannten Fixpunktmutationsrate). in der Embryogenese)4,5 und das Fehlen von soL1Rs in etwa 200-fachen Blutgenomsequenzen (Abb. 1f und Extended Data Abb. 3 und 4).

Zum Vergleich verschiedener Stadien und Zelltypen haben wir die soL1R-Raten berechnet, indem wir die Anzahl der soL1R-Ereignisse pro Anzahl endogener Punktmutationen gezählt haben32,33 (EPMs; definiert als SBS1- und SBS5/40-SNVs sowie ID1- und ID2-Indels). Die soL1R-Rate in terminalen kolorektalen Ästen (postentwicklungsbedingtes kolorektales Epithel) betrug 1,2 pro 1.000 EPM (Abb. 1g). Diese Rate war etwa viermal höher in embryonalen Ästen nach der Gastrulation, die sich in kolorektales Epithel differenzierten (4,52 pro 1.000 EPMs, P = 8,4 × 10−4, zweiseitiger exakter Poisson-Test), entsprechend zwischen 1,1 × 10−3 und 9,0 × 10− 3 soL1R pcpcd (unter der Annahme einer festen frühen endogenen Punktmutationsrate4,5). Die Punktschätzung für die soL1R-Rate in Prägastrulationszweigen betrug 1,06 pro 1.000 EPMs, obwohl wir einen solchen Fall bei 28 Personen fanden (Abb. 1e). Im Gegensatz dazu lagen die Raten für Blut- und Fibroblastenlinien bei nahezu Null pro 1.000 EPM, unabhängig vom Embryonal- und Postentwicklungsstadium (Abb. 1g).

Die retrotransponierten Segmente in soL1Rs normaler kolorektaler Klone waren größtenteils die 3'-Fraktion repetitiver L1-Sequenzen (n = 1.063, 89 %; bekannt als Solo-L1; Abb. 2a)16. Gelegentlich wurden die eindeutigen Downstream-Sequenzen von L1-Quellen mit oder ohne L1-Sequenzen retrotransponiert (bekannt als Partnered- (n = 11, 1 %) bzw. Orphan-Transduktionen (n = 124, 10 %; Abb. 2a)16. Bei Transduktionsereignissen ist die Fingerabdruckerkennung ihrer Quellelemente möglich, indem die eindeutigen Sequenzen als Barcode von L1-Quellen verwendet werden16.

a, Schematische Darstellung von drei Klassen der L1-Retrotransposition: Solo-L1, Partner-Transduktion und Orphan-Transduktion. b, Die Landschaft der Transduktionsereignisse mit den Merkmalen von 34 rc-L1s. TD, Transduktion; AFR, Afrikaner; EUR, Europäer; EAS, Ostasiaten; SAS, Südasiaten; AMR, Amerikaner. c, Zusammenhang zwischen der Populationsallelfrequenz von rc-L1s und ihrer normalisierten Retrotranspositionsaktivität. Grüne Punkte zeigen private Quellen an, die nur bei einer Person gefunden wurden; Rote Punkte zeigen vorherrschend aktive Quellen an; Schwarze und graue Punkte zeigen gemeinsame Quellen an, die zu irgendwelchen bzw. keinen Transduktionsereignissen in unserer Studie beigetragen haben. Die blaue Linie stellt die Regressionslinie der aktiven, aber nicht vorherrschenden Quellen dar und die schattierten Bereiche geben das 95 %-Konfidenzintervall an. TPAM, Anzahl der Transduktionen pro L1-Allel pro 1 Million endogener Punktmutationen der molekularen Zeit. d, Anteil der L1-Unterfamilie und Prävalenz verkürzter Mutationen von rc-L1-Quellen in ihrer gesamten PAF. Gruppen mit PAF < 25, 25 < PAF < 75 und PAF > 75 haben jeweils zehn, 34 und 90 L1-Quellen.

Durch die Kombination von kolorektalen Klonen und Krebsgeweben fanden wir 217 Transduktionsereignisse mit 34 L1-Quellen, die diese umfassten, was ihre Retrotranspositionskompetenz bestätigte (Abb. 2b und Ergänzungstabelle 4). Davon waren 12 (35 %) neue rc-L1, da sie nicht mit 264 zuvor bekannten aktiven Quellen überlappten12,13,16,17,18,19,20,21. Die neuen rc-L1-Quellen umfassen drei Typen: (1) eine referenzierte Keimbahnquelle (sowohl im menschlichen Referenzgenom als auch in der Keimbahn des Individuums vorhanden), (2) sieben nicht referenzierte Keimbahnquellen (im Referenzgenom nicht vorhanden). aber in der Keimbahn vorhanden) und (3) vier postzygotisch erworbene Quellen, die sowohl im Referenzgenom als auch in der Keimbahn fehlen (Erweiterte Daten, Abb. 5). Bemerkenswert ist, dass vier neue nicht referenzierte Keimbahnquellen (17q25.3, 1q23.3-1, 1p22.1 und 2q21.1-2; Abb. 2b und Ergänzungstabelle 4) für eine Person privat waren und nicht beobachtet wurden Unser Keimbahnpanel umfasst 2.860 Individuen aus fünf Vorfahren. Dies weist darauf hin, dass der Erwerb neuer rc-L1-Quellen im menschlichen Genompool im Gange ist, wie aus bevölkerungsbasierten Genomstudien hervorgeht12,21,35.

Jede der 34 rc-L1-Quellen trug zu einer unterschiedlichen Anzahl von Transduktionen in kolorektalen Klonen bei (Abb. 2b). Beispielsweise betrafen vier L1-Quellen (22q12.1-2, 1p12, Xp22.2-1 und 12p13.32) einen großen Teil (mindestens 50 %) der Personen und verursachten etwa 50 % der somatischen Transduktionsereignisse in unserer Studie . Diese vier rc-L1 waren in der Population weit verbreitet und zeigten eine Populations-Allelfrequenz (PAF) von etwa 100 % im menschlichen Genompool (Abb. 2b).

Mit Ausnahme dieser vier „prävalent aktiven“ rc-L1s zeigten rc-L1s mit hohem PAF eine niedrige soL1R-Aktivität im kolorektalen Epithel. Die meisten der 90 rc-L1 mit PAF über 75 % trugen entweder zu keinem (81, 90 %) oder einem soL1R-Ereignis (4, 4 %) in den 406 kolorektalen Klonen bei. Im Gegensatz dazu wurden seltene Quellelemente häufig in mehreren Klonen eines Individuums, dessen Quelle sich in der Keimbahn befand, retrotransponiert. Beispielsweise steuerte die private Quelle 17q25.3 sechs Ereignisse in 22 kolorektalen Klonen von HC13 bei (Abb. 2b).

Um Retrotranspositionsaktivitäten über verschiedene Quellelemente hinweg zu vergleichen, wurden Transduktionen von jedem rc-L1 pro L1-Allel pro 1 Million EPMs molekularer Zeit (als TPAM bezeichnet) in normalen kolorektalen Abstammungslinien bei Personen gezählt, die die Quelle beherbergen. Interessanterweise zeigten die TPAM-Raten im Allgemeinen eine negative Korrelation mit der PAF von rc-L1s (Abb. 2c). Seltene Quellen zeigten höhere Retrotranspositionsaktivitäten als vorherrschende Quellen, mit Ausnahme der vier vorherrschend aktiven rc-L1s. Diese Merkmale stehen im Einklang mit der umgekehrten Beziehung zwischen der Prävalenz und Penetranz menschlicher Genomvarianten36. Da rc-L1 eine potenziell schädliche Insertionsmutagenese verursachen kann, sollte seine Aktivität durch genetische und/oder epigenetische Mechanismen unterdrückt werden. Ultraseltene Quellen gehen wahrscheinlich einer ausreichenden negativen Selektion voraus, da sie erst vor relativ kurzer Zeit in der menschlichen Bevölkerung aufgetaucht sind12.

Um die genetische Grundlage der unterschiedlichen Aktivitäten zwischen rc-L1s zu verstehen, untersuchten wir Sequenzpolymorphismen der Quellelemente mithilfe von Long-Read-WGS zweier kolorektaler Klone. Populationsprävalente Quellelemente befanden sich überwiegend in den älteren L1-Unterfamilien (z. B. Prä-Ta und PA2), wie bereits vermutet12, und wiesen häufiger Mutationen auf, die den offenen Leserahmen stören als seltene Quellelemente (Abb. 2d und Ergänzungstabelle 4).

Um die epigenetischen Grundlagen unterschiedlicher rc-L1-Aktivitäten in normalen Zellen zu untersuchen, kombinierten wir die DNA-Methylierung des gesamten Genoms (in 139 Klonen) und RNA-Expressionsprofile (in 116 Klonen) in einer Untergruppe etablierter Klone (Abb. 1a und 3a). Wie für Massengewebe berichtet16,37 stellten diese Klone eine starke negative Korrelation zwischen ortsspezifischer Methylierung und Transkription des L1-Promotors dar (Extended Data Abb. 6), was darauf hindeutet, dass die Demethylierung des L1-Promotors ein Hauptschalter für die L1-Transkription ist.

a, Schematische Darstellung der mehrdimensionalen Analyse. b, Panorama des DNA-Methylierungsstatus von 30 rc-L1s mit Entwicklungsphylogenien für 132 normale kolorektale Klone und sieben Fibroblastenklone von neun Individuen. Es umfasst 14 rc-L1, die zu Transduktionsereignissen in diesen Klonen beitragen, und 16 weitere rc-L1, die in mindestens fünf Klonen demethylierte Promotoren aufweisen. Die Anzahl der verzweigungsspezifischen Punktmutationen ist in den Phylogenien angegeben. c,d, DNA-Methylierungsstatus und Readthrough-Transkriptionsniveau von rc-L1 bei 22q12.1-2 (c) und 12p13.32 (d). e, Anteil der Nichttrunkierung und Promotor-Demethylierung von 90 in der Bevölkerung vorherrschenden rc-L1s. Rote Punkte, vorherrschend aktive Quellen; schwarze und graue Punkte, gemeinsame Quellen, die in unserer Studie alle bzw. keine Transduktionsereignisse zeigen. f, Unterschiede in der Methylierung des rc-L1-Promotors in Klonpaaren entsprechend ihrer embryonalen Verzweigungszeit. Berücksichtigt wurden die 30 besten rc-L1, die erhebliche Unterschiede in der Promotormethylierung zeigten. Eine feste Mutationsrate4 wurde verwendet, um die Mutationszeit in die Erzeugung embryonaler Zellen umzuwandeln. %P, Prozentpunkt; *P < 2,2 × 10−16 (Kolmogorov-Smirnov-Test bei zwei Stichproben). g,h, Methylierungsprofil von 100 kb stromaufwärts und stromabwärts gelegenen Regionen von rc-L1 bei 22q12.1-2 (g) und 1p12 (h). Die rc-L1-Loci werden durch gelbe Rechtecke hervorgehoben. Oben: Genomkoordinaten und Reihenfolge der CpG-Standorte. Mitte: Anteil an methyliertem CpG in kolorektalen (Gold) und Fibroblasten-Klonen (Silber) (g) sowie in kolorektalen Klonen mit offenen (orange) und geschlossenen (blau) Promotoren (h). Unten: Unterschiede im Anteil an methyliertem CpG, dargestellt im mittleren Feld. mCpG, methyliertes CpG.

Die Häufigkeit der Promotor-Demethylierung (und die daraus resultierende Transkription) variierte je nach Zelltyp und Quellelement (Abb. 3b, erweiterte Daten Abb. 7, ergänzende Diskussion 3 und ergänzende Abb. 4 und 5). Obwohl die rc-L1-Promotoren in Fibroblastenklonen überwiegend methyliert waren, waren sie in kolorektalen Klonen häufig deutlich demethyliert. Beispielsweise zeigten Promotoren der vorherrschend aktiven Quellen 22q12.1-2 und 12p13.32 eine häufige biallelische Demethylierung (und daraus resultierende RNA-Transkription) in kolorektalen Klonen (Abb. 3b – d). Gelegentlich war die klonale Häufigkeit einer Demethylierung des rc-L1-Promotors bei bestimmten Personen häufiger, wie in den Quellen 5q14.1-1 und 14q12-3 beobachtet (Abb. 3b). DNA-Methylierungsprofile des gesamten Genoms aus verschiedenen Massengeweben legen nahe, dass Dickdarmgewebe eine höhere Häufigkeit der Demethylierung des rc-L1-Promotors aufweist als jeder andere Zelltyp (Extended Data Abb. 8a).

Bemerkenswert ist, dass wir beobachteten, dass in der Bevölkerung weit verbreitete rc-L1 häufig durch Promotormethylierung und/oder genetische Verkürzung unterdrückt wurden. Von den 90 in der Bevölkerung vorherrschenden rc-L1s (PAF > 75 %) zeigten 68 (75,6 %) eine vorherrschende Promotormethylierung in mehr als 75 % der kolorektalen Klone (Abb. 3e). Von den anderen 22 rc-L1s, die nicht bevorzugt promotormethyliert waren (z. B. 12q13.13), wiesen zehn offene, den Leserahmen verkürzende Mutationen in allen informativen Allelen aus der Long-Read-Sequenzierung auf. Die verbleibenden 12 rc-L1, insbesondere die vier vorherrschend aktiven Quellen (22q12.1-2, Quellen39.

Die mehrdimensionale Analyse lieferte außerdem vier Einblicke in die epigenetische Regulierung von Quellelementen und die anschließende soL1R-Aktivität. Erstens ist die Demethylierung des rc-L1-Promotors eine Voraussetzung für soL1Rs. Ein Quellelement, das Transduktionsereignisse in einem Klon verursacht, war im entsprechenden Klon immer Promotor-demethyliert (Abb. 3b; 47 von 47, hervorgehoben durch rote Rechtecke; 37 homozygote und zehn heterozygote Demethylierungen). Dies weist weiter darauf hin, dass der demethylierte rc-L1-Promotor in somatischen Abstammungslinien über die Zeit stabil ist, da seine umgekehrte Methylierung eine solche exklusive Assoziation zerstören würde.

Zweitens wird der Epigenotyp des L1-Promotors hauptsächlich in der Embryogenese bestimmt. Die Demethylierung des autosomalen rc-L1-Promotors war überwiegend homozygot (Abb. 3b – d), was darauf hindeutet, dass sie direkt von der epigenetischen Reprogrammierung vor der Gastrulation vererbt wird, die DNA-Methylierungen im Genom global entfernt 40, 41, 42. Ein alternatives Szenario, ein stochastischer Methylierungsverlust im Alterungsprozess, ist weniger wahrscheinlich, da dadurch die Demethylierung bevorzugt in einem Allel beeinflusst wird. Unsere Ergebnisse legen vielmehr nahe, dass vollständig demethylierte rc-L1-Promotoren, die im frühesten Embryonalstadium geformt wurden, anschließend in kolorektalen Epithellinien nicht ausreichend remethyliert werden (Abb. 3b). Die Remethylierung sollte in Fibroblastenlinien gründlicher sein, da Fibroblastenklone eine nahezu vollständige Methylierung des rc-L1-Promotors zeigten (Abb. 3b). Die molekulare Zeit in den klonalen Phylogenien weist auch darauf hin, dass der Remethylierungsprozess des rc-L1-Promotors überwiegend im Postgastrulationsstadium abläuft. Kolorektale Klone, deren letzte gemeinsame Stammzelle in den 17–65 embryonalen Mutationen der molekularen Zeit (12.–90. Zellgeneration, unter der Annahme der oben genannten festen frühen Mutationsrate4,5; nahe der Gastrulation bis zur Organogenese) lag, zeigten eine höhere Übereinstimmung der Promotorepigenotypen für eine rc-L1-Quelle (77 % Konkordanzrate, 1.446 von 1.885 Klon-L1-Paaren) als Klone, die früher divergierten (Abb. 3b – d, f).

Drittens ist der Bereich unzureichender Remethylierung auf den Promotor von rc-L1 beschränkt und unabhängig von anderen Genomregionen. Trotz des extremen Unterschieds im Promotormethylierungsgrad der vorherrschend aktiven 22q12.1-2-Quelle zwischen Fibroblasten- und kolorektalen Klonen zeigten beispielsweise ihre 100 kb großen stromaufwärtigen und stromabwärtigen Regionen sehr ähnliche DNA-Methylierungsprofile (Abb. 3g). Ebenso stimmten die DNA-Methylierungsniveaus benachbarter und genomweiter Regionen weitgehend zwischen kolorektalen Klonen überein, unabhängig vom Epigenotyp des L1-Promotors (Abb. 3h und erweiterte Daten Abb. 8b, c).

Schließlich sind die meisten L1-Transkripte in Bezug auf soL1Rs in normalen Zellen unproduktiv. Ein kolorektaler Klon hat 17–42 rc-L1-Allele mit Promotor-Demethylierung (Abb. 3b), und ihre Transkriptomsequenzen legen nahe, dass eine kolorektale Epithellinie im Laufe eines Lebens kontinuierlich mehreren rc-L1-Transkripten ausgesetzt ist (durchschnittlich 0,6 Fragmente pro Kilobase Transkript). pro Million zugeordneter Lesevorgänge (FPKM), wenn alle rc-L1s aggregiert sind; Erweiterte Daten Abb. 7)43. Allerdings erwirbt ein Klon im Laufe seines Lebens etwa drei soL1Rs, was auf das Vorhandensein eines aktiven Abwehrmechanismus schließen lässt, der die Retrotransposition von L1-Transkripten in normalen Zellen schützt.

Die Zielstellen von soL1Rs waren sowohl in normalen Zellen als auch in Krebszellen im gesamten Genom weit verbreitet (Erweiterte Daten, Abb. 9a). SoL1Rs in normalen Klonen wurden häufiger in Regionen mit L1-Endonuklease-Zielstellenmotiven (190-fach; 95 %-Konfidenzintervall (KI) 78,8–459) und spät replizierende Regionen (5,89-fach; 95 %-KI 4,48–7,74) eingefügt zuvor bei Krebserkrankungen beobachtet17, obwohl Chromatinzustände und Transkriptionsniveaus einen relativ geringen Effekt zeigten (Extended Data Abb. 9b).

Wir beobachteten einen erheblichen Grad an soL1R-Depletion in den funktionellen Regionen des Genoms, wie er in der Keimbahn L1s44 beobachtet wurde. Unter den 1.250 soL1Rs in normalen Klonen fanden wir nur ein Ereignis, das ein Exon eines proteinkodierenden Gens betraf, das eine 29-fach geringere Häufigkeit als zufällig erwartet aufwies (P = 1,9 × 10−11, zweiseitiger exakter Poisson-Test). In ähnlicher Weise wurden soL1Rs häufiger in Regionen mit geringer Gendichte beobachtet (Extended Data Abb. 9c). SoL1R-kombinierte genomische Umlagerungen, die 1 % der soL1Rs in Krebsgeweben ausmachten17, wurden in normalen Klonen nicht beobachtet. Unsere Daten zeigten außerdem, dass soL1R-Ereignisse keine zusätzlichen Mutationen, Genexpressions-/Spleißveränderungen oder DNA-Methylierungsveränderungen in nahegelegenen Regionen von Retrotranspositionsstellen hervorriefen (Erweiterte Daten, Abb. 9d – f). Wir spekulieren, dass Klone mit funktionell schädigenden soL1Rs in normalen Zellen negativ selektiert wurden.

Wir haben die Bruchpunktsequenzen an soL1R-Zielstellen weiter untersucht, um Rückschlüsse auf die mechanistischen Prozesse der L1-Insertionen zu ziehen. Zusätzlich zu den beiden kanonischen Merkmalen (TSD und Poly-A-Schwanz), die durch zielbasierte reverse Transkription erworben werden (Prozess A; Abb. 4a, b), zeigte ein erheblicher Teil der soL1Rs Sequenzvariationen im 5'-Kopfteil der retrotransponierten Segmente, gekennzeichnet durch (1) kurze Inversion im intraretrotransponierten (intraRT) Körper (n = 354; 29,5 %), (2) kurze Foldback-Inversion (invertierte Duplikation) im 5′ stromaufwärts der Zielstelle (n = 3; 0,3 %) oder (3) beides (n = 1; 0,1 %). Diese Sequenzvariationen können durch den Twin-Priming-Mechanismus (Prozess B; Abb. 4b)45 und zusätzliche DNA-Synthese (ca. 52–220 Basenpaare (bp)) möglicherweise durch DNA-Polymerasen bei der endgültigen Auflösung der L1-vermittelten Insertionsmutagenese erklärt werden ( Prozess C; Abb. 4b). Ein weiteres gelegentliches Ereignis wurde bei einem aus einem Adenom etablierten Klon beobachtet, bei dem ein Teil der Vorläufer-mRNA, die in der Nähe der Insertionsstelle transkribiert wurde, revers transkribiert und in das Genom co-inseriert wurde, was auf einen Strangwechsel der Reverse Transkriptase hindeutet (Extended Daten Abb. 9g). Diese Merkmale veranschaulichen zusammen, dass soL1Rs nicht durch vollständig geordnete und lineare Prozesse erworben werden, sondern mehrere optionale Ereignisse stochastisch involviert sein können46.

a,b, Schematische Darstellungen genomischer Strukturen kanonischer und komplexer L1-Insertionen (a) und zugrunde liegender Mechanismen (b). RT-Körper, retrotransponierter Körper; DSB, Doppelstrangbruch. c, Phylogenie von MUTYH-assoziierten adenomatösen Klonen mit normalisierten L1-Raten in Gruppen von Abstammungslinien, klassifiziert nach Treibermutationen. Die Verzweigungslängen sind proportional zur molekularen Zeit, gemessen an der Anzahl somatischer Punktmutationen. Die Anzahl der branchenspezifischen soL1Rs und branchenspezifischen Treibermutationen wird angezeigt.

Interessanterweise fanden wir zwei Klone, von denen jeder Transduktionen an unterschiedlichen genomischen Zielstellen aufwies, aber genau die gleiche Länge eindeutiger Sequenzen aufwies (Extended Data, Abb. 9h). Angesichts der Tatsache, dass Poly-A-Tailing ein zufälliges Ereignis bei der Durchlesetranskription ist, legen unsere Ergebnisse nahe, dass mehrere soL1R-Ereignisse aus einem einzelnen L1-Transkript möglich sind.

Die soL1R-Belastung in den 19 übereinstimmenden kolorektalen Karzinomen zeigte eine erhebliche Varianz zwischen vier und 105 (Abb. 1b). Die durchschnittliche soL1R-Belastung betrug 30 pro Krebs und war damit etwa zehnmal häufiger als bei normalen kolorektalen Klonen. Die soL1R-Rate lag bei kolorektalen Karzinomen bei 3,47 pro 1.000 EPM und ist damit etwa dreifach höher als bei normalem kolorektalem Epithel (Extended Data Abb. 10a). Qualitativ führten soL1Rs in Tumoren zu tiefgreifenderen Veränderungen, einschließlich einer längeren Insertlänge (1.031 gegenüber 453 bp für Solo-L1, P = 8,6 × 10−20, zweiseitiger t-Test; 755 gegenüber 615 bp für Partnertransduktionen, P = 0,59). , zweiseitiger Wilcoxon-Rangsummentest; und 530 gegenüber 242 bp für Orphan-Transduktionen, P = 0,004, zweiseitiger t-Test; Erweiterte Daten Abb. 10b) und eine höhere Häufigkeit von Variationen der Kopfsequenz (41,8 gegenüber 29,9 %, P = 9,6 × 10−7, zweiseitiger exakter Test nach Fisher; Erweiterte Daten Abb. 10c). Unsere Ergebnisse deuten auf eine zulässige Bedingung für die L1-Retrotransposition bei der Tumorentwicklung hin, die nicht unbedingt der klassischen Genominstabilität bei Krebserkrankungen entspricht. Beispielsweise zeigten TP53-inaktivierende Mutationen sowie Mikrosatelliten- und Chromosomeninstabilität keine robuste Korrelation mit soL1R-Belastungen bei Darmkrebs (Extended Data Abb. 10d, e). Obwohl die chromosomale Instabilität bei Bauchkrebserkrankungen mit mehr als 2.600 Krebsfällen signifikant war17 (Erweiterte Daten, Abb. 10f, g), war der Zusammenhang bei jedem histologischen Tumortyp schwach und inkonsistent (Erweiterte Daten, Abb. 11).

Bei MUTYH-assoziierten adenomatösen Klonen wurde eine Beschleunigung der soL1R-Rate während der Tumorentwicklung beobachtet. Im Entwicklungsbaum adenomatöser Polypen stieg die soL1R-Rate, je näher die Abstammungslinien dem Karzinom kamen und sich mehr Treibermutationen anhäuften. Beispielsweise war die soL1R-Rate in Abstammungslinien mit drei Treibermutationen (Loss-of-Function-Mutationen in APC und ARID1A und eine Gain-of-Function-Mutation in KRAS) drei- bis fünfmal höher als in Abstammungslinien ohne markierte Driver (Abb. 4c).

Unsere Ergebnisse zeigen, dass zellendogene L1-Elemente in normalen somatischen Abstammungslinien zur Retrotransposition führen und dass Dickdarmepithelzellen 0,028 soL1R-Ereignisse pro Jahr erwerben. Die Mobilisierung beginnt in der frühen menschlichen Embryogenese, noch vor der Gastrulation, wie bereits zuvor beobachtet13,47. Das Repertoire von rc-L1 wird von den Eltern geerbt und ihre epigenetische Aktivierung wird überwiegend im postgastrulationsembryonalen Stadium bestimmt, das dann im Alter robust in der somatischen Linie weitergegeben wird (Abb. 5). Angesichts der Anzahl der Krypten im Dickdarm (10 Millionen)48 würden bei Personen in den Sechzigern insgesamt 20 Millionen Retrotranspositionsereignisse im kolorektalen Epithel auftreten. Ein kleiner Teil dieser L1-Insertionen kann phänotypische Veränderungen in mutierten Zellen hervorrufen und zu menschlichen Krankheiten wie Krebs beitragen17.

Schematische Darstellung, die Faktoren veranschaulicht, die die soL1R-Landschaft beeinflussen. Die genetische Zusammensetzung von rc-L1 wird von den Eltern geerbt. Die Methylierungslandschaft der rc-L1-Promotoren wird überwiegend durch die globale DNA-Demethylierung bestimmt, gefolgt von Remethylierungsprozessen in den Entwicklungsstadien. Wenn dann ein rc-L1-Promotor in einer bestimmten Zelllinie demethyliert wird, exprimiert die Quelle L1-Transkripte und ermöglicht so die Induktion von soL1Rs.

Mehrere komplementäre Methoden, darunter Tiefensequenzierung6, Amplifikation des gesamten Genoms8, Duplex-DNA-Sequenzierung49, LCM5,10,11 und In-vitro-Einzelzellexpansionen2,4,7,9, können verwendet werden, um somatisch erworbene genomische Veränderungen in normalen Zellen zu untersuchen. Obwohl klonale Erweiterungen arbeitsintensiv sind und nur auf sich teilende Zellen anwendbar sind, haben sie grundlegende Vorteile31, darunter (1) die Implementierung einer empfindlichen und präzisen Mutationserkennung auf absoluter Einzelzellebene, (2) die Erleichterung zusätzlicher Multi-Omics-Profilierung in derselben Einzelzelle Klonen und (3) Ermöglichen der Erforschung früher Entwicklungsbeziehungen von Klonen.

Obwohl unsere Analysen auf einige Mechanismen hinweisen, müssen in der Dynamik der L1-Retrotransposition in normalen Zellen noch viele Dinge entdeckt werden. Aufgrund ihrer repetitiven Natur sind Sequenzen von Quellelementen und soL1Rs für kurze Lesevorgänge weitgehend unzugänglich. Die mechanistische Grundlage der Locus- und Zelltypspezifität bei der differentiellen Promotor-Demethylierung ist rätselhaft. Zur Beantwortung dieser Fragen sind umfassendere Panoramen einer größeren Anzahl einzelner Zellen unterschiedlicher Zelltypen zu verschiedenen Zeitpunkten des Alterungs- und Krankheitsverlaufs und durch innovativere Sequenzierungstechniken50 erforderlich.

Für die In-vitro-Etablierung klonaler Organoide aus kolorektalen Geweben wurden gesunde Schleimhautgewebe aus chirurgischen Proben von 19 Patienten gewonnen, die sich einer elektiven Tumorentfernungsoperation unterzogen (Ergänzungstabelle 1). Normales Gewebe (ungefähr 1 × 1 × 1 cm3 groß) wurde aus einer Region geschnitten, die mehr als 5 cm vom Primärtumor entfernt war. Für die Massengewebe-WGS wurden auch passende Blut- und kolorektale Tumorgewebe derselben Patienten gesammelt.

Durch Koloskopie wurden frische Biopsien von einem Patienten mit MUTYH-assoziierter familiärer adenomatöser Polyposis gewonnen. Aus vier Polypen wurden Gewebe (ungefähr 0,5 × 0,5 × 0,5 cm3 groß) geschnitten. Es wurden auch passendes Blut und Wangenschleimhautgewebe desselben Patienten gesammelt.

Alle Gewebe wurden innerhalb von 8 Stunden nach dem Entnahmevorgang für Organoidkulturexperimente ins Labor transportiert. Alle Verfahren in dieser Studie wurden vom Institutional Review Board des Seoul National University Hospital (Genehmigungsnummer 1911-106-1080) und KAIST (Genehmigungsnummer KH2022-058) genehmigt und von allen Studienteilnehmern wurde eine Einverständniserklärung eingeholt. Diese Studie wurde im Einklang mit der Deklaration von Helsinki und ihren späteren Änderungen durchgeführt. Zur Bestimmung der Stichprobengröße wurden keine statistischen Methoden verwendet. Die Experimente wurden ohne Randomisierung durchgeführt und die Forscher waren während der experimentellen Verfahren und der Datenanalyse nicht verblindet.

Wir haben öffentlich verfügbare Gesamtgenomsequenzen von Einzelzell-expandierten Klonen einbezogen, um ein vollständigeres Bild der L1-Retrotransposition in verschiedenen menschlichen Geweben zu erhalten. Wir haben 474 Gesamtgenomsequenzen aus zwei früheren Datensätzen einbezogen, eine für hämatopoetische Zellen (140 Klone von einem Individuum)9 und eine für mesenchymale Fibroblasten aus unserer vorherigen Arbeit (334 Klone von sieben Individuen)4. Darüber hinaus haben wir 259 Gesamtgenomsequenzen einbezogen, die aus LCM-basierten Patches hergestellt wurden, die aus 13 Organen präpariert wurden, die in einer früheren Studie untersucht wurden 5,11. Darüber hinaus untersuchten wir 578 Gesamtgenomsequenzen, die aus LCM-basierten Flecken kolorektalen Gewebes generiert wurden,51 um Unterschiede in der Empfindlichkeit für den soL1R-Nachweis zwischen LCM- und klonalen Expansionsmethoden zu untersuchen.

Um die PAF von rc-L1s zu verstehen, haben wir 2.852 öffentlich verfügbare Gesamtgenomsequenzen normaler Gewebe mit bekannten Informationen zur ethnischen Zugehörigkeit gesammelt. Diese Daten wurden aus verschiedenen Studien52,53,54,55,56,57 erhoben.

Um den Einfluss des Grads der Genominstabilität auf die Häufigkeit von soL1Rs in Tumoren zu verstehen, haben wir Variantenaufrufe des ICGC/TCGA Pan-Cancer Analysis of Whole-Genome (PCAWG) Consortium weiter untersucht, das 2.677 Krebsarten umfasste und mit normalen Gesamtgenome übereinstimmte. Genomsequenzen für rund 40 Tumorarten17,53. SoL1Rs aus PCAWG-Proben finden Sie in einem früheren Artikel17. Weitere vom Konsortium generierte somatische Mutationsaufrufe (einschließlich TP53-inaktivierender Mutationen, struktureller Variationen und Mutationssignaturen) stehen unter https://dcc.icgc.org/releases/PCAWG zum Download bereit. Unsere in der Analyse verwendete Matrix ist in der Ergänzungstabelle 5 verfügbar, die Treibermutationen von 19 übereinstimmenden Darmkrebsarten enthält, die mit CancerVision (Genome Insight) identifiziert wurden.

Alle Organoid-Etablierungsverfahren und Medienzusammensetzungen wurden mit geringfügigen Änderungen aus der Literatur übernommen58. Schleimhautgewebe wurden in etwa 5 mm große Abschnitte geschnitten und mit PBS gewaschen. Die Gewebe wurden in konischen 50-ml-Röhrchen in 10 mM EDTA (Invitrogen) überführt und anschließend 30 Minuten lang bei Raumtemperatur unter Schütteln inkubiert. Nach der Inkubation wurden die Röhrchen vorsichtig geschüttelt, um die Krypten vom Bindegewebe zu trennen. Der Überstand wurde gesammelt und 20 μl Suspension wurden unter einem Stereomikroskop beobachtet, um das Vorhandensein von Krypten zu überprüfen. Die Kryptussuspension wurde 3 Minuten lang bei 300 relativer Zentrifugalkraft zentrifugiert und das Pellet einmal mit PBS gewaschen, um die Ischämiezeit zu verkürzen. Isolierte Krypten wurden in wachstumsfaktorreduziertes Matrigel (Corning) eingebettet und auf einer 12-Well-Platte (TPP) ausplattiert. Die Ausplattierung von Krypten wurde bei begrenzter Verdünnung durch Modifikation des Protokolls aus einer früheren Studie durchgeführt59. Kurz gesagt, etwa 2.000 Krypten wurden in 900 μl Matrigel überführt und 3 × 150 μl Tröpfchen wurden in drei Vertiefungen einer Platte mit 12 Vertiefungen ausplattiert. Als nächstes wurden 450 μl Matrigel zur restlichen Verdünnung hinzugefügt und das Ausplattieren von drei Tröpfchen in drei Vertiefungen wiederholt. Die Serienverdünnung wurde mindestens viermal durchgeführt und die letzte verbleibende Verdünnung wurde in sechs Vertiefungen ausplattiert. Die Platten wurden für 5–10 Minuten in einen Inkubator bei 37 °C überführt, um das Matrigel zu verfestigen. Jede Vertiefung wurde mit 1 ml organoidem Kulturmedium überschichtet, dessen Zusammensetzung in der Ergänzungstabelle 6 beschrieben ist.

Die Primärkultur aus großen und verdünnten Krypten wurde mindestens 10 Tage lang aufrechterhalten, um die anfängliche Masse des aus einer Krypta stammenden Organoids sicherzustellen. Nach dem Wachstum der Organoide wurde ein einzelnes Exemplar manuell mit einer 200-μl-Pipette unter einem Umkehrmikroskop entnommen. Das entnommene Organoid wurde in ein Eppendorf-Röhrchen gegeben und mit einer 1-ml-Spritze mit einer 25-G-Nadel unter TrypLE Express (Gibco) dissoziiert. Als nächstes folgte auf die Blockierung von TrypLE durch ADF+++ (Advanced DMEM/F12 mit 10 mM HEPES, 1× GlutaMAX und 1 % Penicillin-Streptomycin) Zentrifugation und Waschen. Das Pellet wurde in eine einzelne Vertiefung einer Platte mit 24 Vertiefungen gegeben. Die Platten wurden in einen befeuchteten Inkubator mit 37 °C/5 % CO2 überführt und das Medium alle 2–3 Tage gewechselt. Nach erfolgreicher Passage wurden klonale Organoide auf eine 12-Well-Platte übertragen und weiter expandiert. Konfluente Klone wurden für die Nukleinsäureextraktion und den Organoidstamm gesammelt.

Kultivierte, aus Einzelkrypten stammende Organoide wurden mit TrypLE Express geerntet und dissoziiert. Nach der Blockierung von TrypLE und dem Waschen wurden die Organoide mit ADF+++ resuspendiert. Organoidsuspensionen wurden durch ein 40-μm-Sieb (Falcon) filtriert, dann wurden einzelne Zellen mit einem Zellsortierer (FACSMelody, BD Biosciences) in ein FACS-Röhrchen sortiert. Einzelne Zellen wurden basierend auf Vorwärts- und Seitenstreueigenschaften gemäß dem Protokoll des Herstellers ausgewählt. Sortierte Zellen wurden in 12-Well-Platten spärlich mit wachstumsfaktorreduziertem Matrigel (500 pro Well) ausgesät. Gewachsene reklonalisierte einzelne Organoide wurden manuell ausgewählt und mit den oben beschriebenen Methoden expandiert.

Wir haben sieben Fibroblastenklone für die Methylierungsanalyse erhalten. Dermale Hautfibroblasten wurden mit einer zuvor beschriebenen Methode kultiviert4. Kurz gesagt, Hautproben wurden mit PBS (Gibco) gewaschen und Fettgewebe und Blutgefäße entfernt. Die verbleibenden Gewebe wurden in kleine Stücke (1–2 mm2) geschnitten und 1 Stunde lang bei 37 °C mit 1 mg ml–1 Kollagenase/Dispase-Lösung (Roche) behandelt. Nach der Behandlung wurde die Epidermisschicht von der Hautschicht getrennt und letztere mit DMEM-Medium gewaschen, das 20 % FBS (Gibco) enthielt, um die Kollagenase/Dispase-Aktivität zu hemmen. Anschließend wurde das Hautgewebe in kleine Stücke zerkleinert und in mit Kollagen I beschichteten 24-Well-Platten (Corning) mit 200 µl Medium in einem befeuchteten Inkubator bei 37 °C und 5 % CO2-Konzentration kultiviert.

Für die Illumina-Sequenzierung extrahierten wir genomische DNA-Materialien aus klonal expandierten Zellen, verglichen peripheres Blut und kolorektale Tumorgewebe mit entweder dem DNeasy Blood and Tissue Kit (Qiagen) oder dem Allprep DNA/RNA Kit (Qiagen) gemäß dem Protokoll des Herstellers. DNA-Bibliotheken wurden mit Truseq DNA PCR-Free Library Prep Kits (Illumina) erstellt und entweder auf der Illumina HiSeq X Ten-Plattform oder der NovaSeq 6000-Plattform sequenziert. Kolorektale Klone wurden im gesamten Genom mit einer mittleren 17-fachen Abdeckungstiefe sequenziert. Übereinstimmende periphere Blut- und kolorektale Tumorgewebe wurden mit einer mittleren Abdeckung von 181 bzw. 35 sequenziert. Für die PacBio-Sequenzierung extrahierten wir genomische DNA aus Dickdarmorganoiden mit dem Circulomics Nanobind Tissue Big DNA Kit (Circulomics) gemäß dem Protokoll des Herstellers. DNA-Bibliotheken wurden mit dem MRTbell Express Template Prep Kit 2.0 (PacBio) erstellt und auf einer PacBio Sequel IIe-Plattform sequenziert.

Die Gesamt-RNA wurde aus klonal expandierten Zellen mit dem Allprep DNA/RNA-Kit (Qiagen) extrahiert. Die gesamte RNA-Sequenzierungsbibliothek wurde mit dem Truseq Stranded Total RNA Gold Kit (Illumina) gemäß dem Protokoll des Herstellers erstellt.

Genomische DNA wurde aus klonal expandierten Zellen entweder mit dem DNeasy Blood and Tissue Kit (Qiagen) oder dem Allprep DNA/RNA Kit (Qiagen) extrahiert. Die Bibliotheken wurden aus 200 ng Input-DNA mit Kontroll-DNA (CpG-methylierte pUC19- und CpG-unmethylierte Lambda-DNA) unter Verwendung des NEBNext Enzymatic Methylation-seq-Kits (NEB) gemäß dem Protokoll des Herstellers hergestellt. Die Paired-End-Sequenzierung wurde mit der NovaSeq 6000-Plattform (Illumina) durchgeführt.

Sequenzierte Lesevorgänge wurden mithilfe des Burrows-Wheeler-Aligner (BWA)-MEM-Algorithmus60 auf das menschliche Referenzgenom (GRCh37) abgebildet. Doppelte Lesevorgänge wurden entweder von Picard (verfügbar unter http://broadinstitute.github.io/picard) oder SAMBLASTER61 entfernt. Wie bereits berichtet, haben wir SNVs und Short-Indels identifiziert4. Kurz gesagt, Basensubstitutionen und kurze Indels wurden mit Haplotypecaller2 (Ref. 62) und VarScan2 (Ref. 63) aufgerufen. Um Variantensätze mit hoher Konfidenz zu erstellen, haben wir Varianten mit den folgenden Merkmalen entfernt: (1) 1 % oder mehr VAF im normalen Panel, (2) hoher Anteil an Indels oder Clipping (über 70 %), (3) drei oder mehr nicht übereinstimmende Basen in den Varianten-Lesevorgängen und (4) häufiges Auftreten von Fehler-Lesevorgängen in anderen Klonen.

Wir haben somatische Strukturvariationen auf ähnliche Weise wie in unserem vorherigen Bericht identifiziert4. Wir haben strukturelle Variationen mithilfe von DELLY64 mit passenden Blutproben und phylogenetisch entfernten Klonen benannt, um sowohl frühe embryonale als auch somatische Mutationen beizubehalten. Wir haben dann Varianten mit den folgenden Merkmalen verworfen: (1) das Vorhandensein von Normalen im Panel, (2) unzureichende Anzahl unterstützender Lesepaare (weniger als zehn Lesepaare ohne unterstützendes SA-Tag oder weniger als drei nicht übereinstimmende Lesepaare mit einem unterstützenden). SA-Tag) und (3) viele nicht übereinstimmende Messwerte in übereinstimmenden Blutproben. Um alle verbleibenden falsch-positiven Ereignisse zu entfernen und falsch-negative Ereignisse in der Nähe von Haltepunkten zu retten, haben wir alle Umlagerungen, die den Filterprozess durchlaufen, mit Integrative Genomics Viewer65 visuell überprüft.

Wir haben L1-Retrotranspositionen unter Verwendung von MELT20, TraFiC-mem16, DELLY64 und xTea66 mit passenden Blutproben und phylogenetisch entfernten Klonen aufgerufen, um sowohl frühe embryonale als auch somatische Mutationen beizubehalten. Potenzielle Keimbahnrufe, die sich mit Ereignissen überschneiden, die in nicht übereinstimmenden Blutproben gefunden wurden, wurden entfernt. Um die Zuverlässigkeit der Anrufe zu bestätigen und verbleibende falsch-positive Ereignisse zu entfernen, haben wir alle soL1R-Kandidaten visuell untersucht und uns dabei auf zwei unterstützende Beweise konzentriert: (1) Poly-A-Schwänze und (2) Duplikationen der Zielstelle mit dem Integrative Genomics Viewer65. Darüber hinaus haben wir Varianten mit einer geringen Anzahl unterstützender Lesevorgänge (weniger als 10 % aller Lesevorgänge) ausgeschlossen, um potenzielle Artefakte auszuschließen. Wir haben die 5′- und 3′-Enden des eingefügten Segments erhalten, um sowohl die Größe von soL1Rs zu berechnen als auch zu bestimmen, ob L1-Inversion oder L1-vermittelte Transduktion kombiniert wurden. Wenn beide Enden des Einsatzes auf gegenüberliegenden Strängen abgebildet waren, wurde die Variante als invertiert betrachtet. Als das eingefügte Segment auf einzigartige und sich nicht wiederholende Genomsequenzen abgebildet wurde, in denen sich ein L1-Element voller Länge innerhalb einer 15 kb großen Upstream-Region befindet, stellten wir fest, dass die L1-Insertion mit der 3'-Transduktion kombiniert und vom L1-Element abgeleitet war auf der Upstream-Region einzigartiger Sequenzen. Um die VAF von soL1Rs zu berechnen, haben wir die Anzahl der L1-unterstützenden Lesepaare durch die Gesamtzahl der informativen Lesepaare um Einfügungsstellen geteilt. Ein Lesepaar galt als informativ, wenn der Bereich, der seinen Anfang und sein Ende abdeckte, über den Einfügungshaltepunkt hinausging. Darüber hinaus haben wir bei der Berechnung der Gesamtzahl der informativen Lesepaare die Anzahl der referenzunterstützenden Lesepaare zweimal gezählt, da die Einfügung durch Lesepaare an beiden Enden der Einfügung unterstützt wird. Um klonale L1-Insertionen in Krebsproben zu identifizieren, haben wir einen Grenzwert festgelegt, der auf dem minimalen Zellfraktionswert gemeinsamer soL1Rs in normalen kolorektalen Klonen basiert, da gemeinsame soL1Rs als echte Varianten gelten. Wir haben den gleichen Ansatz für andere Einfügungen mobiler Elemente verwendet, einschließlich Alu und SVA.

Um Mutationssignaturen in unseren Proben zu extrahieren, verwendeten wir drei verschiedene Tools (internes Skript, SigProfiler67 und hierarchische Dirichlet-Prozesse68), um einen Konsenssatz von Mutationssignaturen für jede Art von Dickdarmprobe zu erzielen, einschließlich normaler Epithelzellen, Adenome und Karzinome. Kurz gesagt, unser hauseigenes Skript basiert auf einer nichtnegativen Matrixfaktorisierung mit oder ohne verschiedene mathematische Einschränkungen und übernimmt Kernmethoden des Vorgängers von SigProfiler69, wie z. B. die Verwendung eines Stabilitätsmaßes und eines Rekonstruktionsfehlers für die Modellauswahl; Es bietet jedoch eine größere Flexibilität bei der Untersuchung eines breiteren Spektrums möglicher Lösungen, einschließlich solcher, die von SigProfiler übersehen werden können, und ermöglicht einen bewussten Ansatz zur Bestimmung der Anzahl vermuteter Mutationsprozesse. Als Ergebnis haben wir eine Untergruppe von Signaturen ausgewählt, die das gegebene Mutationsspektrum am besten erklären: SBS1, SBS5, SBS18, SBS40, SBS88, SBS89, ID1, ID2, ID5, ID9, ID18 und IDB für normale kolorektale Epithelzellen; SBS1, SBS5, SBS18, SBS36, SBS40, ID1, ID2, ID5 und ID9 für MUTYH-assoziiertes Adenom; und SBS1, SBS2, SBS5, SBS13, SBS15, SBS17a, SBS17b, SBS18, SBS21, SBS36, SBS40, SBS44, SBS88, ID1, ID2, ID5, ID9, ID12, ID14 und ID18 für Darmkrebs. Alle Signaturen werden bekannten Mutationssignaturen zugeschrieben, die ab Version 3.2 der COSMIC-Mutationssignatur (verfügbar unter https://cancer.sanger.ac.uk/cosmic/signatures) verfügbar sind, und IDB, einer neu gefundenen Signatur aus früheren Untersuchungen normale kolorektale Epithelzellen51, aber noch nicht in der COSMIC-Mutationssignatur katalogisiert.

Wir haben den phylogenetischen Baum der Kolonien und den Hauptklon des Krebsgewebes eines Individuums rekonstruiert, indem wir eine n × m-Matrix erstellt haben, die den Genotyp von n Mutationen von m Proben darstellt, wie zuvor durchgeführt4. Kurz gesagt, SNVs und kurze Indels aus allen Proben eines Individuums wurden zusammengeführt und nur Varianten mit fünf oder mehr kartierten Lesevorgängen in allen Proben einbezogen, um eine falsche Genotypisierung bei geringer Abdeckung zu vermeiden. Darüber hinaus wurden Varianten mit VAF < 0,25 in allen Proben entfernt, um mögliche Sequenzierungsartefakte auszuschließen. Wenn der VAF der i-ten Mutation in der j-ten Probe mehr als 0,1 betrug, wurde Mij 1 zugewiesen; andernfalls 0. Mutationen, die in allen Proben vorhanden waren, wurden als Keimbahnvarianten betrachtet und verworfen. Wir haben alle Mutationen nach der Art der Proben, in denen sie gefunden wurden, gruppiert und die hierarchische Beziehung zwischen den Mutationsgruppen erstellt. Kurz gesagt: Wenn die Proben der Mutationsgruppe A zusätzlich zu anderen Proben alle Proben der Mutationsgruppe B enthalten, ist die Mutationsgruppe B der Mutationsgruppe A untergeordnet. Anschließend haben wir den phylogenetischen Baum rekonstruiert, der die Hierarchie der Mutationsgruppen am besten erklärt. Der endgültige phylogenetische Baum ist ein Wurzelbaum, in dem jede Probe (Kolonie) an einen Endknoten des Baums gebunden ist, wobei die Anzahl der Mutationen in der entsprechenden Mutationsgruppe der Länge des Zweigs entspricht. Bei Krebsproben stellt die Länge der Zweige klonale Punktmutationen mit Krebszellfraktionen von mehr als 0,7 dar. Um die molekulare Zeit (Anzahl der frühen Mutationen) in physische Zellgenerationen umzurechnen, verwendeten wir eine Mutationsrate von 2,4–3,8 pcpcd für die ersten beiden Zellteilungen und dann 0,7–1,2 pcpcd, die aus einer früheren Arbeit geschätzt wurden4,5.

Bei der Berechnung der soL1R-Raten haben wir Punktmutationen in phylogenetischen Bäumen in vier verschiedene Stadien eingeteilt: Prägastrulation, Postgastrulation, Alterung (Postentwicklung) und Tumorentstehung. Mutationen, die von mehreren Klonen gemeinsam genutzt und in Sequenzen des gesamten Genoms des Blutes nachgewiesen wurden (mesodermaler Ursprung), wurden als prägastrulationell angesehen. Mutationen in frühen Zweigen4,51,70, die jedoch nicht in Sequenzen des gesamten Genoms des Blutes gefunden wurden, wurden als postgastrulationell angesehen. Bei allen anderen Mutationen in normalen Klonen wurde davon ausgegangen, dass sie sich während des Alterungsprozesses angesammelt hatten. Für Mutationen im Alter und bei der Tumorentstehung haben wir diejenigen gezählt, die auf endogene Mutationsprozesse zurückzuführen sind (SBS1 und SBS5/40 für SNVs, ID1 und ID2 für Indels), um zusätzliche Mutationen durch externe Karzinogenexposition auszuschließen. Bei Mutationen in Tumoren zählten wir klonale Punktmutationen (Krebszellfraktionen größer als 0,7), um subklonale Mutationen auszuschließen. Schließlich berechneten wir die soL1R-Raten in jedem Stadium, indem wir die Anzahl der soL1Rs durch die Gesamtzahl der endogenen Punktmutationen dividierten. Die Berechnung der soL1R-Rate für die Tumorentstehung umfasste nur nicht hypermutierte Tumoren.

Um die PAF von rc-L1-Quellen zu berechnen, haben wir 2.852 öffentlich verfügbare und acht interne (insgesamt 2.860) Gesamtgenomsequenzen normaler Gewebe mit bekannten ethnischen Informationen (714 Afrikaner, 588 Europäer, 538 Südasiaten, 646 Ostasiaten und 374) gesammelt Amerikaner)52,53,54,55,56,57. Zunächst stellten wir fest, ob Individuen rc-L1s in ihrem Genom hatten. Kurz gesagt, wir haben den Anteil der L1-unterstützenden Lesevorgänge für Nicht-Referenz-L1 bzw. den Anteil der Lesevorgänge mit kleiner Einfügungsgröße, die einer L1-Löschung entgegenstehen, für Referenz-L1 berechnet. Es wurde angenommen, dass nur rc-L1s mit einem Anteil von 15 % oder mehr im Genom vorhanden sind. Anschließend haben wir die PAF eines bestimmten rc-L1 als Anteil der Personen mit L1 in der Population berechnet.

Sequenzierte Lesevorgänge wurden mithilfe von pbmm2 (https://github.com/PacificBiosciences/pbmm2), einem Wrapper für minimap2 (Ref. 71), auf das menschliche Referenzgenom (GRCh37) abgebildet. Sequenzen für L1-unterstützende Lesevorgänge in der Nähe von Quellelementen wurden extrahiert und mithilfe von BWA60 den L1HS-Konsensussequenzen18 zugeordnet. Als nächstes identifizierten wir Sequenzvariationen von Quellelementen, einschließlich verkürzender Mutationen, und ordneten jedes Quellelement den entsprechenden L1-Unterfamilien zu21.

Sequenzierte Lesevorgänge wurden mit Cutadapt72 verarbeitet, um Adaptersequenzen zu entfernen. Zugeschnittene Lesevorgänge wurden mithilfe von Bismark73 auf das Genom abgebildet, das das menschliche Referenzgenom (GRCh37) kombiniert, das durch den Einbau von L1-Konsensussequenzen an den Nicht-Referenz-L1-Quellstellen, pUC19- und Lambda-DNA-Sequenzen modifiziert wurde. Für eine einzelne CpG-Stelle wurden die Anzahl der Lesevorgänge, die die Methylierung unterstützen (C oder G), die Anzahl der Lesevorgänge, die die Demethylierung unterstützen (A oder T), und der Anteil früherer Lesevorgänge an den Gesamtlesevorgängen (Methylierungsanteil) mithilfe von Bismark berechnet. Die Wirksamkeit der Konvertierung wurde mithilfe von Messwerten geschätzt, die auf CpG-methylierter pUC19- und CpG-unmethylierter Lambda-DNA kartiert wurden. Um den Gesamtmethylierungsstatus zu beobachten, untersuchten wir den Methylierungsanteil in Regionen im Bereich von 600 bp stromaufwärts bis 600 bp stromabwärts der L1-Transkriptionsstartstelle für jedes L1-Quellelement. Anschließend konzentrierten wir uns auf CpG-Stellen, die sich zwischen der Startstelle der L1-Transkription und der 250 bp stromabwärts gelegenen Region (+1 bis +250) befinden, und klassifizierten jede CpG-Stelle entsprechend dem Methylierungsanteil in eine von drei Kategorien: homozygote Demethylierung (Methylierungsanteil unter 25 %). , heterozygot (Methylierungsanteil mindestens 25 % und Methylierungsanteil unter 75 %) und homozygot (Methylierungsanteil mindestens 75 %). Als nächstes wurden den CpG-Stellen Methylierungswerte zugewiesen (0 für homozygote Demethylierung, 5 für heterozygote und 10 für homozygote Methylierung) und durch Mittelung der Werte aller CpG-Stellen in der Region +1 bis +250 des L1-Elements zusammengefasst. Abschließend verglichen wir den Methylierungs-Score für jede Probe und jedes bekannte Quellenelement, um die Beziehung zwischen Methylierungsstatus und Quellenaktivierung zu bestimmen.

Für die Analyse des L1-Promotor-Methylierungsgrads in Massengeweben haben wir Bisulfit-Sequenzierungsdaten des gesamten Genoms von 16 verschiedenen Geweben von Roadmap Epigenomics74 heruntergeladen. Die Roadmap-Codes sind E050 BLD.MOB.CD34.PC.F (Mobilized_CD34_Primary_Cells_Female), E058 SKIN.PEN.FRSK.KER.03 (Penis_Foreskin_Keratinozyten_Primary_Cells_skin03), E066 LIV.ADLT (Adult_Leber), E071 BRN.HIPP.MID (Brain_Hippocampus_Middle). ), E079 GI.ESO (Ösophagus), E094 GI.STMC.GAST (Magen), E095 HRT.VENT.L (Linker Ventrikel), E096 LNG (Lunge), E097 OVRY (Eierstock), E098 PANC (Bauchspeicheldrüse), E100 MUS.PSOAS (Psoas_Muscle), E104 HRT.ATR.R (Right_Atrium), E105 HRT.VNT.R (Right_Ventricle), E106 GI.CLN.SIG (Sigmoid_Colon), E109 GI.S.INT (Small_Darm) und E112 THYM (Thymus). Die Methylierungsanteile von CpG-Stellen in referenzierten L1-Quellen wurden gesammelt und zusammengefasst, indem der Anteil aller CpG-Stellen in der Region +1 bis +250 des L1-Elements gemittelt und dann der gemittelte L1-Promotor-Methylierungsgrad in verschiedenen Geweben verglichen wurde.

Sequenzierte Lesevorgänge wurden mit Cutadapt72 verarbeitet, um Adaptersequenzen zu entfernen. Zugeschnittene Lesevorgänge wurden mithilfe des BWA-MEM-Algorithmus60 auf das menschliche Referenzgenom (GRCh37) abgebildet. Doppelte Lesevorgänge wurden von SAMBLASTER61 entfernt. Um das Expressionsniveau jedes L1-Quellelements zu identifizieren, haben wir Lesevorgänge gesammelt, die auf Regionen bis zu 1 kb stromabwärts vom 3′-Ende des Quellelements abgebildet wurden, und den FPKM-Wert berechnet. Es wurden nur Lesevorgänge in derselben Richtung wie das Quellelement berücksichtigt. Wenn sich das Quellelement auf dem Gen befand und beide auf demselben Strang lagen, wurde der FPKM-Wert nicht berechnet, da der Ursprung der Lesevorgänge in der Downstream-Region nicht eindeutig ist.

Die L1-Einfügungsrate wurde als Gesamtzahl der soL1Rs pro Schiebefenster von 10 MB mit einem Inkrement von 5 MB berechnet. Um die Beziehung zwischen der L1-Insertionsrate und anderen genomischen Merkmalen bei Einzelnukleotidauflösung zu untersuchen, verwendeten wir einen zuvor beschriebenen statistischen Ansatz17,75. Kurz gesagt, wir haben das Genom für jedes der genomischen Merkmale in vier Klassen (0–3) unterteilt, einschließlich Replikationszeit, DNA-Überempfindlichkeit, Histonmarkierung (H3K9me3 und H3K36me3), RNA-Expression und Nähe zum kanonischen L1-Endonuklease-Motiv (hier definiert). entweder als TTTT|R (wobei R A oder G ist) oder Y|AAAA (wobei Y C oder T ist)). Durch den Vergleich der Bruchpunktsequenzen mit dem L1-Endonuklease-Motiv haben wir Genomregionen mit mehr als vier (am unterschiedlichsten), drei, zwei und weniger als einer (am ähnlichsten) Fehlpaarung zum L1-Endonuklease-Motiv den Bins 0, 1, 2 und 3 zugeordnet , jeweils. DNA-Überempfindlichkeits- und Histonmarkierungsdaten des Roadmap Epigenomics Consortium wurden durch Mittelung des Fold-Enrichment-Signals über acht Zelltypen zusammengefasst. Genomregionen mit einem Fold-Enrichment-Signal von weniger als 1 gehörten zu Bin 0, und der Rest wurde in drei gleich große Bins unterteilt: Bin 1 (am wenigsten angereichert), Bin 2 (mäßig angereichert) und Bin 3 (am stärksten angereichert). RNA-Sequenzierungsdaten wurden auch von Roadmap und FPKM erhalten und über acht Zelltypen gemittelt. Regionen ohne Ausdruck (FPKM = 0) gehören zu Bin 0 und der Rest wurde in drei gleich große Bins unterteilt: Bin 1 (am wenigsten ausgeprägt), Bin 2 (mäßig ausgeprägt) und Bin 3 (am stärksten ausgeprägt). Die Replikationszeit wurde durch Mittelung von acht ENCODE-Zelltypen verarbeitet, und Genomregionen wurden in vier gleich große Regionen geschichtet: Bin 0 enthielt Regionen mit der spätesten Replikationszeit und Bin 3 enthielt Regionen mit der frühesten Replikationszeit. Für jedes Merkmal wurden Anreicherungswerte durch Vergleich der Abschnitte 1–3 mit Abschnitt 0 berechnet. Daher sollte der Protokollwert des Anreicherungspunktes für Abschnitt 0 gleich 0 sein und wird in Diagrammen nicht beschrieben.

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Portfolio Reporting Summary.

Daten zum Gesamtgenom, zur DNA-Methylierung und zur Transkriptomsequenzierung sind im Europäischen Genom-Phänomen-Archiv unter der Zugangsnummer hinterlegt. EGAS00001006213 und stehen für allgemeine Forschungszwecke zur Verfügung. Das menschliche Referenzgenom GRCh37 ist unter https://www.ncbi.nlm.nih.gov/data-hub/genome/GCF_000001405.13 verfügbar.

Eigene Skripte für Analysen stehen auf GitHub (https://github.com/ju-lab/colon_LINE1) zur Verfügung.

Stratton, MR, Campbell, PJ & Futreal, PA Das Krebsgenom. Natur 458, 719–724 (2009).

Artikel CAS PubMed PubMed Central ADS Google Scholar

Behjati, S. et al. Die Genomsequenzierung normaler Zellen deckt Entwicklungslinien und Mutationsprozesse auf. Natur 513, 422–425 (2014).

Artikel CAS PubMed PubMed Central ADS Google Scholar

Ju, YS et al. Somatische Mutationen offenbaren eine asymmetrische Zelldynamik im frühen menschlichen Embryo. Natur 543, 714–718 (2017).

Artikel CAS PubMed PubMed Central ADS Google Scholar

Park, S. et al. Klonale Dynamik in der frühen menschlichen Embryogenese, abgeleitet aus somatischen Mutationen. Natur 597, 393–397 (2021).

Artikel CAS PubMed ADS Google Scholar

Coorens, THH et al. Umfangreiche Phylogenien der menschlichen Entwicklung, abgeleitet aus somatischen Mutationen. Natur 597, 387–392 (2021).

Artikel CAS PubMed ADS Google Scholar

Martincorena, I. et al. Tumorentwicklung. Hohe Belastung und allgegenwärtige positive Selektion somatischer Mutationen in normaler menschlicher Haut. Wissenschaft 348, 880–886 (2015).

Artikel CAS PubMed PubMed Central ADS Google Scholar

Blokzijl, F. et al. Gewebespezifische Mutationsakkumulation in menschlichen adulten Stammzellen während des Lebens. Natur 538, 260–264 (2016).

Artikel CAS PubMed PubMed Central ADS Google Scholar

Lodato, MA et al. Alterung und Neurodegeneration gehen mit vermehrten Mutationen in einzelnen menschlichen Neuronen einher. Wissenschaft 359, 555–559 (2018).

Artikel CAS PubMed ADS Google Scholar

Lee-Six, H. et al. Populationsdynamik von normalem menschlichem Blut, abgeleitet aus somatischen Mutationen. Natur 561, 473–478 (2018).

Artikel CAS PubMed PubMed Central ADS Google Scholar

Moore, L. et al. Die Mutationslandschaft des normalen menschlichen Endometriumepithels. Natur 580, 640–646 (2020).

Artikel CAS PubMed ADS Google Scholar

Moore, L. et al. Die Mutationslandschaft menschlicher Körper- und Keimbahnzellen. Natur 597, 381–386 (2021).

Artikel CAS PubMed ADS Google Scholar

Ebert, P. et al. Haplotyp-aufgelöste verschiedene menschliche Genome und integrierte Analyse struktureller Variationen. Wissenschaft 372, eabf7117 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Sanchez-Luque, FJ et al. LINE-1 Umgehung der epigenetischen Repression beim Menschen. Mol. Zelle 75, 590–604.

Artikel CAS PubMed Google Scholar

Lander, ES et al. Erste Sequenzierung und Analyse des menschlichen Genoms. Natur 409, 860–921 (2001).

Artikel CAS PubMed ADS Google Scholar

Kazazian, HH Jr. Mobile Elemente: Treiber der Genomentwicklung. Wissenschaft 303, 1626–1632 (2004).

Artikel CAS PubMed ADS Google Scholar

Tubio, JMC et al. Mobile DNA bei Krebs. Umfangreiche Transduktion nichtrepetitiver DNA, vermittelt durch L1-Retrotransposition in Krebsgenomen. Science 345, 1251343 (2014).

Artikel PubMed PubMed Central Google Scholar

Rodriguez-Martin, B. et al. Pan-Krebs-Analyse ganzer Genome identifiziert Treiberumlagerungen, die durch LINE-1-Retrotransposition gefördert werden. Nat. Genet. 52, 306–319 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Brouha, B. et al. Heiße L1s sind für den Großteil der Retrotransposition in der menschlichen Bevölkerung verantwortlich. Proz. Natl Acad. Wissenschaft. USA 100, 5280–5285 (2003).

Artikel CAS PubMed PubMed Central ADS Google Scholar

Beck, CR et al. LINE-1-Retrotranspositionsaktivität im menschlichen Genom. Zelle 141, 1159–1170 (2010).

Artikel CAS PubMed PubMed Central Google Scholar

Gardner, EJ et al. Das Mobile Element Locator Tool (MELT): Entdeckung und Biologie mobiler Elemente im Bevölkerungsmaßstab. Genomres. 27, 1916–1929 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Chuang, NT et al. Mutagenese menschlicher Genome durch endogene mobile Elemente im Populationsmaßstab. Genomres. 31, 2225–2235 (2021).

Artikel PubMed PubMed Central Google Scholar

Kazazian, HH Jr et al. Hämophilie A, die aus der De-novo-Insertion von L1-Sequenzen resultiert, stellt einen neuartigen Mutationsmechanismus beim Menschen dar. Natur 332, 164–166 (1988).

Artikel CAS PubMed ADS Google Scholar

Ostertag, EM & Kazazian, HH Jr. Biologie der L1-Retrotransposons von Säugetieren. Annu. Pfr. Fr. Genet. 35, 501–538 (2001).

Artikel CAS PubMed Google Scholar

Lee, E. et al. Landschaft der somatischen Retrotransposition bei menschlichen Krebserkrankungen. Wissenschaft 337, 967–971 (2012).

Artikel CAS PubMed PubMed Central ADS Google Scholar

Coufal, NG et al. L1-Retrotransposition in menschlichen neuralen Vorläuferzellen. Natur 460, 1127–1131 (2009).

Artikel CAS PubMed PubMed Central ADS Google Scholar

Baillie, JK et al. Somatische Retrotransposition verändert die genetische Landschaft des menschlichen Gehirns. Natur 479, 534–537 (2011).

Artikel CAS PubMed PubMed Central ADS Google Scholar

Evrony, GD et al. Einzelneuronen-Sequenzierungsanalyse der L1-Retrotransposition und somatischen Mutation im menschlichen Gehirn. Zelle 151, 483–496 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Evrony, GD et al. Zelllinienanalyse im menschlichen Gehirn unter Verwendung endogener Retroelemente. Neuron 85, 49–59 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Upton, KR et al. Allgegenwärtiger L1-Mosaikismus in Hippocampus-Neuronen. Zelle 161, 228–239 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Erwin, JA et al. L1-assoziierte Genomregionen werden in somatischen Zellen des gesunden menschlichen Gehirns gelöscht. Nat. Neurosci. 19, 1583–1591 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Youk, J., Kwon, HW, Kim, R. & Ju, YS Zerlegen von Einzelzellgenomen mithilfe der klonalen Organoidtechnik. Exp. Mol. Med. 53, 1503–1511 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Alexandrov, LB et al. Uhrartige Mutationsprozesse in menschlichen Körperzellen. Nat. Genet. 47, 1402–1407 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Alexandrov, LB et al. Das Repertoire an Mutationssignaturen bei menschlichem Krebs. Natur 578, 94–101 (2020).

Artikel CAS PubMed PubMed Central ADS Google Scholar

Pleguezuelos-Manzano, C. et al. Mutationssignatur bei Darmkrebs, verursacht durch genotoxische Pks E. coli. Natur 580, 269–273 (2020).

Artikel CAS PubMed PubMed Central ADS Google Scholar

Stewart, C. et al. Eine umfassende Karte der Einfügungspolymorphismen mobiler Elemente beim Menschen. PLoS Genet. 7, e1002236 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

McCarthy, MI et al. Genomweite Assoziationsstudien für komplexe Merkmale: Konsens, Unsicherheit und Herausforderungen. Nat. Rev. Genet. 9, 356–369 (2008).

Artikel CAS PubMed Google Scholar

Iskow, RC et al. Natürliche Mutagenese menschlicher Genome durch endogene Retrotransposons. Zelle 141, 1253–1261 (2010).

Artikel CAS PubMed PubMed Central Google Scholar

ENCODE-Projektkonsortium. Eine integrierte Enzyklopädie der DNA-Elemente im menschlichen Genom. Natur 489, 57–74 (2012).

Artikel ADS Google Scholar

Jachowicz, JW et al. Die Aktivierung von LINE-1 nach der Befruchtung reguliert die globale Zugänglichkeit von Chromatin im frühen Mausembryo. Nat. Genet. 49, 1502–1510 (2017).

Artikel CAS PubMed Google Scholar

Messerschmidt, DM, Knowles, BB & Solter, D. DNA-Methylierungsdynamik während der epigenetischen Reprogrammierung in der Keimbahn und Präimplantationsembryonen. Genes Dev. 28, 812–828 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Guo, H. et al. Die DNA-Methylierungslandschaft menschlicher früher Embryonen. Natur 511, 606–610 (2014).

Artikel CAS PubMed ADS Google Scholar

Smith, ZD et al. DNA-Methylierungsdynamik des menschlichen Präimplantationsembryos. Natur 511, 611–615 (2014).

Artikel CAS PubMed PubMed Central ADS Google Scholar

Mortazavi, A., Williams, BA, McCue, K., Schaeffer, L. & Wold, B. Kartierung und Quantifizierung von Säugetiertranskriptomen durch RNA-Seq. Nat. Methoden 5, 621–628 (2008).

Artikel CAS PubMed Google Scholar

Medstrand, P., van de Lagemaat, LN & Mager, DL Retroelementverteilungen im menschlichen Genom: Variationen im Zusammenhang mit Alter und Nähe zu Genen. Genomres. 12, 1483–1495 (2002).

Artikel CAS PubMed PubMed Central Google Scholar

Ostertag, EM & Kazazian, HH Jr. Twin Priming: ein vorgeschlagener Mechanismus für die Erzeugung von Inversionen bei der L1-Retrotransposition. Genomres. 11, 2059–2065 (2001).

Artikel CAS PubMed PubMed Central Google Scholar

Gilbert, N., Lutz, S., Morrish, TA & Moran, JV Mehrere Schicksale von L1-Retrotranspositionszwischenprodukten in kultivierten menschlichen Zellen. Mol. Zelle. Biol. 25, 7780–7795 (2005).

Artikel CAS PubMed PubMed Central Google Scholar

van den Hurk, JA et al. Die L1-Retrotransposition kann früh in der menschlichen Embryonalentwicklung auftreten. Summen. Mol. Genet. 16, 1587–1592 (2007).

Artikel PubMed Google Scholar

Nguyen, H. et al. Mangelhafte Pms2, ERCC1, Ku86, CcOI bei Felddefekten während der Progression zu Dickdarmkrebs. J. Vis. Exp. 28, 1931 (2010).

Google Scholar

Abascal, F. et al. Somatische Mutationslandschaften mit Einzelmolekülauflösung. Natur 593, 405–410 (2021).

Artikel CAS PubMed ADS Google Scholar

Ewing, AD et al. Die Nanoporensequenzierung ermöglicht eine umfassende epigenomische Profilierung transponierbarer Elemente. Mol. Zelle 80, 915–928 (2020).

Artikel CAS PubMed Google Scholar

Lee-Six, H. et al. Die Landschaft somatischer Mutationen in normalen kolorektalen Epithelzellen. Natur 574, 532–537 (2019).

Artikel CAS PubMed ADS Google Scholar

Lee, JJ-K. et al. Verfolgung von Onkogen-Umlagerungen in der Mutationsgeschichte von Lungenadenokarzinomen. Zelle 177, 1842–1857 (2019).

Artikel CAS PubMed Google Scholar

ICGC/TCGA Pan-Cancer Analysis of Whole Genomes Consortium. Pan-Krebs-Analyse ganzer Genome. Natur 578, 82–93 (2020).

Artikel ADS Google Scholar

1000 Genomes Project Consortium et al. Eine globale Referenz für die genetische Variation des Menschen. Natur 526, 68–74 (2015).

Artikel Google Scholar

Mallick, S. et al. Das Simons Genome Diversity Project: 300 Genome aus 142 verschiedenen Populationen. Natur 538, 201–206 (2016).

Artikel CAS PubMed PubMed Central ADS Google Scholar

Bergström, A. et al. Einblicke in die genetische Variation und Populationsgeschichte des Menschen anhand von 929 verschiedenen Genomen. Wissenschaft 367, eaay5012 (2020).

Artikel PubMed PubMed Central Google Scholar

Lorente-Galdos, B. et al. Die Analyse der gesamten Genomsequenz eines panafrikanischen Probensatzes enthüllt den archaischen Genfluss von einer ausgestorbenen Grundpopulation moderner Menschen in Populationen südlich der Sahara. Genombiol. 20, 77 (2019).

Artikel PubMed PubMed Central Google Scholar

Fujii, M., Matano, M., Nanki, K. & Sato, T. Effiziente Gentechnik menschlicher Darmorganoide mittels Elektroporation. Nat. Protokoll. 10, 1474–1485 (2015).

Artikel CAS PubMed Google Scholar

Jager, M. et al. Messung der Mutationsakkumulation in einzelnen menschlichen adulten Stammzellen durch Sequenzierung des gesamten Genoms organoider Kulturen. Nat. Protokoll. 13, 59–78 (2018).

Artikel CAS PubMed Google Scholar

Li, H. & Durbin, R. Schnelle und genaue Ausrichtung kurzer Lesevorgänge mit der Burrows-Wheeler-Transformation. Bioinformatik 25, 1754–1760 (2009).

Artikel CAS PubMed PubMed Central Google Scholar

Faust, GG & Hall, IM SAMBLASTER: Schnelle Duplikatmarkierung und Extraktion struktureller Variantenlesungen. Bioinformatik 30, 2503–2505 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Van der Auwera, GA et al. Von FastQ-Daten bis hin zu Variantenaufrufen mit hoher Zuverlässigkeit: die Best Practices-Pipeline des Genome Analysis Toolkit. Curr. Protokoll. Bioinformatik 43, 11.10.11–11.10.33 (2013).

Google Scholar

Koboldt, DC et al. VarScan 2: Entdeckung somatischer Mutationen und Kopienzahlveränderungen bei Krebs durch Exomsequenzierung. Genomres. 22, 568–576 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Rausch, T. et al. DELLY: Strukturvariantenerkennung durch integrierte Paired-End- und Split-Read-Analyse. Bioinformatik 28, i333–i339 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Robinson, JT et al. Integrativer Genomik-Viewer. Nat. Biotechnologie. 29, 24–26 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Chu, C. et al. Umfassende Identifizierung transponierbarer Elementeinfügungen mithilfe mehrerer Sequenzierungstechnologien. Nat. Komm. 12, 3836 (2021).

Artikel CAS PubMed PubMed Central ADS Google Scholar

Islam, SMA et al. Aufdeckung neuartiger Mutationssignaturen durch De-novo-Extraktion mit SigProfilerExtractor. Zellgenomik 2, 100179 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Teh, YW, Jordan, MI, Beal, MJ & Blei, DM Hierarchische Dirichlet-Prozesse. Marmelade. Stat. Assoc. 101, 1566–1581 (2006).

Artikel MathSciNet CAS MATH Google Scholar

Alexandrov, LB, Nik-Zainal, S., Wedge, DC, Campbell, PJ & Stratton, MR Entschlüsselung der Signaturen von Mutationsprozessen, die bei menschlichem Krebs wirksam sind. Cell Rep. 3, 246–259 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Mitchell, E. et al. Klonale Dynamik der Hämatopoese über die gesamte menschliche Lebensspanne. Natur 606, 343–350 (2022).

Artikel CAS PubMed PubMed Central ADS Google Scholar

Li, H. Minimap2: Paarweise Ausrichtung für Nukleotidsequenzen. Bioinformatik 34, 3094–3100 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Martin, M. Cutadapt entfernt Adaptersequenzen aus Sequenzierungslesevorgängen mit hohem Durchsatz. EMBnet J 17, 10 (2011).

Artikel Google Scholar

Krueger, F. & Andrews, SR Bismark: ein flexibler Aligner und Methylierungs-Caller für Bisulfit-Seq-Anwendungen. Bioinformatik 27, 1571–1572 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Kundaje, A. et al. Integrative Analyse von 111 menschlichen Referenzepigenomen. Natur 518, 317–330 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Supek, F. & Lehner, B. Geclusterte Mutationssignaturen zeigen, dass fehleranfällige DNA-Reparaturen auf Mutationen in aktiven Genen abzielen. Zelle 170, 534–547 (2017).

Artikel CAS PubMed Google Scholar

Referenzen herunterladen

Wir danken S. Park, R. Kim, B.-K. Koo und GJ Faulkner für ihre Kommentare und Diskussionen. Diese Arbeit wurde von der National Research Foundation of Korea unterstützt und von der koreanischen Regierung finanziert (Nr. NRF-2020R1A3B2078973 an YSJ und NRF-2021R1G1A1009606 an HWK); ein Stipendium des MD-PhD/Medical Scientist Training Program des Korea Health Industry Development Institute, finanziert vom Ministerium für Gesundheit und Soziales der Republik Korea; und von der Suh Kyungbae Foundation (Nr. SUHF-18010082 an YSJ).

Diese Autoren haben gleichermaßen beigetragen: Chang Hyun Nam, Jeonghwan Youk

Graduate School of Medical Science and Engineering, Korea Advanced Institute of Science and Technology, Daejeon, Republik Korea

Chang Hyun Nam, Jeonghwan Youk, Joonoh Lim, Soo A Oh, Hyein Won, Yunah Lee, Jinju Han und Young Seok Ju

Genome Insight, Inc., Daejeon, Republik Korea

Jeonghwan Youk, Jeong Yeon Kim, Joonoh Lim und Young Seok Ju

Abteilung für Innere Medizin, Seoul National University Hospital, Seoul, Republik Korea

Jeonghwan Youk & Hyun Jung Lee

Korea Institute of Science and Technology Information, Daejeon, Republik Korea

Jung Woo Park & ​​Junehawk Lee

Abteilung für Chirurgie, Seoul National University College of Medicine, Seoul, Republik Korea

Ji Won Park, Seung-Yong Jeong und Min Jung Kim

Abteilung für Biowissenschaften, Universität Seoul, Seoul, Republik Korea

Dong-Sung Lee

Abteilung für Anatomie, Medizinische Fakultät, Kyungpook National University, Daegu, Republik Korea

Ji Won Oh

Abteilung für Anatomie, Yonsei University College of Medicine, Seoul, Republik Korea

Ji Won Oh

Abteilung für Nuklearmedizin, Korea University College of Medicine, Seoul, Republik Korea

Hyun Woo Kwon

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

JY und YSJ haben die Studie konzipiert. JY, HWK, JYK, HW und YL entwickelten das gesamte Protokoll der klonalen Expansion kolorektaler Epithelzellen und führten Experimente durch. HJL, Ji.WP, S.-YJ und MJK sammelten kolorektale Proben und Krankengeschichten von Patienten. SAO führte eine Genomsequenzierung durch. CHN und JY führten die meisten Genom- und Statistikanalysen durch, mit Beiträgen von J.Lim, HWK und YSJ. Ju.WP und J.Lee trugen zur groß angelegten Genomdatenverwaltung bei. D.-SL, JWO und JH waren an der Dateninterpretation beteiligt. CHN, HWK und YSJ haben das Manuskript mit Beiträgen aller Autoren verfasst. YSJ überwachte die gesamte Studie.

Korrespondenz mit Hyun Woo Kwon, Min Jung Kim oder Young Seok Ju.

YSJ ist Mitbegründer und Geschäftsführer von Genome Insight, Inc. Die übrigen Autoren geben an, keine konkurrierenden Interessen zu haben.

Nature dankt Trevor Graham, Jose Tubio und den anderen, anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Peer-Reviewer-Berichte sind verfügbar.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

a: Ein Streudiagramm, das die mittlere Sequenzierungsabdeckung von Klonen und die maximale VAF somatischer Mutationen zeigt. Bei den meisten Klonen lag der VAF-Spitzenwert bei etwa 0,5, was darauf hinweist, dass sie aus einer einzigen Gründerzelle entstanden sind. b: Änderungen der Kopienzahl auf Chromosomenebene der 887 normalen Klone. Es wurde keine signifikante genomweite Aneuploidie festgestellt, was die genomische Stabilität während der klonalen Expansion normaler Einzelzellen unterstützt. c, Ein Venn-Diagramm, das die Anzahl der von jedem Bioinformatik-Tool erkannten soL1Rs zeigt. d, Eine schematische Darstellung, die zwei genomische Fußabdrücke der Retrotransposition beschreibt, den Poly-A-Schwanz und die Duplikation der Zielstelle. RT-Körper, retrotransponierter Körper; TSD, Ziel-Site-Duplizierung. e, Die Verteilung der Zielstellenlängen an Einfügungsstellen. Positive und negative Zielstellenlängen weisen auf eine Duplizierung bzw. Löschung der Zielstelle hin. soL1R, somatische L1-Retrotransposition. f, Anzahl der strukturellen Variationen in 406 Klonen von normalen Dickdarmepithelzellen. TT-Inversion, Tail-to-Tail-Inversion; HH-Inversion, Kopf-an-Kopf-Inversion.

a: Lineare Regression zwischen der durchschnittlichen Anzahl endogener Punktmutationen in den kolorektalen Klonen und dem Alter der Probenahme bei 19 Personen. Die blaue Linie stellt die Regressionslinie dar (44,6 Punktmutationen pro Jahr), und die schattierten Bereiche geben das 95 %-Konfidenzintervall an. Die Rate stimmt mit der zuvor im Dickdarm geschätzten Rate überein (43,6 Mutationen pro Jahr von Lee-Six et al., Ref. 51). b,c, Vergleich der durchschnittlichen Anzahl von soL1Rs pro Person über Geschlecht (b) und anatomische Lage der kolorektalen Krypten (c) bei 19 Personen mit normalen kolorektalen Klonen mit zweiseitigem Wilcoxon-Rangsummentest. Boxplots veranschaulichen Medianwerte mit Interquartilbereichen (IQR) mit Whiskern (1,5 x IQRs). ns, nicht signifikant. d–i, Beziehung zwischen der Anzahl von soL1R für jeden kolorektalen Klon und der Anzahl somatischer Punktmutationen (d), Telomerlänge (e), Anzahl somatischer SBS1-SNVs (f, uhrähnliche Mutationen durch Desaminierung von 5-Methylcytosin ), die Anzahl somatischer SBS5+SBS40-SNVs (g, uhrähnliche Mutationen durch unbekannten Prozess), die Anzahl somatischer SBS18-SNVs (h, möglicherweise Schaden durch reaktive Sauerstoffspezies) und die Anzahl somatischer SBS88-SNVs (i, Schaden durch Colibactin aus pks+ E. coli). Es wurde kein offensichtlicher Zusammenhang gefunden. j, Anzahl der LCM-basierten Patches mit unterschiedlicher Anzahl von soL1Rs in verschiedenen Organen. LCM, Laser-Capture-Mikrodissektion.

Frühe Phylogenien von kolorektalen Klonen und dem passenden Krebsgewebe werden bei sieben Individuen gezeigt, die soL1Rs unter Klonen geteilt haben. Die Zweiglängen sind proportional zur molekularen Zeit, gemessen an der Anzahl der somatischen Punktmutationen. Die Anzahl der branchenspezifischen Punktmutationen wird mit Zahlen angezeigt. Die gefüllten Kreise an den Enden der Zweige stellen normale Klone (schwarz gefüllte Kreise) und Krebsklone (rot gefüllte Kreise) dar. Die Zahlen innerhalb der ausgefüllten Kreise zeigen die Anzahl der von den Klonen erkannten soL1Rs. Schattierte Bereiche zeigen somatische Abstammungslinien mit gemeinsamen soL1Rs an. Der genomische Ort der gemeinsamen soL1R-Insertionen und der Anteil der Blutzellen, die die soL1Rs tragen, werden durch Genomkoordinaten und Kreisdiagramme angezeigt. Farbige Balken auf der rechten Seite stellen den Anteil der Mutationssignaturen dar, die auf somatische Punktmutationen zurückzuführen sind. Orangefarbene Rauten zeigen L1-Quellen (Herkunft), die Transduktionsereignisse über die kolorektalen Klone hinweg verursachten.

Frühe Phylogenien von kolorektalen Klonen und dem passenden Krebsgewebe werden bei 12 Personen gezeigt, die keine gemeinsamen soL1Rs unter den Klonen aufweisen. Die Zweiglängen sind proportional zur molekularen Zeit, gemessen an der Anzahl der somatischen Punktmutationen. Die Anzahl der branchenspezifischen Punktmutationen wird mit Zahlen angezeigt. Die gefüllten Kreise an den Enden der Zweige stellen normale Klone (schwarz gefüllte Kreise) und Krebsklone (rot gefüllte Kreise) dar. Die Zahlen innerhalb der ausgefüllten Kreise zeigen die Anzahl der von den Klonen erkannten soL1Rs. Der schattierte Bereich zeigt somatische Abstammungslinien mit gemeinsamer Alu-Insertion an. Der genomische Ort der gemeinsamen Alu-Insertion und der Anteil der Blutzellen, die die Alu-Insertion tragen, werden durch Genomkoordinaten und ein Kreisdiagramm angezeigt. Farbige Balken auf der rechten Seite stellen den Anteil der Mutationssignaturen dar, die auf somatische Punktmutationen zurückzuführen sind. Orangefarbene Rauten zeigen L1-Quellen (Herkunft), die Transduktionsereignisse über die kolorektalen Klone hinweg verursachten.

Der HC05-Tumor hat ein rc-L1 in 22q12.1 (Mitte), das in der Keimbahn von HC05 (Blut; links) nicht gefunden wird. Das rc-L1 (22q12.1-1) verursachte ein Transduktionsereignis bei 5q31.1 (rechts) im Tumor, was auf eine sekundäre Transduktion vom neuen somatisch erworbenen rc-L1 hindeutet. Die vorgeschlagene Reihenfolge der Ereignisse ist im unteren linken Bereich zusammengefasst. SoL1R, somatische L1-Retrotransposition.

Die Beziehung zwischen dem DNA-Methylierungsstatus in der Promotorregion und dem Readthrough-RNA-Expressionsniveau von rc-L1s, die unterschiedliche Methylierungs- und Expressionsniveaus aufweisen, wird bei jedem Individuum beschrieben. Es werden nur Fälle berücksichtigt, in denen es mehr als 10 Klone mit Informationen zu Methylierungs- und Expressionsniveaus für ein bestimmtes rc-L1 in einem Individuum gibt. Korrelationskoeffizient und P-Wert des Pearson-Tests werden beschrieben. Die blaue Linie stellt die Regressionslinie dar und die schattierten Bereiche geben das 95 %-Konfidenzintervall an. FPKM, Fragmente pro Kilobase Transkript pro Million.

Der DNA-Methylierungsstatus, die Readthrough-RNA-Expressionsniveaus und die Entwicklungsphylogenien von 48 rc-L1 in 132 normalen kolorektalen Klonen und 7 Fibroblastenklonen von 9 Patienten werden angezeigt. Es umfasst 27 rc-L1, die in unserer kolorektalen Kohorte aktiv waren, und 21 rc-L1, die demethylierte Promotoren in mindestens fünf kolorektalen Klonen enthalten. Auf der linken Seite sind die Phylogenien mit der Anzahl der Punktmutationen (molekulare Zeit) dargestellt. PAF, Populationsallelhäufigkeit; FPKM, Fragmente pro Kilobase Transkript pro Million; rc-L1, retrotranspositionskompetentes L1.

a, Durchschnittlicher Grad der L1-Promotor-DNA-Methylierung in verschiedenen Geweben von ENCODE. Unter den 30 in Abb. 3b beschriebenen rc-L1s wurden nur 12 rc-L1s mit ausreichenden Messwerten in allen Geweben ausgewählt. b, Methylierungsprofile von 100 kb großen Upstream- und Downstream-Regionen von 6 Referenz-rc-L1s mit variablen Methylierungsniveaus in kolorektalen Klonen. Die Region für rc-L1 wird durch gelbe Kästchen hervorgehoben. Die Genomkoordinaten und die Reihenfolge der CpG-Standorte sind im oberen Bereich dargestellt. Das mittlere Feld zeigt den Anteil an methyliertem CpG in kolorektalen Klonen mit offenen (orange) und geschlossenen (blau) Promotoren. Das untere Feld zeigt die Unterschiede in der Fraktion des methylierten CpG, das im mittleren Feld dargestellt ist. mCpG, methyliertes CpG. c, Ein Streudiagramm, das die genomweiten Methylierungsgrade normaler kolorektaler Klone in jedem Individuum zeigt.

a: Genomweite Verteilung von soL1R-Zielstellen in normalen kolorektalen Klonen und 19 passenden kolorektalen Krebsarten. Balken stellen die Anzahl der L1-Einfügungen in einem 10-MB-Schiebefenster mit einer Schrittweite von 5 MB dar. b, Zusammenhang zwischen der L1-Insertionsrate und verschiedenen genomischen Merkmalen. Punkte stellen den Protokollwert der Anreicherungswerte dar, die durch den Vergleich der Klassen 1–3 mit der Klasse 0 für jedes Merkmal berechnet werden. L1-EN-Motiv, L1-Endonuklease-Zielmotiv; DHS, DNase I-Überempfindlichkeitsstelle. c, Verteilung der Abstände zum nächstgelegenen Gen von L1-Insertionsstellen und denen von zufälligen Stellen. d–f, Verteilung der Abstände zu den nächstgelegenen Punktmutationen (d), Genexpressionsniveau (e) und Methylierungsanteil der benachbarten Region (f) in kolorektalen Klonen mit und ohne L1-Insertionen. TPM, Transkripte pro Million. g: Ein Beispiel für einen soL1R, der zusammen mit einem exprimierten Gen in der Nähe der Insertionsstelle eingefügt wird. Im unteren Bereich ist ein suggestiver Mechanismus dargestellt. SoL1R, somatische L1-Retrotransposition; TSD, Ziel-Site-Duplizierung; RT-Körper, retrotransponierter Körper. h, Ein Beispiel für einen Klon mit zwei Transduktionsereignissen an unterschiedlichen genomischen Zielstellen, aber mit der gleichen Länge der einzigartigen Sequenzen. Im unteren Bereich ist ein suggestiver Mechanismus dargestellt.

a: Die soL1R-Rate wird während der Tumorentstehung in kolorektalen Abstammungslinien beschleunigt. EPM, endogene Punktmutation. b, Verteilung der L1-Insertionsgröße in 406 normalen kolorektalen Klonen und 19 passenden kolorektalen Krebsarten. c, Anteil der soL1Rs-Ereignisse mit Kopfvariationen bei 406 normalen kolorektalen Klonen und 19 passenden kolorektalen Karzinomen. d–g, Die Anzahl der soL1Rs zwischen Darmkrebs mit oder ohne TP53-inaktivierende Mutationen (links), Mikrosatelliteninstabilität (Mitte) und genomischer Instabilität (chromosomale Instabilität; rechts). Die Probennummern sind in Klammern angegeben. Es wurden P-Werte aus dem zweiseitigen t-Test (links, Mitte) und der linearen Regression (rechts) angezeigt. Boxplots veranschaulichen Medianwerte mit Interquartilbereichen (IQR) mit Whiskern (1,5 x IQRs). Blaue Linien stellen die Regressionslinien dar und die schattierten Bereiche geben ihre 95 %-Konfidenzintervalle an. P-Werte aus der zweiseitigen multivariaten Regression wurden im rechten Bereich dargestellt. ns, nicht signifikant. D. In 19 übereinstimmenden Darmkrebsgeweben. e. In 19 übereinstimmenden Darmkrebsgeweben und 52 PCAWG-Darmkrebsgeweben. F. In 19 übereinstimmenden Darmkrebsgeweben und 4 Krebsarten (kolorektale Adenokarzinome, ösophageale Adenokarzinome, Plattenepithelkarzinome der Lunge und Plattenepithelkarzinome im Kopf- und Halsbereich) zeigte sich eine höhere soL1R-Belastung unter 40 histologischen Typen in PCAWG. G. In 19 abgeglichenen Darmkrebsgeweben mit allen PCAWG-Proben der Whitelist.

Der Zusammenhang zwischen soL1R-Belastung und klassischer Genominstabilität, wie TP53-inaktivierenden Mutationen und chromosomaler Instabilität, wurde in dieser Studie in PCAWG-Whitelist-Proben (n = 2.677) und 19 passenden Darmkrebsarten analysiert. Krebsarten mit weniger als 10 Fällen wurden nicht berücksichtigt. a, Somatische TP53-inaktivierende Mutationen und die Anzahl der soL1R-Ereignisse. Boxplots veranschaulichen Medianwerte mit Interquartilbereichen (IQR) mit Whiskern (1,5 x IQRs). Die Anzahl der Fälle in jedem Histologietyp ist in Klammern angegeben. P-Werte aus dem zweiseitigen t-Test wurden angezeigt. NA, nicht verfügbar. b: Lineare Regression zwischen der chromosomalen Instabilität (genomische Umlagerungen) und der Anzahl der soL1R-Ereignisse bei jeder Krebsart. Blaue Linien stellen die Regressionslinien dar und die schattierten Bereiche geben ihre 95 %-Konfidenzintervalle an. R-Quadrat- und P-Werte aus der linearen Regression wurden in jedem Panel dargestellt.

Diese Datei enthält Ergänzungsdiskussion 1 (potenzielle kulturassoziierte L1-Retrotranspositionsereignisse in den Klonen), Ergänzungsdiskussion 2 (Genomtechniken für den empfindlichen Nachweis von soL1Rs), Ergänzungsdiskussion 3 (Panorama der Promotormethylierung und Readthrough-Expression von rc-L1s), Ergänzungsdiskussion Referenzen, ergänzende Abbildungen. 1–5 und Legenden für die Ergänzungstabellen 1–6.

Demografische und Mutationsmerkmale von Proben. Die Tabelle enthält Informationen zu jeder Probe in der Studie, einschließlich Alter und Geschlecht der Patienten, dem anatomischen Ort, an dem die Proben entnommen wurden, sowie der Mutationslast und -signaturen für jede Probe.

Anmerkung der in dieser Studie identifizierten somatischen Retrotranspositionen. Die Tabelle enthält detaillierte Informationen zu jedem in der Studie identifizierten somatischen Retrotranspositionsereignis, einschließlich Genomkoordinaten, Strangorientierung, Insertionsgröße und -typ sowie der Anzahl unterstützender Lesevorgänge für jede Insertion.

Anmerkung zu somatischen Retrotranspositionen, die in LCM-basierten Patches identifiziert wurden. Die Tabelle enthält detaillierte Informationen zu jedem somatischen Retrotranspositionsereignis, das in LCM-basierten Patches identifiziert wurde, einschließlich Genomkoordinaten, Strangorientierung, Insertionsgröße und -typ sowie der Anzahl unterstützender Lesevorgänge für jede Insertion.

Liste der Quellelemente mit Merkmalen. Die Tabelle enthält Informationen zu 276 rc-L1, die in der Studie analysiert wurden, einschließlich Genomkoordinaten, Zytoband, Strangorientierung, Allelhäufigkeit in der Population, Informationen zur L1-Unterfamilie und eine Liste verkürzter Mutationen. Darüber hinaus zeigt die Tabelle die Anzahl der Transduktionsereignisse von jedem rc-L1 in jeder in der Studie untersuchten kolorektalen Probe.

Zusammenhang zwischen soL1R und Genominstabilitätsmerkmalen bei Krebs. Die Tabelle enthält Informationen zu Darmkrebsproben, die in der Studie analysiert wurden, und zu Krebsarten, die auf der weißen Liste der PCAWG stehen, einschließlich histologischer Informationen, der Anzahl der somatischen L1-Retrotransposition und strukturellen Variationen, ob die Proben TP53-inaktivierende Mutationen oder Mikrosatelliteninstabilität aufweisen, sowie eine Liste kanonischer Treibermutationen.

Zusammensetzung organoider Kulturmedien für kolorektale Epithelzellen. Die Tabelle zeigt die Zusammensetzung des organoiden Kulturmediums für kolorektale Epithelzellen.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Nam, CH, Youk, J., Kim, JY et al. Weit verbreitete somatische L1-Retrotransposition im normalen kolorektalen Epithel. Natur 617, 540–547 (2023). https://doi.org/10.1038/s41586-023-06046-z

Zitat herunterladen

Eingegangen: 18. Mai 2022

Angenommen: 04. April 2023

Veröffentlicht: 10. Mai 2023

Ausgabedatum: 18. Mai 2023

DOI: https://doi.org/10.1038/s41586-023-06046-z

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.