Hoch

Blog

HeimHeim / Blog / Hoch

May 15, 2023

Hoch

Band Nature Communications

Nature Communications Band 14, Artikelnummer: 2734 (2023) Diesen Artikel zitieren

8080 Zugriffe

20 Altmetrisch

Details zu den Metriken

Formalinfixiertes, in Paraffin eingebettetes (FFPE) Gewebe stellt eine umfangreiche und wertvolle Patientenmaterialbank für klinische Anamnese- und Follow-up-Daten dar. Es ist immer noch eine Herausforderung, ein Einzelzell-/Kern-RNA-Profil (sc/snRNA) in FFPE-Geweben zu erreichen. Hier entwickeln wir eine tröpfchenbasierte snRNA-Sequenzierungstechnologie (snRandom-seq) für FFPE-Gewebe, indem wir Gesamt-RNAs voller Länge mit Zufallsprimern erfassen. snRandom-seq weist im Vergleich zu modernsten Hochdurchsatz-scRNA-seq-Technologien eine geringere Dublettrate (0,3 %), eine viel höhere RNA-Abdeckung auf und erkennt mehr nichtkodierende RNAs und entstehende RNAs. snRandom-seq erkennt einen Median von >3000 Genen pro Zellkern und identifiziert 25 typische Zelltypen. Darüber hinaus wenden wir snRandom-seq auf eine klinische FFPE-Leberkrebsprobe beim Menschen an und zeigen eine interessante Subpopulation von Kernen mit hoher proliferativer Aktivität. Unsere Methode bietet eine leistungsstarke snRNA-seq-Plattform für klinische FFPE-Proben und verspricht enorme Anwendungen in der biomedizinischen Forschung.

Routinemäßige formalinfixierte, in Paraffin eingebettete (FFPE) Gewebe sind die am häufigsten archivierbaren Proben und stellen eine umfangreiche und wertvolle Patientenmaterialbank für klinische Anamnese, Nachsorgedaten usw. dar1. Die Gewebemorphologie und die zellulären Details von FFPE-Geweben bleiben durch die Formaldehydvernetzung zwischen DNA, RNA und Proteinen für die Histopathologie gut erhalten. Die irreversiblen Veränderungen, die durch die Formalinfixierung an Makromolekülen in FFPE-Proben verursacht werden, stellen zwangsläufig immer eine Herausforderung für molekularbiologische Anwendungen dar. Aktuelle Studien haben große Fortschritte bei der Transkriptionsprofilierung in FFPE-Proben durch optimale RNA-Extraktionsmethoden2 oder räumliche In-situ-Profilierung3 erzielt. In den letzten Jahren haben Methoden der Hochdurchsatz-Einzelzell-/Kern-RNA-Sequenzierung (scRNA/snRNA-seq) den gesamten Bereich der biomedizinischen Forschung revolutioniert4,5,6. Wir haben den ersten Zellatlas von Menschen und Mäusen mit unseren maßgeschneiderten Hochdurchsatz-scRNA-seq-Plattformen erstellt7,8. Man geht davon aus, dass die genaue transkriptomische Charakterisierung jeder einzelnen Zelle in klinischen FFPE-Proben ein besseres Verständnis der Zellheterogenität und Populationsdynamik liefern und dadurch die Präzisionsdiagnostik, Behandlung und Prognose menschlicher Krankheiten verbessern kann. Allerdings sind sowohl die Isolierung einzelner intakter Zellen/Kerne als auch die RNA-Erfassung aus FFPE-Geweben aufgrund der Vernetzung, Modifikation und des Abbaus der RNA immer noch eine Herausforderung.

Derzeit basieren die meisten gängigen Hochdurchsatz-sc/snRNA-seq-Plattformen, wie z. B. 10X Genomics Chromium Single Cell 3' Solution, auf Oligo(dT), um Poly(A)+-RNAs einzufangen, sodass dies hauptsächlich reife Messenger-RNA (mRNA) tut statt nicht-polyadenylierter RNAs für die Analyse nachgewiesen werden. Darüber hinaus sind diese Oligo(dT)-basierten sc/snRNA-seq-Methoden hauptsächlich auf frische oder frisch gefrorene Proben beschränkt, da Oligo(dT)-Primer bei degradierten RNAs normalerweise versagen. Es wurden verschiedene Methoden entwickelt, um diese Herausforderungen aus unterschiedlichen Perspektiven zu bewältigen. SMART-seq-total9 und VASA-seq10 erfassen sowohl polyadenylierte als auch nicht polyadenylierte Transkripte, indem sie einen zusätzlichen Schritt einsetzen, bei dem alle RNA-Moleküle mit Poly(A) versehen werden. Andererseits wurde berichtet, dass SPLiT-seq11 erfolgreich in fixierten Zellen unter Verwendung eines Zufallsprimers eingesetzt werden konnte, der effizienter und breiter war, um Gesamt-RNAs einzufangen12,13. Allerdings waren diese Methoden für FFPE-Gewebe noch nicht anwendbar. Zwei Methoden, die kürzlich auf bioRxiv veröffentlicht wurden, snPATHO-Seq14 und snFFPE-seq15, stellten optimierte Methoden zur Isolierung einzelner intakter Kerne aus FFPE-Geweben zur Durchführung von snRNA-Seq bereit, was die Machbarkeit von snRNA-Seq in FFPE-Geweben demonstriert und eine neue Dimension erschließt dieser schwer zu verwendenden Proben. snPATHO-Seq basiert auf der sondenbasierten 10X Genomics-Technologie, sodass nur begrenzte Gene nachgewiesen werden können14. snFFPE-seq nutzt die Poly(A)-basierte 10X Genomics-Plattform, die nicht empfindlich genug ist, um die minderwertigen RNAs aus FFPE-Geweben zu erfassen15. In der Praxis ist immer eine groß angelegte und umfassende transkriptomische Profilierung klinischer Proben erforderlich, um prädiktive Biomarker oder seltene Zelltypen zu identifizieren. Daher besteht das übergeordnete Ziel darin, einen Ansatz zu finden, der den Bedarf an snRNA-seq mit hohem Durchsatz, hoher Empfindlichkeit und hoher Abdeckung auf FFPE-Geweben decken kann.

In dieser Studie entwickeln wir snRandom-seq, eine tröpfchenbasierte hochempfindliche snRNA-Sequenzierungsmethode in voller Länge für FFPE-Gewebe. In snRandom-seq erfassen wir Gesamt-RNAs mithilfe von Zufallsprimern für die reverse Transkription und synthetisieren den zweiten Strang, indem wir Poly(dA)-Tailing an den cDNAs des ersten Strangs durchführen. cDNAs in einem einzelnen Kern werden durch unsere bisherige mikrofluidische Barcoding-Plattform16,17 weiter spezifisch markiert und anschließend amplifiziert und sequenziert. In der Zwischenzeit entwickeln wir ein Protokoll zur Isolierung einzelner intakter Kerne aus FFPE-Geweben, indem wir unter milden Bedingungen eine Entparaffinierung, Rehydrierung und Kernextraktion durchführen. Darüber hinaus entwickeln wir einen Einzelstrang-DNA-Blockierungsschritt, um die Auswirkungen einer Genomkontamination zu vermeiden. Wir verwenden eine Mensch-Maus-Mischprobe, um die Leistung von snRandom-seq zu validieren. Die Ergebnisse zeigen eine geringe Dublettrate (0,3 %) und eine vergleichbare Empfindlichkeit mit modernsten Hochdurchsatz-scRNA-seq-Technologien. Auf FFPE-Mausgeweben zeigt snRandom-seq gute Ergebnisse für die snRNA-Sequenzierung und Zelltyp-Annotation, wobei snRandom-seq einen Median von >3000 Genen pro Kern für ~20.000 einzelne Kerne erkennt und 25 typische Zelltypen (Hepatozyten, Keimzellen, Fibroblasten) identifiziert , Kardiomyozyten usw.). Darüber hinaus wenden wir snRandom-seq auf eine klinische FFPE-Leberkrebsprobe beim Menschen an und entdecken eine interessante Subpopulation von Kernen mit hoher proliferativer Aktivität, die ein potenzielles Ziel für die Krebsforschung sein könnte. Kurz gesagt: snRandom-seq bietet eine leistungsstarke snRNA-Plattform für Labor- und klinische FFPE-Proben und impliziert verschiedene zukünftige Anwendungen in der biologischen Forschung und der klinischen Praxis.

Der Hauptarbeitsablauf von snRandom-seq ist in Abb. 1 dargestellt. Für die Einzelkernisolierung von FFPE-Geweben wurden zunächst die interessierenden Bereiche von FFPE-Gewebeblöcken in Banken ausgewählt und in Röhrchen platziert. Die Entparaffinierung und Rehydratisierung wurden mit Standard-Xylol und Alkoholwäsche durchgeführt. Anschließend wurden die Kerne dissoziiert und permeabilisiert. Für eine umfassende Einzelkern-Gesamt-RNA-Seq mit hohem Durchsatz haben wir eine Strategie mit einer auf Zufallsprimern basierenden Chemie zur Erfassung von Gesamt-RNAs voller Länge und einer einfach zu bedienenden tröpfchenbasierten Plattform zur Markierung einzelner Kerne bereitgestellt. Nackte Einzelstrang-DNAs wurden in situ durch mehrfaches Annealing und Verlängerung von Blockierungsprimern blockiert. cDNAs der Gesamt-RNA wurden in situ durch mehrfaches Annealing von Zufallsprimern und Oligo(dT)-Primern in der reversen Transkription umgewandelt. Um die Dublettrate zu verringern, haben wir gemäß der veröffentlichten scifi-RNA-seq18 eine Vorindexierungsstrategie in den Schritt der reversen Transkription einbezogen. Die Kerne wurden zur reversen Transkription mit vorindizierten Zufallsprimern in verschiedene Röhrchen aufgeteilt und dann für die anschließende Reaktion gepoolt. Poly(dA)-Schwänze wurden in situ durch terminale Transferase (TdT) an den 3'-Hydroxylterminus der cDNAs angefügt. Basierend auf unserer früheren Arbeit16,17 haben wir auch eine mikrofluidische Plattform für die Hochdurchsatz-Einzelkern-Barcodierung etabliert. Während der Barcode-Reaktion in Tröpfchen wurden die Poly(dT)-Primer durch enzymatisches Schneiden aus den Perlen freigesetzt19 und gleichzeitig wurden die cDNAs durch RNA-Abbau aus dem Zellkern freigesetzt. Dann banden Poly(dT)-Primer mit dem Poly(dA)-Schwanz am Ende der cDNAs und verlängerten sich, um den cDNAs in jedem Tröpfchen einen spezifischen Barcode hinzuzufügen. Nach der Barcode-Kennzeichnung brachen wir die Tröpfchen auf, amplifizierten die mit dem Barcode versehene cDNA und bereiteten die Next-Generation-Sequencing-Bibliothek (NGS) für die Paired-End-Sequenzierung vor.

Der Arbeitsablauf von snRandom-seq für FFPE-Gewebe umfasst FFPE-Probenauswahl, Paraffinauflösung, Isolierung und Permeabilisierung einzelner Kerne, Blockierung einzelsträngiger DNAs, reverse Transkription, dA-Tailing, Tröpfchen-Barcoding, Primerfreisetzung und -verlängerung, Tröpfchenbrechen und PCR-Amplifikation. und Sequenzierung. Roter gestrichelter Kreis im FFPE-Gewebeblock: die interessierenden Bereiche. Blauer gestrichelter Kasten: die drei In-situ-Reaktionen, einschließlich Blockierung einzelsträngiger DNAs, reverse Transkription und dA-Tailing. AAA: dA-Schwanz im 3′ der cDNA. TTT: Poly(dT) in den Poly(dT)-Barcode-Primern. Graue Pfeile: die Richtung der Ausdehnung.

snRandom-seq verwendet Zufallsprimer, um Gesamt-RNAs in einzelnen Kernen einzufangen (Abb. 1), was sich von den aktuellen poly(A)-basierten und sondenbasierten Einzelzell-RNA-seq-Methoden unterscheidet. Daher führten wir ein Standardexperiment mit gemischten Spezies mit kultivierten Zelllinien von Mensch (293T) und Maus (3T3) durch, um die Genauigkeit von snRandom-seq zu bewerten. Frisch geerntete 293T- und 3T3-Zellen wurden in Kerne lysiert und zur Fixierung gemischt. Die festen Kerne wurden für snRandom-seq verwendet (Abb. 1). Bevor mit der mikrofluidischen Einkapselung fortgefahren wurde, wurden die Kerne abgebildet, um die Einzelkernmorphologie zu bestätigen, und gezählt (ergänzende Abbildung 1a). Für die Barcodierung einzelner Zellen/Kerne in snRandom-seq wurde eine Hochdurchsatz-Mikrofluidikplattform eingerichtet (Abb. 2a, ergänzende Abb. 1b). Für die Barcode-Kügelchen-Synthese wurden das Hydrogel-Kügelchen-Erzeugungsgerät und das Zellverkapselungsgerät wie zuvor beschrieben 20 entworfen und hergestellt (ergänzende Abbildung 2a). Hydrogelkügelchen mit einem Durchmesser von 40 μm wurden präzise hergestellt (ergänzende Abbildung 2b). An diesen Hydrogelkügelchen wurden drei Runden Split-and-Pool-basierter Ligation für die DNA-Barcode-Synthese durchgeführt (ergänzende Abbildung 2c, ergänzende Tabelle 2). Die hohe Reaktionseffizienz jedes Ligationsschritts spiegelte sich im scharfen Peak im Elektropherogramm der freigesetzten Barcode-Primer wider (ergänzende Abbildung 2d). Kern, Barcode-Kügelchen und Reagenzmischung wurden mithilfe der Mikrofluidikplattform in Wasser-in-Öl-Emulsionen gemeinsam kompartimentiert (Abb. 2a) und jeder einzelne Kern wurde mit einem Barcode-Kügelchen in ein Tröpfchen eingekapselt (Abb. 2b).

ein mikrofluidisches Verkapselungsgerät zur Barcode-Kennzeichnung von Kernen. b Bild eines eingekapselten Tropfens, der eine Perle, einen Kern und eine Reagenzienmischung enthält. c Elektropherogramm der cDNA-Bibliothek einer Mischung aus 293T- (Mensch) und 3T3-Kernkernen (Maus) für den Qsep100™ DNA-Fragmentanalysator. Untere (20 bp) und obere (1 kb) Marker wurden angezeigt. d Barcode-Diagramm zur Identifizierung der Barcodes, die echte Kerne darstellen (rote Linie). Die Barcodes der 293T-3T3-Mischkerne wurden von der größten zur kleinsten Genzahl geordnet. e Artenmischungs-Streudiagramm, das die Einfangeffizienz einzelner Kerne und die Dublettrate von snRandom-seq zeigt. f Speziesspezifität von UMIs in der 293T-3T3-Mischung. Identifizierte 293T-Kerne: n = 1157, identifizierte 3T3-Kerne: n = 1086. Der Median der Artenspezifität von UMIs in 293T betrug 0,992. Der Median der Artenspezifität der UMIs in 3T3 betrug 0,986. g Prozent der Lesevorgänge, die Introns und Exons zugeordnet sind. Violin-Plots und Box-Plots zeigten die Anzahl der Gene (h) und UMIs (i), die in jedem 293T- und 3T3-Kern erkannt wurden. Gefilterte 293T-Kerne: n = 1085, gefilterte 3T3-Kerne: n = 1066. Die Daten im Boxplot entsprachen dem ersten und dritten Quartil (unteres und oberes Scharnier) und dem Median (Mitte). j Sättigungsanalyse von drei Methoden. snRandom-seq verwendete 293T- und 3T3-Kerne; 10X Chromium Single Cell 3' Solution V3 verwendete 293 T- und 3T3-Zellen; VASA-seq verwendete 293T-Zellen. k Lesen Sie die Abdeckung entlang des Genkörpers durch die drei Methoden ab. snRandom-seq verwendete 293T-Kerne; 10X Chromium Single Cell 3' Solution V3 verwendete 293T-Zellen; VASA-seq verwendete 293T-Zellen. Die Daten in (f, h, i) wurden als Medianwerte dargestellt. Die Daten im Boxplot in (f, h, i) entsprachen dem ersten Quartil (untere Scharniere), dem dritten Quartil (obere Scharniere) und dem Median (Mitte). Der obere Whisker erstreckte sich vom Scharnier bis zu den Maxima, nicht weiter als 1,5 * IQR (Interquartilbereich) vom Scharnier entfernt. Der untere Whisker erstreckte sich vom Scharnier bis zu den Minima von höchstens 1,5 * IQR des Scharniers. Der IQR ist der Abstand zwischen dem ersten und dritten Quartil. Quelldaten werden als Quelldatendatei bereitgestellt.

Nach der Barcode-Kennzeichnung und Amplifikation erreichte die Fragmentgröße der cDNA-Bibliothek des Mensch-Maus-Gemisches einen Spitzenwert zwischen 300 und 800 bps (Abb. 2c), was für die Fragmentierung nicht erforderlich ist, sondern nur für NGS geeignet ist. Nach der Datenverarbeitung identifizierten wir 2250 einzigartige Kern-Barcodes von hoher Qualität anhand der deutlich steilen Steigung im Barcode-Gen-Rangdiagramm (Abb. 2d), was auf eine klare Trennung der echten Kerne vom Hintergrundrauschen schließen lässt. Die Kerneinfangrate betrug 42,2 % und der Prozentsatz der den echten Kernen zugeordneten Lesevorgänge betrug 76 %. Wir haben das Verhältnis der Lesevorgänge gezählt, die in jedem einzelnen Zellkern sowohl auf menschliche als auch auf Mausgenome abgebildet wurden, und fanden heraus, dass vorindizierte Primer die Dublettrate deutlich verringerten (von 2,9 % auf 0,3 %) (Abb. 2e, Ergänzung 1c). Die Dublettrate von snRandom-seq ist deutlich niedriger als die anderer tröpfchenbasierter sc/snRNA-seq-Methoden (sNucDrop-seq: ~2,6 %, VASA-drop: 3,1 %). Durchweg wurde eine sehr hohe Speziesspezifität von UMI (99 %) beobachtet (Abb. 2f), was darauf hindeutet, dass snRandom-seq Einzelkernbibliotheken mit hoher Wiedergabetreue produzierte. Der Prozentsatz der auf Exon oder Intron abgebildeten Lesevorgänge identifizierter menschlicher und Mauskerne wurde berechnet, und die Ergebnisse zeigten, dass die auf Intron abgebildeten Lesevorgänge dreimal so hoch waren wie die auf Exon abgebildeten Lesevorgänge (Abb. 2g). Darüber hinaus wurden viele lange nichtkodierende RNAs (lncRNAs) und kurze nichtkodierende RNAs, einschließlich kleiner nuklearer RNA (snoRNA), kleiner nuklearer RNA (snRNA) und microRNA (miRNA), nachgewiesen (ergänzende Abbildung 1d). Diese Ergebnisse legen nahe, dass snRandom-seq Transkripte in voller Länge umfassend erfasst hat.

Die Verteilung der Gen- und UMI-Anzahl zeigte, dass snRandom-seq einen Median von 4141 Genen und 11.594 UMIs in einem einzelnen 293T-Kern erfasste, indem durchschnittlich ~29.000 Lesevorgänge pro 293T-Kern sequenziert wurden (Abb. 2h), und 3427 Gene und 9795 UMIs in einem einzelnen 3T3-Kern von ~ 25.000 Lesevorgänge pro 3T3-Kern (Abb. 2i). Die Ergebnisse zeigten, dass snRandom-seq empfindlicher ist als die beiden anderen berichteten tröpfchenbasierten Hochdurchsatz-snRNA-seq-Methoden (DroNc-seq21: durchschnittlich 3295 Gene und 4643 UMIs mit ∼160.000 Lesevorgängen pro Kern für 5636 3T3-Kerne; sNucDrop-seq22: durchschnittlich 2665 Gene und 5195 UMIs mit ∼ 23.000 Reads pro Kern für 1984 3T3-Kerne) (Ergänzende Abbildung 1e). Die Sättigungsanalyse zeigte, dass die Anzahl der in snRandom-seq erkannten Gene den Sättigungspunkt bei 60.000 eindeutig ausgerichteten Lesevorgängen pro 3T3- und 293T-Kern noch nicht erreicht hatte (Abb. 2j). Wir haben unsere snRNA-seq-Daten auch mit der weit verbreiteten 10X Chromium Single Cell 3′-Lösung V323 mit hohem Durchsatz und dem zuletzt gemeldeten Hochdurchsatz VASA-drop10 für scRNA-seq verglichen. Bei einer geringen Sequenzierungstiefe (<10k) ist die Empfindlichkeit von snRandom-seq in 3T3- und 293T-Kernen vergleichbar mit der 10X Chromium Single Cell 3' Solution V3 in 3T3- und 293T-Zellen sowie dem VASA-Drop in 293T-Zellen (Abb. 2j). Im Gegensatz zu Poly(A)-basierter 10X Chromium Single Cell 3‘ Solution V3 mit offensichtlicher 3‘-End-Verzerrung zeigten sowohl snRandom-seq als auch VASA-drop keine offensichtliche 3‘- oder 5‘-End-Verzerrung im gesamten Genkörper (Abb. 2k). Wie erwartet wies snRandom-seq aufgrund der zusätzlichen Zugabe von Oligo(dT)-Primer bei der reversen Transkription eine leichte Tendenz zum 3'-Ende auf (Abb. 2k).

Bei FFPE-Geweben könnte die Verdauung mit Proteinase K sauberere Einzelkerne isolieren als mit Kollagenase (ergänzende Abbildung 3a). Mit einem optimierten Verfahren (Abb. 1) wurden einzelne intakte Kerne effizient aus mehreren FFPE-Mausgeweben und einer 2 Jahre alten archivierten klinischen FFPE-Probe von menschlichem Leberkrebs (Abb. 3a, ergänzende Abb. 4a) sowie den Kernen isoliert Morphologie und Größenverteilung waren zwischen FFPE und frischen Proben vergleichbar (ergänzende Abbildung 4b).

a Bild einzelner Kerne vor dem Tröpfchen-Barcoding und der DAPI-Färbung. Maßstabsbalken, 50 μm. b Prozentsatz der Lesevorgänge, die unter verschiedenen Bedingungen verschiedenen Genomregionen zugeordnet wurden. c, Elektropherogramm der FFPE-Maus-Nieren-cDNA-Bibliothek für den Qsep100™ DNA-Fragmentanalysator. Unterer Marker: 20 bp; Oberer Marker: 1k bp. d Überblick über den FFPE/Fresh-Vergleich und das technische Replikationsexperiment. Der Pearson-Korrelationskoeffizient (R) der normalisierten Genexpressionen zwischen FFPE/frischen Proben (e) und technischen Replikationsproben (FFPE1, FFPE2) (f). Jeder Punkt repräsentiert das durchschnittliche Expressionsniveau eines Gens. Die rote Linie zeigt die lineare Regressionslinie. Der p-Wert (p) wurde aus einem zweiseitigen Permutationstest berechnet. g Anzahl verschiedener RNA-Biotypen, die in der FFPE-Probe nachgewiesen wurden. h Gendetektionsvergleich von Mausgeweben (Herz, Niere, Hoden und Leber) und menschlicher Leber mithilfe von snRandom-seq mit Mausgehirn mithilfe von snFFPE-seq15 und Brust mithilfe von snPATHO-seq14. Nierenkerne: n = 5795, Leberkerne: n = 4287, Herzkerne: n = 6732, Hodenkerne: n = 3774, Gehirnkerne: n = 7031, Brustkerne: n = 5721. Die Daten wurden als Medianwerte dargestellt. Die Daten im Boxplot entsprachen dem ersten Quartil (untere Scharniere), dem dritten Quartil (obere Scharniere) und dem Median (Mitte). Der obere Whisker erstreckte sich vom Scharnier bis zu den Maxima, nicht weiter als 1,5 * IQR vom Scharnier entfernt. Der untere Whisker erstreckte sich vom Scharnier bis zu den Minima von höchstens 1,5 * IQR des Scharniers. i Sättigungsanalyse von snRandom-seq basierend auf den FFPE-Mausgeweben. j Liest die Verteilung entlang des Genkörpers mit drei verschiedenen snRNA-seq-Methoden (snRandom-seq, snFFPE-seq15 und 10X Chromium Fixed RNA Profiling). k Histogramm, das die prozentualen Datensätze der Genkörperabdeckung zeigt, die mit den drei Methoden generiert wurden. l Repräsentative Rohdaten, die auf das menschliche Gen C1S in snRandom-seq und 10X Chromium Fixed RNA Profiling abgestimmt sind. Quelldaten werden als Quelldatendatei bereitgestellt.

In unserem Pilotexperiment zur FFPE-snRNA-Sequenzierung wurden wenige eindeutig ausgerichtete Lesevorgänge auf Exons abgebildet, wobei viele Lesevorgänge aufgrund der Genomkontamination intergenen Regionen zugeordnet wurden (Abb. 3b). In Anbetracht der Tatsache, dass die Doppelhelix der DNA in FFPE-Geweben nach einer chemischen Veränderung wahrscheinlich gestört wird, wurde dem anfänglichen Verfahren von snRandom-seq ein Schritt zum Blockieren einzelsträngiger DNAs hinzugefügt (Abb. 1, Kasten). Die nackten Einzelstrang-DNAs im isolierten FFPE-Einzelkern wurden in situ durch mehrfaches Annealing und Verlängerung blockierender Primer auf Einzelstrang-DNAs des Genoms blockiert. Nach der DNA-Blockierung wurde der Prozentsatz intergener Regionen drastisch reduziert (Abb. 3b). Die Verteilung der Kartierungsregionen war zwischen DNA-blockierten FFPE-Proben, frischen Proben und snFFPE-seq (10X Chromium Single Cell 3′ Solution V3) vergleichbar, was die hohe Qualität der snRandom-seq-Daten weiter unterstützt (Abb. 3b). Durch die Integration der oben genannten Verfahren wurden durch snRandom-seq hochwertige cDNA-Bibliotheken aus mehreren FFPE-Geweben generiert (Abb. 3c, ergänzende Abb. 4c, d). Die Fragmentgröße von cDNA-Bibliotheken aus FFPE und frischen Proben erreichte jeweils einen Spitzenwert zwischen 300 und 800 bps (Abb. 3c, ergänzende Abb. 4e).

Um festzustellen, ob snRandom-seq genügend Informationen aus FFPE-Geweben als frische Proben generieren kann, haben wir sowohl FFPE- als auch frische Proben aus denselben Mausgeweben gesammelt und ihre RNA-Profile mit snRandom-seq verglichen (Abb. 3d). Die RNA-Qualität von FFPE und frischen Proben wurde zunächst anhand der RNA-Fragmentverteilung und DV200 bewertet. Wie erwartet war die RNA-Qualität der FFPE-Probe relativ schlechter als die der frischen Probe (ergänzende Abbildung 5a), was darauf hindeutet, dass die RNA in der FFPE-Probe abgebaut war. Die zusammengeführten Genom-Browser-Tracks der snRandom-seq-Ergebnisse zeigten, dass die Leseabdeckungsbereiche von FFPE und frischen Proben ähnlich waren (ergänzende Abbildung 6a – g). Durchweg zeigten die gesamten RNA-Profile von FFPE und frischen Proben durch snRandom-seq eine gute Korrelation (Pearson R: ~ 0,9, p <2,2e-16; Abb. 3e, ergänzende Abb. 7a, b). Um die Wiederholbarkeit unserer Methode zu beweisen, wurde die gleiche FFPE-Probe unabhängig voneinander mit snRandom-seq (Abb. 3d) und einer hohen Korrelation (Pearson R ~ 0,92, p < 2,2e-16) der Genexpressionsprofile sequenziert Es wurden auch zwei Chargen beobachtet (Abb. 3f). Diese Ergebnisse zeigten, dass snRandom-seq sowohl in frischen als auch in FFPE-Proben eine gute Leistung erbrachte.

Als nächstes verglichen wir unsere FFPE-Ergebnisse mit anderen gemeldeten FFPE-snRNA-seq-Ergebnissen. Nach der Datenverarbeitung konnten anhand der snRandom-seq-Daten Tausende echter Kerne in diesen FFPE-Geweben erfolgreich identifiziert werden (Abb. 3h, ergänzende Abb. 8a). snRandom-seq identifizierte ein breites Spektrum an RNA-Biotypen in der FFPE-Probe (Abb. 3g), mit etwa achtmal so vielen lncRNAs wie snFFPE-Seq, und snoRNA, scaRNAs und miRNA wurden nur in snRandom-seq nachgewiesen (ergänzende Abb. 8b). Die Mediane der Gene, die pro Kern in ungesättigten snRandom-seq-Datensätzen nachgewiesen wurden, lagen durchweg bei über 3000 und waren damit deutlich höher als bei den beiden anderen gemeldeten Hochdurchsatz-snRNA-seq-Methoden für FFPE-Proben (snFFPE-Seq 10X Chromium Single Cell 3′ Solution V3: 276). Gene/Kern; snPATHO-Seq: 1850 Gene/Kern) (Abb. 3h) sowie die Mediane der UMIs (ergänzende Abb. 8c). Unsere Daten haben immer noch nicht den Sättigungspunkt erreicht, selbst wenn etwa 300.000 kartierte Lesevorgänge pro Kern sequenziert und etwa 10.000 Gene nachgewiesen wurden (Abb. 3i).

Wir haben außerdem die RNA-Abdeckung von snRandom-seq mit den anderen beiden FFPE-snRNA-seq-Methoden verglichen. In der Darstellung der durchschnittlichen Leseverteilung auf dem Genkörper zeigte snFFPE-Seq unter Verwendung von Oligo(dT)-Primern eine deutliche 3′-End-Verzerrung und 10X Chromium Fixed RNA Profiling unter Verwendung derselben Sondenbasistechnologie wie snPATHO-seq zeigte eine leichte 5′-Verzerrung. -Endvorspannung (Abb. 3j). In den snRandom-seq-Daten für das FFPE-Gewebe wurde jedoch eine homogene Verteilung über den Genkörper beobachtet (Abb. 3j), was darauf hindeutet, dass Zufallsprimer gleichmäßig an Transkripte gebunden waren und die zusätzlichen Oligo(dT)-Primer in snRandom-seq für die FFPE-Probe ungültig waren . Für die RNA-Abdeckung auf der Ebene einzelner Kerne zeigte snRandom-seq eine viel höhere Abdeckung als die von snFFPE-seq oder 10X Chromium Fixed RNA Profiling (Abb. 3k). Für die RNA-Abdeckung auf der Ebene eines einzelnen Gens zeigte die Leseverteilung entlang drei ausgewählter Gene (C1S, EMG1, KLRG1) den entscheidenden Unterschied zwischen der sondenbasierten Technologie und der auf Zufallsprimern basierenden Strategie (Abb. 3l, ergänzende Abb. 8d). Kartierte Lesevorgänge durch 10X Chromium Fixed RNA Profiling waren auf die Sondenzielregionen (<100 bp) beschränkt. Im Gegensatz dazu waren die kartierten Lesevorgänge von snRandom-seq sowohl in exonischen als auch in intronischen Regionen gleichmäßig verteilt. Diese Ergebnisse legen nahe, dass snRandom-seq für FFPE-Gewebe eine erhebliche Menge hochwertiger RNA erfassen und viel mehr transkriptomische Informationen extrahieren kann als die hochmodernen Plattformen.

Als nächstes verglichen wir die in FFPE und frischen Proben durch snRandom-seq identifizierten Zelltypen. Die unbeaufsichtigte Clusterbildung des oben gefilterten hochwertigen Einzelnierenkernprofils ergab über zehn verschiedene Cluster. Alle Cluster könnten auf der Grundlage klassischer bekannter Zelltypmarker 24, 25 weiter annotiert werden (Abb. 4a, b, ergänzende Abb. 9a). Genexpressionen klassischer bekannter Zelltyp-Markergene22, wie Nphs1 für Podozyten, Pecam1 für Endothelzellen und Pdgfrb für mesangialähnliche Zellen, wurden zuverlässig auf den entsprechenden Clustern kartiert (Abb. 4b). Der Nierentubulus von Säugetieren in der Niere enthält mindestens 16 verschiedene Epithelzelltypen26. Hier haben wir die meisten der empfohlenen Begriffe für Nierentubulus-Epithelzelltypen in FFPE-Mäusennierenproben durch snRandom-seq identifiziert, einschließlich proximaler gewundener Tubulus, proximaler gerader Tubulus, distales Nephron, distaler gewundener Tubulus, Henle-Schleife, Sammelrohr-Hauptzellen, Podozyten , proximale tubuläre Zellen, interkalierte Sammelrohrzellen und Sammelrohrzellen (Abb. 4a). Neben den bekannten Top-Markern von Zelltypen, wie z. B. Slc14a2 für Sammelrohrzellen, haben wir auch mehrere potenzielle Marker für diese Zelltypen entdeckt (Abb. 4c). Durch Zusammenführen der snRandom-seq-Daten der FFPE-Proben und der frischen Probe sowie der anderen Charge von FFPE-Proben erhielten wir eine robuste Zellclusterung durch t-SNE (t-verteilte stochastische Nachbareinbettung) (ergänzende Abbildung 9b). Die meisten Zelltypen wurden in den drei snRandom-seq-Datensätzen identifiziert (Abb. 4d, ergänzende Abb. 9c). Wie erwartet gibt es einige Unterschiede im Anteil der Zelltypen von FFPE und frischen Proben (z. B. PTC), die möglicherweise durch den Probenahmefehler und unterschiedliche Kernextraktionsmethoden für FFPE und frische Proben verursacht werden.

eine t-SNE-Analyse von Kernen, die durch snRandom-seq aus einer FFPE-Mäusennierenprobe isoliert wurden, basierend auf ihrer Genexpression und gefärbt durch identifizierte Zelltypen. Vierzehn identifizierte Zelltypen wurden gefärbt und unten angezeigt. b Expression ausgewählter drei Zelltyp-Marker in einzelnen Kernen in den t-SNE-Karten der FFPE-Mausniere. Genexpressionsniveaus werden durch Rottöne angezeigt. c Punktdiagramm der durchschnittlichen Ausdrücke der beiden oberen Marker in jedem der 14 Zelltypen. d Anteil der annotierten Zelltypen von FFPE1, FFPE2 und frischen Proben nach snRandom-seq. e t-SNE- und RNA-Geschwindigkeitsanalyse von snRNAs aus FFPE-Maushoden durch snRandom-seq. Die Geschwindigkeit wird als schwarze Pfeile in verschiedenen Zelltypen in unterschiedlichen Farben angezeigt. Die schwarzen Pfeile zeigen den RNA-Reifungsverlauf. f Prozent der gespleißten und ungespleißten Transkripte in verschiedenen Zelltypen. g Zellzyklusanalyse von FFPE-Maushoden durch snRandom-seq. Punkte in t-SNE wurden durch identifizierte Zellzyklusphasen (G1, G2M oder S) gefärbt. Roter gestrichelter Kreis: zwei Subpopulationen später Spermatozyten in der G2M-Phase mit aktiver Transkriptionsaktivität. Quelldaten werden als Quelldatendatei bereitgestellt.

Wir haben außerdem weitere FFPE-Mausgewebe hinzugefügt, um den biologischen Nutzen von snRandom-seq-Daten zu demonstrieren. Insgesamt haben wir 19.258 Einzelkerne aus vier FFPE-Mausgeweben (Herz, Niere, Hoden und Leber) mit snRandom-seq sequenziert und analysiert und insgesamt 25 Zelltypen (wie Hepatozyten, Keimzellen, Fibroblasten, Kardiomyozyten usw.) identifiziert .). (Ergänzende Abb. 10a, b). Es konnte eine Unterrepräsentation von Immunzellen festgestellt werden, was mit früheren Erkenntnissen über die Zelltypzusammensetzung von Einzelkern-RNA-seq-Bibliotheken übereinstimmt27.

Der große Anteil an intronischen Sequenzen, die in FFPE-Proben nachgewiesen wurden (Abb. 3b), deutete darauf hin, dass snRandom-seq-Daten besser für die RNA-Geschwindigkeitsanalyse geeignet wären, indem neu transkribierte RNAs (ungespleißt) von reifen RNAs (gespleißt) unterschieden würden28. Als nächstes haben wir snRandom-seq auf FFPE-Maushoden angewendet, wo die Spermatogenese ein hervorragendes Modell zur Untersuchung der Zelldynamik ist. In Übereinstimmung mit anderen Studien an frischen Hoden mittels scRNA-seq29,30 ordnete t-SNE Keimzellen in Übergangsstadien (hauptsächlich frühe und späte Spermatozyten) so an, dass sie in kontinuierlicher Abfolge vorliegen. Im Gegensatz dazu liegen undifferenzierte Spermatogonien und reife Spermatiden in Clustern vor (Abb. 4e). Die durch erkannte entstehende Transkripte berechneten Geschwindigkeiten wurden im t-SNE-Diagramm visualisiert und zeigten unterschiedliche Geschwindigkeitsvektorrichtungen in verschiedenen Zelltypen, insbesondere in den Zellen, die sich links von frühen und späten Spermatozyten befinden (Abb. 4e, f). In Kombination mit der Analyse der Zellzykluszustände auf Basis der Genexpression ergab die RNA-Geschwindigkeit einen offensichtlichen Zellreifungsverlauf bei zwei Subpopulationen später Spermatozyten in der G2M-Phase mit aktiver Transkriptionsaktivität (Abb. 4g).

Schließlich haben wir snRandom-seq auf eine etwa zwei Jahre alte klinische FFPE-Probe des Subtyps humanes makrotrabekulär-massives (MTM) hepatozelluläres Karzinom (HCC) angewendet (Abb. 5a). Wir haben gemäß den histopathologischen Untersuchungen einen interessierten Tumorbereich auf dem Paraffinblock ausgewählt (Abb. 5b) und eine snRandom-seq durchgeführt. snRandom-seq identifizierte 5914 echte Kerne und erkannte einen Median von 3220 Genen und einen Median von 8182 UMIs pro Kern in dieser klinischen FFPE-Probe (ergänzende Abb. 11a, Abb. 5b). Mit zunehmender Sequenzierungstiefe erkannte snRandom-seq etwa 8000 Gene bei Sättigung (ergänzende Abbildung 11b). In der Probe wurde ein breites Spektrum an RNA-Biotypen nachgewiesen, darunter lncRNAs, snRNAs, miscRNAs, miRNAs und snoRNAs (ergänzende Abbildung 11c). Die unbeaufsichtigte Clusterbildung des einzelnen Kerns der menschlichen Leber ergab mehrere unterschiedliche Cluster. Die wichtigsten Zelltypen der menschlichen Leber konnten anhand der bekannten Zelltypmarker31 anhand der menschlichen Probe identifiziert werden, darunter Hepatozyten (APOA1), Kupffer-Zellen (CD163), T-Zellen (CD3E), Fibroblasten (PDGFB) und Plasmazellen (FCRL5). ) (Abb. 5d, ergänzende Abb. 11d). Bemerkenswerterweise wurde ein Subcluster von Hepatozyten (Hepatozyten-2) von der Haupthepatozytenpopulation abgetrennt, mit hoher Expression des proliferativen Markers MKI67 und der beiden anderen Marker (ASPM und TOP2A), von denen berichtet wurde, dass sie mit der HCC-Progression in Zusammenhang stehen32,33. (Abb. 5e). Unterdessen ergab die Zellzyklusanalyse dieser snRNAs, dass sich die meisten Zellen im Hepatozyten-2-Cluster in der Phase G2M befanden (Abb. 5f), was darauf hindeutet, dass es sich beim Hepatozyten-2-Cluster um eine Gruppe sich teilender Tumorzellen handeln könnte. Nachdem wir die Zellkommunikation zwischen den Clustern weiter untersucht hatten (Abb. 5g), stellten wir fest, dass Hepatozyten-1 und Hepatozyten-2 unterschiedliche ausgehende und eingehende Signalmuster aufwiesen (Abb. 5h). Hepatozyten-2 empfängt hauptsächlich Signale von Plasmazellen über den BMP-Signalweg (ergänzende Abbildung 12a), der Berichten zufolge mit dem Fortschreiten des Tumors bei HCC korreliert 34, 35. Die Analyse der Ligand-Rezeptor-Paare ergab, dass Plasmazellen Signale bevorzugt über BMP6-(ACVR1 + ACVR2A) an Hepatozyten-2 sendeten und die Kommunikation zwischen Plasmazellen und Hepatozyten-2 über spezifische Ligand-Rezeptor-Paare verfügt, darunter BMP6-(BMPR1B + BMPR2). BMP6-(BMPR1B + ACVR2B), BMP6-(BMPR1B + ACVR2A), BMP6-(BMPR1A + ACVR2A) und BMP6-(ACVR1 + ACVR2A) (Abb. 5i). Die Genexpression zeigte auch, dass BMPR1B und ACVR2A spezifische Expressionen in Hepatozyten-2 aufweisen (ergänzende Abbildung 12b). Insgesamt entdeckte snRandom-seq eine proliferative und aktivierte Subpopulation von Hepatozyten aus einer klinischen FFPE-Probe, was einen wertvollen Hinweis für weitere Studien in der Zukunft liefert.

a Experimenteller Überblick über die klinische FFPE-Probe des Subtyps humanes makrotrabekulär-massives hepatozelluläres Karzinom (MTM-HCC) für snRandom-seq. b Histologisches Erscheinungsbild von MTM-HCC bei geringer Vergrößerung (links, Maßstabsbalken, 5 mm) und hoher Vergrößerung (rechts, Maßstabsbalken, 200 μm). Roter gestrichelter Kreis: Tumorbereich. Blauer gestrichelter Kreis und Linie: Probenahmebereich. Weißer gestrichelter Kreis und Linie: vergrößerter Bereich. c Violin-Plots und Box-Plots, die die Anzahl der Gene und UMIs zeigen, die in der klinischen FFPE-Menschenprobe durch snRandom-seq entdeckt wurden. MTM-HCC-Kerne: n = 5914. Die Daten wurden als Medianwerte dargestellt. Die Daten im Boxplot entsprachen dem ersten und dritten Quartil (unteres und oberes Scharnier) und dem Median (Mitte). Die Daten im Boxplot entsprachen dem ersten Quartil (untere Scharniere), dem dritten Quartil (obere Scharniere) und dem Median (Mitte). Der obere Whisker erstreckte sich vom Scharnier bis zu den Maxima, nicht weiter als 1,5 * IQR vom Scharnier entfernt. Der untere Whisker erstreckte sich vom Scharnier bis zu den Minima von höchstens 1,5 * IQR des Scharniers. d t-SNE-Karte der aus der FFPE-Probe isolierten Kerne basierend auf ihrer Genexpression. Sechs Zelltypen, darunter zwei hepatozelluläre Subtypen, wurden kommentiert und gezeigt. e Top drei Marker für jeden der sechs Zelltypen. f Prozentsätze der Kerne in Phase G1, G2M oder S in den sechs Zelltypen. g Die Gesamtzahl der Interaktionen zwischen verschiedenen Zellpopulationen. Die Kreisgrößen repräsentierten die Anzahl der Zellen in jeder Zellgruppe und die Kantenbreite repräsentierte die Kommunikationswahrscheinlichkeit. h Die Heatmap zeigt die ausgehenden Signalmuster (links) und eingehenden Signalmuster (rechts) jedes Zellclusters. i Blasendiagramme, die die Kommunikationswahrscheinlichkeit und statistische Signifikanz von Rezeptor-Liganden-Paaren im BMP-Signalnetzwerk zeigen. Die Punktfarbe repräsentierte Kommunikationswahrscheinlichkeiten und die Punktgröße repräsentierte berechnete p-Werte. Leerzeichen bedeuten, dass die Kommunikationswahrscheinlichkeit Null war. p-Werte wurden aus einem einseitigen Permutationstest berechnet. Quelldaten werden als Quelldatendatei bereitgestellt.

snRandom-seq wurde auch an einer FFPE-Probe des menschlichen normalen HCC-Subtyps durchgeführt (ergänzende Abbildung 13a). Basierend auf den snRandom-seq-Daten wurden eine ausreichende Genzahl und UMI-Zahl festgestellt und Hauptzellcluster der Leber identifiziert (ergänzende Abbildung 13b, c). Frühere Studien haben darauf hingewiesen, dass lncRNAs eine gewebespezifische Expression aufweisen36,37, die bei routinemäßigen Einzelzell-RNA-Sequenzanalysen aufgrund ihrer geringen Expression immer ignoriert wird. Wir fanden heraus, dass Hepatozytencluster des normalen HCC-Subtyps eine deutliche Expression von lncRNAs aufwiesen, einschließlich LINC02476 und LINC01151 in Hepatozyten-2, LINC00540, LINC02307 und LINC02109 in Hepatozyten-3, LINC02384 in Hepatozyten-4 (ergänzende Abbildung 13d). Es wurde berichtet, dass LINC02476 den malignen Phänotyp von HCC fördert, indem es miR-497 schwächt und die HMGA2-Expression erhöht38, und LINC00540 beeinflusst das Fortschreiten und die Metastasierung von HCC beim Menschen über den NKD2-abhängigen Wnt/β-Catenin-Weg39. Diese Ergebnisse legen nahe, dass Hepatozyten-2 (exprimiert LINC02476) und Hepatozyten-3 (exprimiert LINC00540) des normalen HCC-Subtyps eine unterschiedliche Pathogenese aufweisen könnten. Zusammengenommen ist snRandom-seq mit den Vorteilen der Abdeckung von Transkripten in voller Länge vielversprechend für die lncRNA-Analyse in der Krebsbiologie.

Wir führten außerdem eine Anwendung von snRandom-seq an einem passenden Paar anfänglicher und rezidivierter klinischer FFPE-Proben desselben Patienten mit Lebermetastasen bei kolorektalem Krebs (CRLM) durch. snRandom-seq erkannte Mediane von ~1000 Genzahlen und ~2000 UMI-Zahlen sowohl in anfänglichen als auch in rezidivierten FFPE-Proben (ergänzende Abbildung 14a). Die Zellen aus den anfänglichen und rezidivierten FFPE-Proben wurden umfassend integriert und die wichtigsten Zelltypen (Hepatozyten, Krebszellen, T-Zellen, Fibroblasten, myeloische Zellen, Endothelzellen, Sternzellen, Makrophagen, Cholangiozyten, B/Plasmazellen) wurden identifiziert beide Proben (Ergänzende Abb. 14b, c). Wir beobachteten, dass der Anteil an T-Zellen in der rezidivierten FFPE-Probe höher war (ergänzende Abbildung 14d), was auf eine aktivere Antitumor-Immunantwort in der rezidivierten Probe schließen lässt. Konsistent waren die Anteile der dominierenden Krebscluster (Krebszellen-1, –2 und –3) in der rezidivierten Probe verringert (ergänzende Abbildung 14d). Allerdings war der Anteil der Krebszellen-4 in der rezidivierten Probe erhöht (ergänzende Abbildung 14d). Wir fanden außerdem heraus, dass die Gene, die für den Lipidzusammensetzungsregulator (SCD) und Proteine, die Lipide binden (APOA2, APOC3 und APOA1), kodieren, in der rezidivierten Probe hohe Expressionsniveaus im Krebszell-4-Cluster aufwiesen (ergänzende Abbildung 14e), was auf ein erhöhtes Lipid schließen lässt Metabolismus im Krebszell-Subcluster des rezidivierten CRLM.

Wir haben eine tröpfchenbasierte Hochdurchsatz-snRNA-seq-Methode für archivierte FFPE-Gewebe entwickelt, indem wir Zufallsprimer verwenden, um Gesamt-RNAs voller Länge aus einzelnen Kernen empfindlich und umfassend zu erfassen, was daher einen entscheidenden Fortschritt für die Profilierung einzelner Kerntranskriptome aus FFPE-Geweben darstellt andere Arten von biologischen Proben von geringer Qualität. Es ist erwähnenswert, dass snRandom-seq routinemäßige molekularbiologische Verfahren und eine ausgereifte mikrofluidische Tröpfchen-Barcoding-Plattform verwendet, die der derzeit beliebten 10X Genomics-Plattform ähnelt. Daher ist snRandom-seq für groß angelegte Anwendungen einfach zu bedienen und zu kommerzialisieren.

Die molekularbiologische Anwendung von FFPE-Geweben war aufgrund der chemisch vernetzten und minderwertigen RNA schon immer eine Herausforderung. Obwohl einzelne Kerne aus FFPE-Geweben isoliert werden könnten und die RNA-Vernetzung durch Hitze und Proteaseverdau rückgängig gemacht werden könnte, ist die beliebte Oligo(dT)-basierte RNA-Einfangstrategie bei diesen minderwertigen Proben nicht effizient, wie die snFFPE-seq mit zeigt 10X Chromium Single Cell 3' Solution V3-Plattform15, sowie der ungültige Oligo(dT)-Primer in unserer snRandom-seq. snPATHO-Seq14, das die 10X Genomics-Sondentechnologie für den FFPE-Kern übernommen hat, kann die Gensignaturen für interessierende Gene widerspiegeln, während es nur auf einen sehr kleinen Teil der Transkriptome abzielt. Durch die Verwendung des auf Zufallsprimern basierenden Ansatzes sind wir in der Lage, eine unvoreingenommene Einzelkern-Transkriptionsprofilierung effizient an den FFPE-Proben durchzuführen. Wir planen auch eine Integration der snRandom-seq-Chemie mit der räumlichen Barcode-Technologie3,40, die eine hochempfindliche und umfassende räumliche Genexpressionsanalyse in FFPE-Geweben in Kombination mit der Routinehistologie ermöglicht. Mikroben sind eine weitere Art anspruchsvoller Probe für scRNA-seq, deren mRNA-Gehalt sehr gering ist und in der Regel keine Poly(A)-Schwänze am 3′-Ende vorhanden sind41. Wir versuchen, snRandom-seq zu modifizieren und seine Anwendung auf Einzelmikroben-RNA-seq mit hohem Durchsatz und hoher Empfindlichkeit zu erweitern.

Im Vergleich zu den hochmodernen Hochdurchsatz-snRNA-Seq-Methoden für FFPE-Proben14,15 übertrifft snRandom-seq diese Methoden aus verschiedenen Perspektiven, was durch die guten Leistungen bei der Identifizierung des Zelltyps, der Analyse der differentiellen Expression und dem Zellzyklus unterstützt wird Phasenanalyse. Hochwertige und hochempfindliche snRNA-seq-Daten aus klinischen FFPE-Proben von snRandom-seq ermöglichen die Aufdeckung zelltypspezifischer Zielgene oder die Identifizierung seltener Subpopulationen für eine präzise Diagnose und Behandlung menschlicher Krankheiten. Darüber hinaus ermöglichen Zufallsprimer, dass snRandom-Seq mehr Genkörperregionen abdeckt, was den Nachweis einer großen Menge nichtkodierender RNAs und den weiteren Nutzen entstehender Transkripte bei der RNA-Geschwindigkeitsanalyse ermöglicht. Wir haben entstehende Transkripte für die RNA-Geschwindigkeitsanalyse verwendet und in dieser Studie einen offensichtlichen Zellreifungsverlauf für zwei spezifische Subpopulationen aufgedeckt. Darüber hinaus ermöglichen diese vollständigen snRNA-seq-Datensätze eine umfassende Analyse der Variation der Kopienzahl (CNV), des alternativen Spleißens und der Mutationen auf Einzelzell-/Kernebene.

Zusammenfassend lässt sich sagen, dass die in dieser Studie beschriebenen einfachen experimentellen Protokolle und umfassenden transkriptomischen Informationen aus den FFPE-Geweben voraussichtlich in der Zukunft groß angelegte Anwendungen von snRandom-seq in Grundlagenforschung und klinischer Forschung ermöglichen werden.

Alle Verfahren mit Mäusen in dieser Studie wurden vom Animal Care and Use Committee der Universität Zhejiang genehmigt (Genehmigungsnummern: ZJU20170466). Die Sammlung menschlicher Proben und die in dieser Studie durchgeführten Untersuchungen wurden von der Forschungsethikkommission des First Affiliated Hospital der Zhejiang University School of Medicine genehmigt (Genehmigungsnummern: IIT20220893A). Klinische Informationen wurden nach schriftlicher Einverständniserklärung gesammelt. Diese Studie entspricht den Leitlinien des Ministeriums für Wissenschaft und Technologie (MOST) für die Überprüfung und Genehmigung menschlicher genetischer Ressourcen (Genehmigungsnummern: 2023BAT0303).

HEK293T-Zellen (Kat. CL-0005) und 3T3-Zellen (Kat. CL-0006) wurden bei der Firma (Procell Life Science&Technology) bestellt. Männliche Wildtyp-C57BL6/J-Mäuse (6–8 Wochen alt) wurden bei Shanghai SLAC Laboratory Animal bestellt. In der Studie wurden ausschließlich männliche Mäuse verwendet. Das Geschlecht wurde auf der Grundlage ähnlicher Studien in diesem Bereich bestimmt. Die Mäuse wurden einzeln unter Standardlaborbedingungen gehalten, einschließlich eines 12-stündigen Hell-Dunkel-Zyklus, Temperaturen von 18–23 °C und 40–60 % Luftfeuchtigkeit, mit freiem Zugang zu Mäusenahrung und Wasser. Alle Experimente entsprachen den relevanten regulatorischen Standards im Labortierzentrum der Universität Zhejiang. FFPE-Proben von Mausgewebe wurden von Core Facilities der Zhejiang University School of Medicine hergestellt. FFPE-Gewebe klinischer Krebserkrankungen beim Menschen wurden vom First Affiliated Hospital der Zhejiang University School of Medicine bereitgestellt. Die FFPE-Gewebe von makrotrabekulär-massivem hepatozellulärem Karzinom und normalem HCC wurden von zwei männlichen chinesischen Patienten (Alter 43 bzw. 45) durch chirurgische Resektion entnommen. Das übereinstimmende Paar klinischer Erstproben und rezidivierter FFPE-Proben wurde von demselben männlichen chinesischen Patienten (ursprüngliches Alter 62, rezidiviertes Alter 64) mit Lebermetastasen bei kolorektalem Krebs entnommen. Klinische Informationen wurden nach schriftlicher Einverständniserklärung gesammelt.

HEK293T-Zellen und 3T3-Zellen wurden in Dulbecco's Modified Eagle's Medium (DMEM, Gibco, Kat.-Nr. 11965092), ergänzt mit 10 % (v/v) hitzeinaktiviertem fötalem Rinderserum (FBS, Gibco, Kat.-Nr. 26010074), gehalten und bei 37 °C in einem 5 % CO2-Inkubator (Thermo Heracell 240i). Beide Zellen wurden alle 2 Tage passagiert. Für das Artenmischungsexperiment wurden HEK293T-Zellen und 3T3-Zellen geerntet und dreimal in PBS durch 3-minütiges Zentrifugieren bei 4 °C und 600 g gewaschen. Die Zellen wurden durch vorkalte Kernlysepuffer (1X PBS mit 0,1 % Nonidet P-40 (NP-40, Aladdin, Kat.-Nr. N274254) und 1 U/μL RNase-Inhibitor (Invitrogen, Kat.-Nr. N8080119)) lysiert und bei 4 °C inkubiert C für 5 Min. Anschließend wurden die frischen Kerne dreimal gewaschen und durch Zugabe von 1 ml 4 % Paraformaldehyd (PFA, Aladdin, Kat.-Nr. P395744) in PBS und 15-minütiges Inkubieren bei Raumtemperatur fixiert. Als nächstes wurde das PFA durch 3-minütiges Zentrifugieren bei 600 g verworfen und die Kerne wurden dreimal mit 1 ml vorgekühltem Waschpuffer (1X PBS mit 1 U/μL RNase-Inhibitor) gewaschen. Die Kerne wurden durch Zugabe von 500 µl 0,1 % Triton Dann wurde 1 ml Waschpuffer direkt zu den Kernen gegeben und die Kerne wurden dreimal mit 1 ml vorgekühltem Waschpuffer gewaschen. HEK293T-Kerne und 3T3-Kerne wurden jeweils gezählt und gleichmäßig gemischt. Anschließend wurde die Mischung gemäß dem folgenden snRandom-seq-Protokoll zu Einzelkern-RNA-seq verarbeitet.

FFPE-Proben wurden aus dem Paraffinblock geschnitten und zweimal mit 1 ml Xylol (Aladdin, Kat.-Nr. X112054) 5 Minuten lang bei Raumtemperatur gewaschen, um das Paraffin zu entfernen. Die Proben wurden vorsichtig redehydriert, indem die Proben in eine abgestufte Reihe von Ethanollösungen (Aladdin, Kat.-Nr. E130059) getaucht wurden, beginnend mit reinem 100 %igem Ethanol und endend mit 30 %igem Ethanol. Die Proben wurden dann zweimal mit vorgekühltem Waschpuffer gewaschen und mit einem Dounce-Homogenisator (Bellco Glass, Inc. Dounce Homogenizer 2 mL, Kat.-Nr. 50-194-5204) in Gegenwart von vorgekühltem Lysepuffer (1X PBS-Puffer, 0,1 % Triton X-100, 1 U/μL RNase-Inhibitor) auf Eis. Nach der Homogenisierung wurde zusätzlich 1 ml Lysepuffer zum Spülen des Tropfers verwendet, und 100 μl 10 mg/ml Proteinase K (Sangon Biotech, Kat.-Nr. A610451) wurden zum Lysepuffer gegeben und 5 Minuten lang bei 37 °C inkubiert . Anschließend wurden die isolierten Kerne durch ein 20-μm-Zellsieb (pluriSelect, Kat.-Nr. 43-10020-40) filtriert und zweimal mit Waschpuffer gewaschen. Ein Aliquot der Kerne wurde mit DAPI-Färbelösung (4′,6-Diamidino-2-phenylindol) (Abcam, Kat.-Nr. ab228549) gefärbt, auf ein Hämozytometer geladen und unter einem umgekehrten Fluoreszenzmikroskop (Nikon Eclipse, Ts2-FL) beobachtet. Die qualifizierten Einzelkerne wurden gemäß dem folgenden snRandom-seq-Protokoll zu Einzelkern-RNA-Seq verarbeitet. Ein detailliertes Protokoll, einschließlich des Volumens des Lysepuffers und des Permeabilisierungspuffers, der Reaktionssysteme und Reaktionsprogramme, wurde in der Zusatzinformationsdatei bereitgestellt (Ergänzende Anmerkung 1: snRandom-seq-Protokoll 1.0).

Für FFPE-Proben wurden frische Gewebeproben erwachsener Mäuse von derselben Maus entnommen. Frische Proben wurden zweimal mit vorgekühltem Waschpuffer gewaschen, in Stücke geschnitten und mit einem Dounce-Homogenisator mit vorgekühltem Lysepuffer auf Eis homogenisiert. Nach der Homogenisierung wurden die isolierten Kerne zweimal mit Waschpuffer gewaschen. Die frischen Einzelkerne wurden gemäß dem Zelllinienprotokoll fixiert, permeabilisiert und qualifiziert und dann gemäß dem folgenden snRandom-seq-Protokoll zu Einzelkern-RNA-Sequenz verarbeitet.

Zwei identische Proben von FFPE-Mausnieren wurden getrennt aus demselben Paraffinblock geschnitten und dann mit dem snRandom-seq-Protokoll verarbeitet.

Die qualifizierten FFPE-Kerne wurden gezählt und insgesamt 100.000–1000.000 Kerne für die In-situ-DNA-Blockierung verwendet. Die folgende Reaktionsmischung wurde vorbereitet: Kerne in 25,5 µL PBS, 5 µL 10 µM Blockprimer, 2 µL DNA-Polymerase, 10 µL 5X DNA-Polymerisationspuffer, 5 µL 100 mM dNTP, 2,5 µL RNase-Inhibitor. Die Sequenz des Blockprimers wurde in der Zusatzinformationsdatei (Ergänzungstabelle 1: Primer) bereitgestellt. Das DNA-Polymerase-Kit war im VITAPilote-EFT1300-Kit (Kat.-Nr. R20123124) enthalten, das bei M20 Genomics bestellt wurde. Die Reaktionsmischung wurde 30 Minuten lang bei 37 °C inkubiert. Nach der Inkubation wurden die Kerne dreimal mit PBST (1X PBS mit 0,05 % T-ween 20) gewaschen, um die restlichen blockierenden Primer und Primerdimere abzuwaschen.

In situ wurde die reverse Transkription mit dem folgenden Reaktionsgemisch durchgeführt: 100.000–1000.000 Kerne in 22,5 µL PBS, 5 µL 10 µM Zufallsprimer, 5 µL 10 µM Oligo(dT)-Primer, 2,5 µL Reverse Transkriptase, 10 µL 5X Reverse Transkriptionspuffer, 2,5 µL 100 mM dNTP, 2,5 µL RNase-Inhibitor. Die Sequenzen von Zufallsprimern und Oligo(dT)-Primern wurden in der Zusatzinformationsdatei (Ergänzungstabelle 1: Primer) bereitgestellt. Das Reverse-Transkriptions-Kit war im VITAPilote-EFT1300-Kit (Kat.-Nr. R20123124) enthalten, das bei M20 Genomics bestellt wurde. Das Reaktionsgemisch wurde mit zwölf Zyklen mehrfacher Temperung von 8 °C auf 42 °C und 30 Minuten bei 42 °C inkubiert. Nach der umgekehrten Transkription wurden die Kerne dreimal mit PBST gewaschen, um die restlichen Zufallsprimer und Primerdimere abzuwaschen.

Für das dA-Tailing wurde die folgende Reaktionsmischung vorbereitet: 100.000–1000.000 Kerne in 39 µL PBS, 5 µL 10X TdT-Reaktionspuffer, 0,5 µL TdT-Enzym, 0,5 µL 100 mM dATP (NEB, Kat.-Nr. N0440S), 5 µL CoCl2 . Das TdT-Reaktionskit wurde bei NEB bestellt (Kat.-Nr. M0315S), einschließlich 10X TdT-Reaktionspuffer, TdT-Enzym und CoCl2. Das dA-Tailing-Reaktionsgemisch wurde 30 Minuten lang bei 37 °C inkubiert und dann dreimal mit PBS mit 0,05 % Tween 20 gewaschen.

Mikrofluidische Geräte wurden gemäß unserer vorherigen Arbeit17 mit AutoCAD (2021, AutoDESK, USA) entworfen. Computergestützte Designs wurden als Fotomasken gedruckt, um ein erhabenes Muster als Master auf einem Siliziumwafer zu verfestigen. Der Geräteaufbau ist in der Beilage 1a und der Beilage 2a dargestellt. Die Kanaltiefe bei Geräten für Hydrogelkügelchen beträgt 30 μm und für die Zellverkapselung 50 μm. Mikrofluidische Geräte wurden unter Verwendung von Polydimethylsiloxan (PDMS) gemäß dem beschriebenen Protokoll42 hergestellt. PDMS-Basis und Härter (10:1, Gew./Gew.) wurden mit dem Thinky Mixer gemischt und unter Verwendung des Masters als Form in Kanäle markiert. Anschließend wurde eine PDMS-Platte erworben und die Einlass- und Auslassöffnungen gestanzt. Die Kanalseite wurde mit Sauerstoffplasma behandelt und die PDMS-Platte wurde mit einem Glasobjektträger verbunden, um das mikrofluidische Gerät zu erhalten. Vor der Verwendung dieses Geräts wurden die Kanaloberflächen mit Perfluordodecyltrichlorsilan zur fluorphilen Beschichtung behandelt, um monodisperse und zuverlässige Tröpfchen zu erzeugen.

Wir haben die Barcode-Perlen auf der Grundlage früherer Arbeiten16,17 entworfen und sie gemeinsam mit der Firma M20 Genomics angepasst. Hydrogelkügelchen wurden durch mikrofluidische Emulgierung und Polymerisation der Acrylamid-Primer-Mischung synthetisiert. Die Acrylamid-Primer-Mischung enthält 1× Acrylamid:Bis-Acrylamid-Lösung (Invitrogen, Kat.-Nr. AM9022), 50 μM Acrydit-modifizierte Oligonukleotide, 10 % Gew./Vol. Ammoniumpersulfat (APS, Sangon Biotech Kat.-Nr. A100486-0025) und 1 ×Tris-gepufferter Kochsalzlösung-EDTA-Triton (TBSET)-Puffer. In dieser Studie wurde das Acrydit-modifizierte Oligonukleotid so konzipiert, dass es eine Desoxy-Uridin-Base anstelle einer photospaltbaren Einheit enthält. Dann wurden die Perlen in einer 96-Well-Platte mit einzigartigen Barcode-Primern für dreistufige Ligationen anstelle von zweistufigen Verlängerungsreaktionen aufgeteilt. Die Sequenzen der Barcode-Primer wurden in der Zusatzinformationsdatei (Ergänzungstabelle 1: Primer) bereitgestellt.

Die Tröpfchen-Barcodierung wurde gemäß früherer Arbeiten16,17 durchgeführt. Die Morphologie einzelner Kerne nach In-situ-Reaktionen wurde mit einem optischen Mikroskop beobachtet. Einzelne Kerne wurden gezählt und mit einer 30 %igen Dichtegradientenlösung verdünnt. Kerne, 2X DNA-Verlängerungsreaktionsmischung und Barcode-Kügelchen wurden mithilfe der Mikrofluidikplattform wie zuvor beschrieben in Tröpfchen eingekapselt. Der 2X DNA-Verlängerungsreaktionsmix wurde bei M20 Genomics bestellt. Anschließend wurden die Emulsionen 1 Stunde lang bei 37 °C, 30 Minuten lang bei 50 °C, 30 Minuten lang bei 60 °C und 20 Minuten lang bei 75 °C inkubiert. Nach der Barcode-Reaktion wurden die Tröpfchen durch Mischen mit PFO-Puffer aufgebrochen. Die wässrige Phase wurde entnommen und mit Ampure XP-Perlen (Beckmen, Kat.-Nr. A63881) gereinigt. Eine PCR wurde durchgeführt, um das gereinigte Produkt mit den Primern Primer1 und Primer2 zu amplifizieren (Ergänzungstabelle 1). Das amplifizierte Produkt wurde mit Ampure XP-Perlen gereinigt und mit Qubit (Invitrogen) quantifiziert.

Nach der Amplifikation und Reinigung wurde das VAHTS Universal DNA Library Prep Kit für Illumina V3 (Vazyme, Kat.-Nr. ND607-01) zum Aufbau der Bibliothek verwendet. Die eingegebene DNA wurde mit Qubit2.0 (Life Technologies) quantifiziert und die Größe mit dem Qsep100™ DNA Fragment Analyzer (BIOptic) gemessen. Anschließend wurden Endreparatur und Adenylierung durchgeführt. Das Reaktionsgemisch, das fragmentierte DNA (50 ng), Endreparaturpuffer, Endreparaturenzyme und nukleasefreies Wasser enthielt, wurde 30 Minuten lang bei 30 °C inkubiert und 30 Minuten lang bei 65 °C inaktiviert. Das fertige End-Prep-Reaktionsgemisch wurde mit Arbeitsadapter und Ligationsenzymen versetzt und dann 15 Minuten bei 20 °C inkubiert. Die ligierte DNA wurde gereinigt und die Größe mit AMPure XP-Perlen (Beckmen, Kat.-Nr. A63881) ausgewählt. Die Amplifikation der Bibliothek wurde verfolgt und die Reinigung mit AMPure XP-Perlen durchgeführt. Die endgültige Bibliothek wurde mit Qubit2.0 quantifiziert und die Bibliotheksgröße mit dem Qsep100™ DNA Fragment Analyzer gemessen. Die Bibliothekssequenzierung wurde mit dem NovaSeq 6000 und dem S4 Reagent Kit mit Paired-End-Reads von 150 durchgeführt.

Zunächst wurden Primersequenzen und zusätzliche Basen, die durch den dA-Tailing-Schritt erzeugt wurden, in den Rohsequenzierungsdaten gekürzt. Dann haben wir für jeden Read1 UMI (8 Nt) und zellspezifischen Barcode (30 Nt) extrahiert und sequenzierte Barcodes zusammengeführt, die eindeutig demselben akzeptierten Barcode mit einer Hamming-Distanz von 2 Nt oder weniger zugeordnet werden können. Read2 wurde verwendet, um die Genexpressionsmatrix durch das STARsolo-Modul in STAR (2.7.10a) mit angemessenen Parametern zu generieren. Die gültigen Kerne wurden von STARsolo identifiziert. Bedtools (2.26.0) wurde zur Berechnung der Transkriptomabdeckung verwendet. IGV(2.13.2) wurde verwendet, um ein Diagramm der Genomabdeckung zu erstellen. ggplot2 (3.3.5) in R (4.2.1) wurde verwendet, um Rohdiagramme zu erstellen.

Die Barcode-gefilterte Genexpressionsmatrix wurde mit entfernten mitochondrialen RNAs und ribosomalen RNAs erstellt. Die Analyse und Visualisierung der snRNA-seq-Daten erfolgte mit RStudio und dem Seurat 3-Toolkit, einschließlich Vorverarbeitung, Integration, Visualisierung, Clustering, Identifizierung des Zelltyps und Tests der differentiellen Expression. Kerne mit weniger als 200 nachgewiesenen Genen und Gene, die in weniger als drei Kernen nachgewiesen wurden, wurden herausgefiltert. Für die Integration von snRNA-seq-Datensätzen wurden die Zählungen zunächst mithilfe der sctransform-Funktion in Seurat43 normalisiert und mithilfe der kanonischen Korrelationsanalyse (CCA)44 integriert. Integrationen wurden über die FFPE/frischen Vergleichsproben (FFPE1, FFPE2 und frisch) durchgeführt. Für jede Probe wurden 2000 Anker identifiziert und snRNA-seq-Datensätze wurden mit der IntegrateData-Funktion unter Verwendung von 20 Dimensionen integriert44. Aus den integrierten Datensätzen wurde der Shared Nearest Neighbor (SNN)-Graph erstellt, indem die Hauptkomponentenanalyse (PCA), FindNeighbors mit 30 PCs und die FindClusters-Funktion mit einer Auflösung von 1 ausgeführt wurden. Cluster wurden mithilfe von t-distributed Stochastic Neighbor Embedding (t-SNE) visualisiert. der Hauptkomponenten, wie sie in Seurat implementiert sind. Die Zelltypidentitäten für jeden Cluster wurden manuell anhand einer veröffentlichten Liste von Markergenen bestimmt. Markergene wurden im Test mithilfe der FindAllMarkers-Funktion in Seurat identifiziert und es wurden Markergene beibehalten, die den Filterkriterien entsprachen (only.pos = TRUE, min.pct = 0,25, logfc.threshold = 0,25). Zellzyklusphasen wurden mithilfe einer in Seurat enthaltenen Funktion vorhergesagt, die jede Zelle basierend auf der Expression kanonischer Markergene für S- und G2/M-Phasen bewertet.

Um das Genexpressionsniveau zwischen FFPE und frischer Probe sowie zwischen den beiden technischen Replikaten zu vergleichen, haben wir die Zähldaten in Seurat (v3 und v4.1.1) importiert, normalisiert und die Daten mit den Standardeinstellungen skaliert. Anschließend haben wir den durchschnittlichen normalisierten Ausdruck mithilfe der AverageExpression-Funktion von Seurat berechnet. Danach zeichneten wir den natürlichen Logarithmus des Durchschnittsausdrucks mit einer zusätzlichen Pseudozählung auf und berechneten den Variationskoeffizienten und den p-Wert unter Verwendung von ggpubr (0.4.0) in R(4.2.1).

Die Ausgabedateien der snRandom-seq-Daten wurden mit scVelo (Version 0.2.4) verarbeitet, um gespleißte und nicht gespleißte Transkripte zu markieren, und die Ergebnisse wurden mit dem Paket velocyto.R 0.6 in R analysiert.

Die Zellkommunikationsanalyse wurde mit dem R-Paket CellChat (Version 1.6.1) mit Standardparametern durchgeführt.

Statistische Details zu jedem Experiment finden Sie in den Legenden der Abbildungen. Das mikrofluidische Einkapselungsexperiment, das FFPE-Einzelkernisolationsexperiment, das Perlensyntheseexperiment, das DNA-Fragmentanalyseexperiment, das Proteinase-K- und Kollagenase-Vergleichsexperiment und das RNA-Qualitätsvergleichsexperiment (DV200) wurden mehr als fünf Mal unabhängig voneinander mit ähnlichen Ergebnissen wiederholt. Das 293T-3T3-Mischungsexperiment und das DNA-Blockexperiment wurden dreimal unabhängig voneinander mit ähnlichen Ergebnissen wiederholt. Zur Vorbestimmung der Stichprobengröße wurde keine statistische Methode verwendet. Es wurden keine Daten von den Analysen ausgeschlossen. Die Experimente waren nicht randomisiert. Die Forscher waren während der Experimente und der Ergebnisbewertung nicht blind für die Zuteilung.

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Portfolio Reporting Summary.

Die in dieser Studie generierten snRandom-seq snRNA-seq-Datensätze wurden im Genome Sequence Archive unter den Zugangscodes „CRA010745“ (293T-3T3-Mischung und Maus-FFPE-Gewebe) und „HRA003712“ (MTM-HCC- und normale HCC-FFPE-Proben) hinterlegt. . Die öffentlichen scRNA-seq-Daten der 293T- und 3T3-Zellmischung mit 10X Chromium Single Cell 3′ Solution V3, die in dieser Studie verwendet wurden, sind im Short Read Archive unter dem Zugangscode „SRP073767“ verfügbar. Die öffentlichen scRNA-seq-Daten von 293T-Zellen durch VASA-Drop sind im Gene Expression Omnibus unter dem Zugangscode „GSE176588“ verfügbar. Quelldaten werden in diesem Dokument bereitgestellt.

Gnanapragasam, VJ Erschließung des molekularen Archivs: die neue Verwendung von formalinfixiertem, in Paraffin eingebettetem Gewebe für die Biomarkerforschung bei urologischem Krebs. BJU Int. 105, 274–278 (2010).

Artikel PubMed Google Scholar

Amini, P. et al. Ein optimiertes Protokoll zur Isolierung von RNA aus kleinen Abschnitten von mittels Laser erfasstem mikrodisseziertem FFPE-Gewebe, das für die Sequenzierung der nächsten Generation geeignet ist. BMC Mol. Biol. 18, 22 (2017).

Artikel PubMed PubMed Central Google Scholar

Liu, Y., DiStasio, M., Su, G. et al. Co-Mapping von High-Plex-Protein und gesamtem Transkriptom in zellulärer Auflösung mit räumlicher CITE-Seq. Nat Biotechnol https://doi.org/10.1038/s41587-023-01676-0 (2023).

Shalek, AK et al. Einzelzell-Transkriptomik zeigt bimodale Expression und Spleißen in Immunzellen. Natur 498, 236–240 (2013).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Jaitin, DA et al. Massiv parallele Einzelzell-RNA-Sequenz zur markerfreien Zerlegung von Geweben in Zelltypen. Wissenschaft 343, 776–779 (2014).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Rozenblatt-Rosen, O., Stubbington, MJT, Regev, A. & Teichmann, SA Der Atlas der menschlichen Zellen: von der Vision zur Realität. Natur 550, 451–453 (2017).

Artikel ADS CAS PubMed Google Scholar

Han, X. et al. Aufbau einer menschlichen Zelllandschaft auf Einzelzellebene. Natur 581, 303–309 (2020).

Artikel ADS CAS PubMed Google Scholar

Han, X. et al. Kartierung des Mauszellatlas durch Microwell-Seq. Zelle 172, 1091–1107.e1017 (2018).

Artikel CAS PubMed Google Scholar

Isakova, A., Neff, N. & Quake, SR Die Einzelzellquantifizierung eines breiten RNA-Spektrums zeigt einzigartige nichtkodierende Muster, die mit Zelltypen und -zuständen verbunden sind. Proz. Natl Acad. Wissenschaft. 118, e2113568118 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Salmen, F. et al. Hochdurchsatz-Gesamt-RNA-Sequenzierung in einzelnen Zellen mit VASA-seq. Nat. Biotechnologie. 40, 1780–1793 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Rosenberg, AB et al. Einzelzellprofilierung des sich entwickelnden Gehirns und Rückenmarks von Mäusen mit Split-Pool-Barcoding. Wissenschaft 360, 176–182 (2018).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Yu, B., van Tol, HTA, Stout, TAE & Roelen, BAJ Reverse-Transkriptions-Priming-Methoden beeinflussen die Normalisierungsauswahl für Genexpressionsniveaus in Eizellen und frühen Embryonen. Mol. Summen. Reproduktion. 27, gaab040 (2021).

Artikel PubMed PubMed Central Google Scholar

Sheng, K., Cao, W., Niu, Y., Deng, Q. & Zong, C. Effektive Erkennung von Variationen in Einzelzell-Transkriptomen mithilfe von MATQ-seq. Nat. Methoden 14, 267–270 (2017).

Artikel CAS PubMed Google Scholar

Vallejo, AF et al. snPATHO-seq: Freischaltung der FFPE-Archive für die Einzelkern-RNA-Profilierung. bioRxiv, 2022.2008.2023.505054 (2022).

Chung, H. et al. SnFFPE-Seq: Auf dem Weg zu einer skalierbaren Einzelkern-RNA-Seq von formalinfixiertem, in Paraffin eingebettetem (FFPE) Gewebe. bioRxiv, 2022.2008.2025.505257 (2022).

Wang, Y. et al. Auflösbare Polyacrylamidkügelchen für die Tröpfchen-DNA-Barcodierung mit hohem Durchsatz. Adv. Wissenschaft. 7, 1903463 (2020).

Artikel CAS Google Scholar

Ko, J., Wang, Y., Sheng, K., Weitz, DA & Weissleder, R. Sequenzierungsbasierte Proteinanalyse einzelner extrazellulärer Vesikel. ACS Nano 15, 5631–5638 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Datlinger, P. et al. Ultrahochdurchsatz-Einzelzell-RNA-Sequenzierung und Störungsscreening mit kombinatorischer Fluidindizierung. Nat. Methoden 18, 635–642 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Delley, CL & Abate, AR Modulare Barcode-Beads für die mikrofluidische Einzelzellgenomik. Wissenschaft. Rep. 11, 10857 (2021).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Zilionis, R. et al. Einzelzell-Barcodierung und -Sequenzierung mithilfe von Tröpfchen-Mikrofluidik. Nat. Protokoll. 12, 44–73 (2017).

Artikel CAS PubMed Google Scholar

Habib, N. et al. Massiv parallele Einzelkern-RNA-Seq mit DroNc-Seq. Nat. Methoden 14, 955–958 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Hu, P. et al. Analyse der Zelltypzusammensetzung und des aktivitätsabhängigen Transkriptionszustands im Gehirn von Säugetieren durch massiv parallele Einzelkern-RNA-Seq. Mol. Zelle 68, 1006–1015.e1007 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Zheng, GX et al. Massiv paralleles digitales Transkriptionsprofiling einzelner Zellen. Nat. Komm. 8, 14049 (2017).

Artikel ADS CAS PubMed PubMed Central Google Scholar

He, B. et al. Die Einzelzell-RNA-Sequenzierung enthüllt die mesangiale Identität und Artenvielfalt glomerulärer Zelltranskriptome. Nat. Komm. 12, 2141 (2021).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Clark, JZ et al. Darstellung und relative Häufigkeit zelltypselektiver Marker in RNA-Seq-Daten der gesamten Niere. Kidney Int 95, 787–796 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Chen, L. et al. Nomenklatur der Nierentubuli-Epithelzellen für Einzelzell-RNA-Sequenzierungsstudien. Marmelade. Soc. Nephrol. 30, 1358–1364 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Denisenko, E. et al. Systematische Bewertung von Gewebedissoziation und Speicherverzerrungen in Einzelzell- und Einzelkern-RNA-Sequenz-Workflows. Genombiol. 21, 130 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

La Manno, G. et al. RNA-Geschwindigkeit einzelner Zellen. Natur 560, 494–498.

Artikel ADS PubMed PubMed Central Google Scholar

Lukassen, S., Bosch, E., Ekici, AB & Winterpacht, A. Charakterisierung der Keimzelldifferenzierung bei der männlichen Maus durch Einzelzell-RNA-Sequenzierung. Wissenschaft. Rep. 8, 6521 (2018).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Jung, M. et al. Einheitliche Einzelzellanalyse der Hoden-Genregulation und -Pathologie in fünf Mausstämmen. eLife 8, e43966 (2019).

Artikel PubMed PubMed Central Google Scholar

Ramachandran, P. et al. Lösung der fibrotischen Nische der menschlichen Leberzirrhose auf Einzelzellebene. Natur 575, 512–518 (2019).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Zhang, H. et al. ASPM fördert das Fortschreiten des hepatozellulären Karzinoms, indem es die Wnt/β-Catenin-Signalübertragung aktiviert, indem es den durch Autophagie vermittelten Dvl2-Abbau antagonisiert. FEBS Open Bio 11, 2784–2799 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Dong, Y. et al. Topoisomerase vom Typ IIA (TOP2A) löst den epithelial-mesenchymalen Übergang aus und erleichtert das Fortschreiten des HCC durch Regulierung der Schneckenexpression. Bioengineered 12, 12967–12979 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Wang, Y. et al. LncRNA HAND2-AS1 fördert die Selbsterneuerung von Leberkrebs-Stammzellen über BMP-Signale. EMBO J. 38, e101110 (2019).

Artikel PubMed PubMed Central Google Scholar

Ning, J. et al. Ein durch M2-polarisierte Makrophagen induziertes Ungleichgewicht der TGF-β1/BMP-7-Signalwege fördert die Aggressivität des hepatozellulären Karzinoms. Mol. Dort. 29, 2067–2087 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Cabili, MN et al. Die integrative Annotation menschlicher großer intergener nichtkodierender RNAs enthüllt globale Eigenschaften und spezifische Unterklassen. Genes Dev. 25, 1915–1927 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Liu, SJ et al. Einzelzellanalyse langer nichtkodierender RNAs im sich entwickelnden menschlichen Neokortex. Genombiol. 17, 67 (2016).

Artikel PubMed PubMed Central Google Scholar

Duan, Y., Zhao, M., Jiang, M., Li, Z. & Ni, C. LINC02476 fördert den malignen Phänotyp des hepatozellulären Karzinoms durch Schwächung von miR-497 und Erhöhung der HMGA2-Expression. Onco zielt auf Ther. 13, 2701–2710 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Wu, D.-M. et al. Eine verringerte LINC00540-Expression hemmt das Fortschreiten und die Metastasierung von hepatozellulärem Karzinom beim Menschen über den NKD2-abhängigen Wnt/β-Catenin-Weg. SSRN Electronic J. https://doi.org/10.2139/ssrn.3377520 (2019).

Kishi, JY et al. Light-Seq: lichtgesteuerte In-situ-Barcodierung von Biomolekülen in fixierten Zellen und Geweben für eine räumlich indizierte Sequenzierung. Nat. Methoden 19, 1393–1402 (2022).

Westermann, AJ & Vogel, J. Artenübergreifende RNA-Seq zur Entschlüsselung von Wirt-Mikroben-Interaktionen. Nat. Rev. Genet. 22, 361–378 (2021).

Artikel CAS PubMed Google Scholar

Friend, J. & Yeo, L. Herstellung mikrofluidischer Geräte unter Verwendung von Polydimethylsiloxan. Biomicrofluidics 4, 026502 (2010).

Artikel PubMed PubMed Central Google Scholar

Hafemeister, C. & Satija, R. Normalisierung und Varianzstabilisierung von Einzelzell-RNA-seq-Daten mithilfe einer regulierten negativen Binomialregression. Genombiol. 20, 296 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Stuart, T. et al. Umfassende Integration von Einzelzellendaten. Zelle 177, 1888–1902.e1821 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Referenzen herunterladen

Das Projekt wurde von der National Natural Science Foundation of China (Nr. 32200073, YW, Nr. 82200977, ZX) und dem Leading Innovative and Entrepreneur Team Introduction Program of Zhejiang (Nr. 2021R01012, YW) unterstützt. Vielen Dank für die technische Unterstützung durch die Kerneinrichtungen des Zhejiang University Medical Center und des Liangzhu Laboratory. Wir danken Jingyao Chen und Chengcheng Zhang von den Core Facilities der Zhejiang University School of Medicine für ihre technische Unterstützung.

Diese Autoren haben gleichermaßen beigetragen: Ziye Xu, Tianyu Zhang, Hongyu Chen.

Abteilung für Labormedizin, erstes angegliedertes Krankenhaus, Medizinische Fakultät der Zhejiang-Universität, Hangzhou, China

Ziye Xu, Yu Chen und Yongcheng Wang

Liangzhu-Labor, Zhejiang University Medical Center, Hangzhou, China

Ziye Xu, Yuyi Zhu, Yuexiao Lv, Haide Chen, Guoji Guo und Yongcheng Wang

M20 Genomics, Hangzhou, China

Tianyu Zhang, Shengyu Ni, Fangru Lu, Zhaolun Wang, Hao Yang, Ling Dong und Jiong Liu

Medizinische Fakultät, Hangzhou City University, Hangzhou, China

Hongyu Chen & Longjiang-Fan

Institut für Bioinformatik, Zhejiang-Universität, Hangzhou, China

Hongyu Chen & Longjiang-Fan

James D. Watson Institut für Genomwissenschaften, Zhejiang-Universität, Hangzhou, China

Hongyu Chen & Longjiang-Fan

Hochschule für Biomedizintechnik und Instrumentenwissenschaft, Zhejiang-Universität, Hangzhou, China

Shunji Zhang, Hong Zhang und Yongcheng Wang

Abteilung für Biomedizinische Informatik, Harvard Medical School, Boston, USA

Jiaye Chen

Abteilung für Radiologie, erstes angegliedertes Krankenhaus, Medizinische Fakultät der Zhejiang-Universität, Hangzhou, China

Lili Yang & Feng Chen

Abteilung für kolorektale Chirurgie, erstes angegliedertes Krankenhaus der Zhejiang-Universität, Hangzhou, China

Weiqin Jiang

Abteilung für Nuklearmedizin und PET/CT-Zentrum, zweites angegliedertes Krankenhaus, Medizinische Fakultät der Zhejiang-Universität, Hangzhou, China

Hong Zhang

Abteilung für Pathologie und Abteilung für medizinische Onkologie des zweiten angegliederten Krankenhauses der Zhejiang University School of Medicine, Hangzhou, Zhejiang, China

Dandan Zhang

Abteilung für Pathologie, Schlüssellabor für Krankheitsproteomik der Provinz Zhejiang, Medizinische Fakultät, Zhejiang-Universität, Hangzhou, China

Dandan Zhang

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

YW und ZX konzipierten die Studie und verfassten die Arbeit. YW, GG und JL haben das Projekt entworfen. ZX, YZ, SZ, HDC, YL, HY und LD entwickelten die snRandom-seq-Chemie. ZX, TZ, LF, HYC, JC, SN, FL, ZW, DZ und YC analysierten die Daten. YW, SZ und YL konstruierten die mikrofluidische Plattform. LY, WJ, FC und HZ trugen zum FFPE-Menschenexperiment bei. YW, GG und LF betreuten dieses Projekt. Alle Autoren haben das endgültige Manuskript überarbeitet und genehmigt.

Korrespondenz mit Longjiang Fan, Guoji Guo oder Yongcheng Wang.

YW und ZX haben beim chinesischen Patentamt einen Patentantrag bezüglich der Methode dieser Arbeit eingereicht (Anmeldenummer: CN 114507711 A). Mehrere Autoren sind an der Kommerzialisierung der Technik beteiligt und engagieren sich bei M20 Genomics, Inc. (LD und JL sind Mitbegründer und Mitarbeiter; YW und GG sind Mitbegründer, Anteilseigner und Berater; TZ und SN sind Mitarbeiter.) Die Die übrigen Autoren erklären keine konkurrierenden Interessen.

Nature Communications dankt Rui Chen und den anderen, anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Eine Peer-Review-Datei ist verfügbar.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Xu, Z., Zhang, T., Chen, H. et al. Hochdurchsatz-Einzelkern-Gesamt-RNA-Sequenzierung von formalinfixierten, in Paraffin eingebetteten Geweben durch snRandom-seq. Nat Commun 14, 2734 (2023). https://doi.org/10.1038/s41467-023-38409-5

Zitat herunterladen

Eingegangen: 10. November 2022

Angenommen: 27. April 2023

Veröffentlicht: 12. Mai 2023

DOI: https://doi.org/10.1038/s41467-023-38409-5

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.