Science >> Wetenschap >  >> Biologie

Dynamische informatie verkrijgen uit statische snapshots

Onderdeel van een interdisciplinair team van de Universiteit van Chicago achter een nieuwe methode om statische gegevens van single-cell RNA-sequencing te gebruiken om te bestuderen hoe cellen en genen in de loop van de tijd veranderen. Van links naar rechts:Hanna Hieromnimon, afgestudeerde biofysica-student, Joey Federico, afgestudeerde student van de Pritzker School of Molecular Engineering, afgestudeerde student computerwetenschappen Ryan Robinett, PME Asst. Prof. Samantha Riesenfeld, afgestudeerde scheikundestudent en eerste auteur Cheng Frank Gao, afgestudeerde scheikundestudent Joseph Sifakis en afgestudeerde biofysica-student Hope Anderson. Credit:Lorenzo Orecchia

Stel je voor dat je de exacte finishvolgorde van de Kentucky Derby kunt voorspellen op basis van een foto die 10 seconden na de race is gemaakt.



Die uitdaging verbleekt in vergelijking met waar onderzoekers mee te maken krijgen als ze single-cell RNA-sequencing (scRNA-seq) gebruiken om te bestuderen hoe embryo's zich ontwikkelen, cellen differentiëren, kanker ontstaan ​​en het immuunsysteem reageert.

In een artikel dat vandaag is gepubliceerd in Proceedings of the National Academy of Sciences hebben onderzoekers van de UChicago Pritzker School of Molecular Engineering en de afdeling Scheikunde TopicVelo ontwikkeld, een krachtige nieuwe methode om de statische snapshots van scRNA-seq te gebruiken om te bestuderen hoe cellen en genen in de loop van de tijd veranderen.

Het team hanteerde een interdisciplinaire, op samenwerking gerichte aanpak, waarbij concepten uit de klassieke machine learning, computationele biologie en scheikunde werden geïntegreerd.

"In termen van machinaal leren zonder toezicht gebruiken we een heel eenvoudig, beproefd idee. En in termen van het transcriptionele model dat we gebruiken, is het ook een heel eenvoudig, oud idee. Maar als je ze samenvoegt, doen ze iets krachtigers dan je zou verwachten”, zegt PME-assistent-professor Moleculaire Technologie en Geneeskunde Samantha Riesenfeld, die het artikel schreef met prof. Suriyanarayanan Vaikuntanathan van de afdeling Scheikunde en hun gezamenlijke student, UChicago Chemistry Ph.D. kandidaat Cheng Frank Gao.

Het probleem met pseudotijd

Onderzoekers gebruiken scRNA-seq om metingen te verkrijgen die krachtig en gedetailleerd zijn, maar van nature statisch zijn.

"We hebben TopicVelo ontwikkeld om celstatusovergangen af ​​te leiden uit scRNA-seq-gegevens", aldus Riesenfeld. "Het is moeilijk om dat met dit soort gegevens te doen, omdat scRNA-seq destructief is. Als je de cel op deze manier meet, vernietig je de cel."

Hierdoor hebben onderzoekers een momentopname van het moment waarop de cel werd gemeten/vernietigd. Hoewel scRNA-seq de best beschikbare momentopname voor het hele transcript geeft, is de informatie die veel onderzoekers nodig hebben de manier waarop de cellen in de loop van de tijd overgaan. . Ze moeten weten hoe een cel kanker krijgt of hoe een bepaald genprogramma zich gedraagt ​​tijdens een immuunreactie.

Om dynamische processen uit een statische momentopname te helpen achterhalen, gebruiken onderzoekers traditioneel wat 'pseudotijd' wordt genoemd. Het is onmogelijk om de expressie van een individuele cel of gen te zien veranderen en groeien in een stilstaand beeld, maar dat beeld legde ook andere cellen en genen van hetzelfde type vast die zich misschien iets verder in hetzelfde proces bevinden. Als de wetenschappers de punten correct met elkaar verbinden, kunnen ze krachtige inzichten krijgen in hoe het proces er in de loop van de tijd uitziet.

Het verbinden van deze punten is moeilijk giswerk, gebaseerd op de veronderstelling dat cellen die er hetzelfde uitzien zich op verschillende punten langs hetzelfde pad bevinden. Biologie is veel ingewikkelder, met valse starts, stops, uitbarstingen en meerdere chemische krachten die aan elk gen trekken.

In plaats van traditionele pseudo-tijdbenaderingen, die kijken naar de expressie-overeenkomst tussen de transcriptieprofielen van cellen, kijken RNA-snelheidsbenaderingen naar de dynamiek van transcriptie, splitsing en afbraak van het mRNA in die cellen.

Het is een veelbelovende maar vroege technologie.

"De aanhoudende kloof tussen de belofte en de realiteit van RNA-snelheid heeft de toepassing ervan grotendeels beperkt", schreven de auteurs in de krant.

Om deze kloof te overbruggen zet TopicVelo deterministische modellen opzij en omarmt – en haalt zij inzichten uit – een veel moeilijker stochastisch model dat de onontkoombare willekeur van de biologie weerspiegelt.

"Cellen zijn, als je erover nadenkt, intrinsiek willekeurig", zegt Gao, de eerste auteur van het artikel. "Je kunt een tweeling of genetisch identieke cellen hebben die heel verschillend zullen worden. TopicVelo introduceert het gebruik van een stochastisch model. We kunnen de onderliggende biofysica beter vastleggen in de transcriptieprocessen die belangrijk zijn voor mRNA-transcriptie."

Machine learning wijst de weg

Het team realiseerde zich ook dat een andere aanname de standaard RNA-snelheid beperkt. "De meeste methoden gaan ervan uit dat alle cellen in principe hetzelfde grote genprogramma tot expressie brengen, maar je kunt je voorstellen dat cellen tegelijkertijd verschillende soorten processen moeten uitvoeren, in verschillende mate," zei Riesenfeld. Het ontwarren van deze processen is een uitdaging.

Probabilistische onderwerpmodellering – een machine learning-tool die traditioneel wordt gebruikt om thema’s uit geschreven documenten te identificeren – voorzag het UChicago-team van een strategie. TopicVelo groepeert scRNA-seq-gegevens niet op basis van het type cel of gen, maar op basis van de processen waarbij deze cellen en genen betrokken zijn. De processen worden afgeleid uit de gegevens en niet opgelegd door externe kennis.

"Als je naar een wetenschappelijk tijdschrift kijkt, zal het georganiseerd zijn rond onderwerpen als 'natuurkunde', 'scheikunde' en 'astrofysica', dit soort dingen," zei Gao. "We hebben dit organisatieprincipe toegepast op RNA-sequencing-gegevens van eencellige cellen. Dus nu kunnen we onze gegevens ordenen op onderwerpen als 'ribosomale synthese', 'differentiatie', 'immuunrespons' en 'celcyclus'. En we kunnen passen bij stochastische transcriptiemodellen die specifiek zijn voor elk proces."

Nadat TopicVelo dit kluwen van processen heeft ontward en ze op onderwerp heeft geordend, past het onderwerpgewichten weer toe op de cellen, om rekening te houden met welk percentage van het transcriptionele profiel van elke cel bij welke activiteit betrokken is.

Volgens Riesenfeld:"Deze aanpak helpt ons om naar de dynamiek van verschillende processen te kijken en het belang ervan in verschillende cellen te begrijpen. En dat is vooral handig als er vertakkingspunten zijn, of als een cel in verschillende richtingen wordt getrokken."

De resultaten van het combineren van het stochastische model met het onderwerpmodel zijn opvallend. TopicVelo was bijvoorbeeld in staat trajecten te reconstrueren waarvoor voorheen speciale experimentele technieken nodig waren om te herstellen. Deze verbeteringen verbreden de potentiële toepassingen aanzienlijk.

Gao vergeleek de bevindingen van het artikel met het artikel zelf – het product van vele studiegebieden en expertise.

"Als je bij PME een scheikundeproject hebt, is de kans groot dat er een student natuurkunde of techniek aan werkt", zei hij. "Het is nooit alleen maar chemie."

Meer informatie: Cheng Frank Gao et al., Dissectie en integratie van bursty transcriptionele dynamiek voor complexe systemen, Proceedings of the National Academy of Sciences (2024). DOI:10.1073/pnas.2306901121

Journaalinformatie: Proceedings van de Nationale Academie van Wetenschappen

Aangeboden door Universiteit van Chicago