Science >> Wetenschap >  >> Biologie

Een universeel raamwerk voor ruimtelijke biologie

SpatialData verenigt en integreert gegevens uit verschillende ruimtelijke omics-technologieën. Credit:Isabel Romero Calvo/EMBL

Biologische processen worden ingekaderd door de context waarin ze plaatsvinden. Een nieuw hulpmiddel ontwikkeld door de Stegle Group van EMBL Heidelberg en het Duitse Kankeronderzoekscentrum (DKFZ) helpt de bevindingen van moleculair biologisch onderzoek in een betere context van de cellulaire omgeving te plaatsen, door verschillende vormen te integreren. van ruimtelijke gegevens.



In een weefsel wordt elke individuele cel omringd door andere cellen, en ze staan ​​allemaal voortdurend in wisselwerking met elkaar om zo een biologische functie te bewerkstelligen. Om te begrijpen hoe weefsels werken of slecht functioneren bij ziekten zoals kanker, is het van cruciaal belang om niet alleen de kenmerken van elke cel te leren kennen, maar ook rekening te houden met hun ruimtelijke context. Kwantitatieve karakterisering van cellen in de context van de fysieke ruimte waarin ze zich bevinden is de sleutel tot het begrijpen van complexe systemen.

De technologieën die dit soort verkenningen mogelijk maken, worden ruimtelijke omics-technologieën genoemd, en hun voortschrijdende ontwikkeling draagt ​​bij aan de toenemende populariteit van ruimtelijke biologie. Dergelijke technologieën kunnen gedetailleerde informatie geven over de moleculaire samenstelling van individuele cellen en hun ruimtelijke ordening.

Deze technologieën richten zich echter op verschillende kenmerken van een cel, zoals RNA- of eiwitniveaus, en de resulterende datasets worden op verschillende manieren beheerd en opgeslagen. Om deze uitdaging op te lossen heeft een samenwerkingsproject onder leiding van de Stegle Group SpatialData ontwikkeld, een datastandaard en softwareframework waarmee wetenschappers gegevens uit een breed scala aan ruimtelijke omics-technologieën op een uniforme manier kunnen weergeven.

Technologieontwikkeling voor ruimtelijke biologie

De afgelopen tien jaar zijn er door zowel de academische wereld als de industrie talloze technologieën ontwikkeld voor het ruimtelijk visualiseren van weefsels, cellen en subcellulaire compartimenten. Elke techniek concentreert zich echter op een klein aantal wenselijke kenmerken en brengt daarmee samenhangende afwegingen met zich mee. Visium van 10x Genomics legt bijvoorbeeld informatie vast over de expressie van alle genen in een weefsel, maar biedt geen resolutie voor één cel.

Daarentegen leveren de 10x Genomics Xenium-test, MERFISH of het MERSCOPE-platform van Vizgen fijnkorrelige kaarten van genexpressie met subcellulaire resolutie op. Deze testen zijn momenteel echter beperkt tot een paar honderd vooraf geselecteerde genen. En de lijst van dergelijke technologieën, die elk een klein deel van het volledige plaatje bieden, blijft groeien.

Uitdagingen van ruimtelijke omics-technologieën

Deze heterogeniteit van technologieën wordt aan de computationele kant weerspiegeld door een nog grotere heterogeniteit van bestandsformaten:elke technologie heeft zijn eigen opslagformaat, en vaak kunnen gegevens die door dezelfde technologie worden gegenereerd, in meerdere formaten worden opgeslagen.

In de praktijk brengt dit verschillende uitdagingen met zich mee voor de analyse van ruimtelijke omics-gegevens. Visualisatie- en analysemethoden zijn meestal afgestemd op een specifieke technologie, waardoor de gegevenscompatibiliteit wordt beperkt en het moeilijk wordt om verschillende methoden in één analysepijplijn te integreren. Voor een holistisch begrip van een biologisch systeem is het echter belangrijk om tegelijkertijd naar verschillende celkenmerken of monsters van verschillende locaties te kijken.

Omics-technologieën genereren enorme hoeveelheden gegevens (terabytes aan afbeeldingen, miljoenen cellen, miljarden afzonderlijke moleculen) en vereisen geoptimaliseerde technische oplossingen. Daarom heeft de ruimtelijke biologie dringend behoefte aan een universeel raamwerk dat gegevens uit experimenten en technologieën kan integreren en holistische inzichten kan bieden in gezondheid en ziekte. Dit is waar SpatialData tussenbeide komt.

SpatialData:een raamwerk om ze allemaal te verenigen

"Er is een sterke behoefte aan gemeenschapsoplossingen voor het beheer en de opslag van ruimtelijke omics-gegevens. In het bijzonder is er behoefte aan het ontwikkelen van nieuwe datastandaarden en computationele grondslagen die het mogelijk maken om analysebenaderingen te verenigen over het volledige spectrum van verschillende ruimtelijke omics-technologieën die in opkomst zijn", zegt Oliver Stegle, groepsleider bij EMBL in de afdeling Genome Biology, en hoofd van de afdeling Computational Genomics and Systems Genetics bij het Duitse Kankeronderzoekscentrum (DKFZ).

"Een eerste grote stap in deze richting is SpatialData, een datastandaard en softwareframework dat eerdere datamanagementconcepten overbrugt en aanpast, van single-cell multi-omics tot het ruimtelijke domein."

SpatialData verenigt en integreert gegevens uit verschillende omics-technologieën, waarbij de modernste technologieën worden overbrugd met een raamwerk dat computergestuurde toegang en manipulatie van de gegevens mogelijk maakt.

Deze tool is geïntroduceerd in een Natuurmethoden publicatie, geschreven door Luca Marconato tijdens zijn Ph.D. bij EMBL in de Stegle Group, een joint degree met de Faculteit Biowetenschappen van de Universiteit van Heidelberg.

"We hebben het SpatialData-framework ontwikkeld om de uitdagingen op het gebied van datarepresentatie bij het bestuderen van de ruimtelijke biologie te verlichten, zodat de onderzoeker zich kan concentreren op de biologische analyse, in plaats van te worden vertraagd door vervelende datamanipulaties, die anders nodig zijn om zelfs maar de gegevens te visualiseren. Het raamwerk biedt een uniforme representatie en implementeert ergonomische handelingen voor gemakkelijke verwerking van ruimtelijke omics-gegevens", aldus Marconato.

Met de tool kan elke onderzoeker zijn gegevens importeren en taken uitvoeren zoals gegevensrepresentatie, -verwerking en -visualisatie. Bovendien biedt het de mogelijkheid om de gegevens interactief te annoteren en op te slaan in een taalonafhankelijk formaat, waardoor de opkomst van analysestrategieën wordt vergemakkelijkt die methoden uit verschillende programmeertalen of analysegemeenschappen combineren.

Het raamwerk is ontwikkeld als een samenwerkingsproject tussen meerdere instellingen zoals de DKFZ, de Technische Universiteit van München, het Helmholtz Center München, German BioImaging, de ETH Zürich, VIB Centrum voor Inflammatieonderzoek in België, evenals de Huber en Saka groepen bij EMBL.

"We hebben ons onderzoek en onze technologische ontwikkeling uitgevoerd met het voordeel voor de grotere wetenschappelijke gemeenschap in gedachten", zegt Giovanni Palla, co-eerste auteur en Ph.D. student aan het Helmholtz Center München.

"We hebben niet alleen een interdisciplinair samenwerkingsproject opgezet tussen onderzoeksinstituten, maar hebben ook nauw samengewerkt met ontwikkelaars die met verschillende ruimtelijke technologieën en in verschillende programmeertalen werken om het probleem van interoperabiliteit aan te pakken. Als gevolg hiervan is ons raamwerk compatibel met de overgrote meerderheid van ruimtelijke omics testen uit de academische wereld en de industrie.

"Doordat het openlijk wordt gepubliceerd, kunnen andere onderzoekers SpatialData nu vrijelijk gebruiken om hun eigen gegevens te beheren en hebben ze de mogelijkheid om samen te werken op het gebied van verschillende technologieën en onderzoeksonderwerpen."

"In ons artikel illustreren we drie belangrijke kenmerken van SpatialData", legt Kevin Yamauchi uit, co-eerste auteur en postdoctoraal onderzoeker aan de ETH Zürich.

"Eerst presenteren we een gestandaardiseerde interface en een uniform opslagformaat (gebaseerd op de OME-NGFF) voor alle ruimtelijke omics-technologieën. Ten tweede integreren we met behulp van de uniforme representatie signalen van meerdere modaliteiten. Hier dragen we annotaties over tussen modaliteiten en kwantificeren we signalen met behulp van deze overgedragen annotaties Ten slotte presenteren we een manier om (pathologie)beelden interactief te annoteren en de annotaties te gebruiken om de bijbehorende moleculaire profielen te analyseren."

SpatialData biedt een interactieve weergave van gegevens, zowel op uw harde schijf als in het RAM-geheugen van uw computer, waardoor de analyse van grote beeldgegevens of meerdere geometrieën of cellen mogelijk is.

Andere opvallende kenmerken zijn de mogelijkheid van het raamwerk om omics-gegevens in een gemeenschappelijk coördinatensysteem uit te lijnen en te annoteren. SpatialData maakt dus het efficiënte beheer en de manipulatie van ruimtelijke datasets mogelijk, inclusief de definitie van een gemeenschappelijk coördinatensysteem voor op sequencing en beeldvorming gebaseerde technologieën.

Toepassing bij borstkanker

Het interdisciplinaire team gebruikte het SpatialData-framework om een ​​multimodale borstkankerdataset van 10X Genomics opnieuw te analyseren als proof of concept. Deze dataset bestaat uit opeenvolgende secties van hetzelfde borstkankerblok, waarbij elke sectie wordt geanalyseerd met behulp van verschillende technologie, zoals Visium, Xenium en een afzonderlijke scRNA-seq-dataset.

De studie toont het complementaire karakter van deze technologieën aan. "Door 10X Xenium en scRNAseq te integreren, hebben we de celtypen in de ruimte in kaart gebracht", zegt Elyas Heidari, een Ph.D. kandidaat bij DKFZ en een van de auteurs van het onderzoek.

"Vervolgens hebben we 10X Visium gebruikt om kankerklonen in de ruimte te identificeren. Dit kan worden gedaan omdat we over transcriptoombrede uitlezingen beschikken. Ten slotte hebben we de H&E-gekleurde microscopiebeelden gebruikt om interessegebieden voor histopathologische annotaties te identificeren. Deze analyse heeft met succes een unieke toepassing van SpatialData bij het ontsluiten van multimodale analyses van ruimtelijk opgeloste datasets."

In de toekomst zou de tumor van een patiënt kunnen worden geanalyseerd met verschillende technologieën die vaak in de kliniek worden gebruikt, waarbij de gegevens vervolgens door SpatialData worden samengevoegd om een ​​holistisch inzicht in de tumor te krijgen. Bovendien zou de interactieve interface de arts in staat stellen de gegevens te annoteren, waardoor een gedetailleerde analyse van specifieke tumorregio's en kenmerken mogelijk wordt, wat mogelijk kan leiden tot gepersonaliseerde behandelbenaderingen.

Meer informatie: Luca Marconato et al, SpatialData:een open en universeel dataframework voor ruimtelijke omics, Natuurmethoden (2024). DOI:10.1038/s41592-024-02212-x

Journaalinformatie: Natuurmethoden

Geleverd door het Europees Laboratorium voor Moleculaire Biologie