science >> Wetenschap >  >> anders

Geavanceerde wiskunde verdicht de complexiteit van COVID-19

In dit gedeelte van een voorbeeldhypergrafiek van een biologisch systeem, gekleurde lijnen vertegenwoordigen genen en omcirkelen experimentele omstandigheden (zwarte cirkels) waar het gen significant was. Hoe groter de zwarte cirkel, de meer experimentele omstandigheden zijn in die groep. Krediet:Emilie Purvine | PNNL

Wetenschappers racen om gelijke tred te houden met COVID-19, het creëren van nieuwe tools om erachter te komen hoe het nieuwe coronavirus werkt.

Voor onderzoekers van Pacific Northwest National Laboratory (PNNL), het begrijpen van virale infectie is eerder een kwestie van wiskunde dan een puur moleculaire analyse. Ze gebruiken een geavanceerd wiskundig hulpmiddel genaamd hypergraphs om te identificeren hoe menselijke cellen reageren op virale infectie, inclusief het nieuwe coronavirus. De belangrijkste eiwitten die aan die reactie deelnemen, kunnen doelen zijn voor het ontwikkelen van medicijnen voor de behandeling van COVID-19.

PNNL-wiskundige Emilie Purvine en computationeel bioloog Jason McDermott presenteerden onlangs hun werk virtueel op de SIGKDD (Special Interest Group on Knowledge Discovery and Data Mining) van de Association for Computing Machinery, een jaarlijkse conferentie voor datamining, gegevenswetenschap, en analyses.

Hypergrafieken voor virale infectie

In een belangrijke stap, het team testte de nieuwe aanpak met gegevens van een soortgelijk virus, het coronavirus dat ernstig acuut ademhalingssyndroom veroorzaakt, of SARS. Dat virus besmet meer dan 8, 000 mensen terwijl het in 2003 over de hele wereld raasde.

Het PNNL-team ontdekte dat de resultaten van de nieuwe methode overeenkwamen met gegevens die eerder over dat virus waren verzameld. Met behulp van hypergrafieken, het team identificeerde en rangschikte de activiteit van verschillende genen waarvan nu bekend is dat ze belangrijk zijn voor de activiteit van het virus dat de SARS-1-uitbraak veroorzaakte.

"Ons werk identificeerde onafhankelijk dezelfde genen waarvan bekend is dat ze belangrijk zijn voor SARS-activiteit. Dit was een belangrijke stap om te nemen voordat we ons werk toepast op het virus dat COVID-19 veroorzaakt, ' zei McDermott.

Nu past het PNNL-team de nieuwe technologie toe op het huidige virus, hypergrafieken gebruiken om het belang van veel van de honderden genen die actief zijn in COVID-19 te sorteren en te rangschikken.

Purvine en McDermott hebben de afgelopen twee jaar hypergrafieken gebruikt om te onderzoeken hoe menselijke cellen reageren op virale infecties. Ze hebben gewerkt met gegevens die zijn verzameld door PNNL-bioloog Katrina Waters, die genexpressie heeft gevolgd, eiwit expressie, en moleculaire veranderingen in menselijke cellen die zijn geïnfecteerd met virussen, waaronder griep, Zika, ebola, en coronavirussen voor ongeveer een decennium.

Om hypergrafieken toe te passen op deze grote dataset, de onderzoekers moesten eerst uitzoeken hoe groepen eiwitten zo konden worden geïdentificeerd dat ze een betekenisvolle hypergraph konden bouwen. Het team ging eerder dit jaar die uitdaging aan, tegelijkertijd sloeg de pandemie van het coronavirus toe.

Van grafieken naar hypergrafieken

De samenwerking met Purvine biedt McDermott een nieuwe tool, die op grafieken gebaseerde wiskundige technieken heeft gebruikt om verbanden tussen genen te analyseren, eiwitten, en signaalmoleculen in cellen jarenlang.

Hij en zijn collega's identificeren relaties tussen twee moleculen tegelijk. Vervolgens categoriseren ze verbindingen tussen veel afzonderlijke interacties. Die verbindingen raken snel verstrikt in complexe grafieken die moleculaire netwerken vertegenwoordigen die cellen laten functioneren.

De onderzoekers analyseren de structuur en vorm van die grafieken, op zoek naar betekenisvolle patronen die wijzen op moleculaire componenten met een sleutelrol. centraliteit, of wanneer een molecuul veel verbindingen heeft met andere, is een type patroon.

De hele structuur van een grafiek is een ander betekenisvol patroon. Sommige centrale verbindingen fungeren als bruggen om informatie tussen verschillende delen van het netwerk te laten stromen. Genen of eiwitten die betrokken zijn bij deze 'tussenruimte'-verbindingen zorgen er waarschijnlijk voor dat een hele cel goed blijft functioneren.

Hypergrafieken vertegenwoordigen een potentiële sprong voorwaarts. In plaats van verbindingen tussen afzonderlijke componenten weer te geven, hypergraphs tonen relaties tussen groepen dingen. Omdat biologische netwerken werken via moleculaire groepen, wetenschappers geloven dat hypergrafieken hun structuur realistischer kunnen weergeven dan standaardgrafieken.

Wetenschappers hebben hypergrafieken gebruikt om sociale groepen en computernetwerkinfrastructuur weer te geven, maar hun computationele complexiteit maakt ze een ongebruikelijke techniek voor het bestuderen van grootschalige biologische netwerken die voortkomen uit experimentele gegevens.

Een open-source hypergraph-softwaretool genaamd HyperNetX, ontwikkeld bij PNNL, maakt deze analyse toegankelijker voor onderzoekers in verschillende disciplines. Maar het toepassen van de techniek op data uit verschillende vakgebieden vergt nog wel wat knutselen.

"Omdat er zoveel manieren zijn om hypergrafieken te maken van biologische gegevens, biologen moeten hiervoor waarschijnlijk een computerwiskundige inschakelen, voor nu, ' zei Purvine.