Science >> Wetenschap >  >> Biologie

Machine learning classificeert 191 van 's werelds meest schadelijke virussen

Twee weergaven van 3D PCA-gegevensvisualisaties van k-mer-frequenties van Mamastrovirus- en Avastrovirus-sequenties:astrovirussequenties in Dataset 2 (bekende geslachtslabels), samen met de 191 astrovirusgenomen met geslachtslabels voorspeld door 3PCM. Ter vergelijking worden HAstV en GoAstV gemarkeerd met verschillende kleuren vergeleken met de rest van de Mamastrovirussen (niet-HAstV Mamastrovirussen) respectievelijk de rest van de Avastrovirussen (niet-GoAstV Avastrovirussen). Het lavendelkleurige vlak illustreert de scheiding tussen twee mogelijke ondergeslachten van het Mamastrovirus. Het grijze vlak illustreert de scheiding tussen twee mogelijke ondersoorten van het Avastrovirus. Credit:Grenzen in de moleculaire biowetenschappen (2024). DOI:10.3389/fmolb.2023.1305506

Onderzoekers van de Universiteit van Waterloo hebben met succes 191 voorheen ongeïdentificeerde astrovirussen geclassificeerd met behulp van een nieuw, machinaal lerend classificatieproces.



De studie, 'Gebruik maken van machinaal leren voor de taxonomische classificatie van opkomende astrovirussen', is onlangs gepubliceerd in Frontiers in Molecular Biosciences .

Astrovirussen behoren tot de meest schadelijke en wijdverspreide virussen ter wereld. Deze virussen veroorzaken ernstige diarree, waaraan jaarlijks ruim 440.000 kinderen onder de vijf jaar overlijden. In de pluimvee-industrie hebben astrovirussen zoals de vogelgriep een infectiepercentage van 80% en een sterftecijfer van 50% onder vee, wat leidt tot economische verwoesting, verstoring van de toeleveringsketen en voedseltekorten.

Astrovirussen muteren snel en kunnen zich gemakkelijk verspreiden over hun meer dan 160 gastheersoorten, waardoor onderzoekers en volksgezondheidsfunctionarissen voortdurend in een race zitten om nieuwe astrovirussen te classificeren en te begrijpen zodra ze opduiken. In 2023 waren er 322 ongeïdentificeerde astrovirussen met verschillende genomen. Dit jaar is dat aantal gestegen naar 479.

“Op een gegeven moment is tussen de 2% en 9% van de mensen drager van een van deze virussen. Dat aantal kan in sommige landen oplopen tot 30%”, zegt Fatemeh Alipour, Ph.D. kandidaat in computerwetenschappen bij Waterloo en de hoofdauteur van het onderzoek op het gebied van computerwetenschappen. "Het effectief begrijpen en classificeren van deze virussen is essentieel voor het ontwikkelen van vaccins."

Het astrovirus-onderzoeksteam bestond uit computerwetenschappers van Waterloo en biologieonderzoekers van de University of Western Ontario.

De nieuwe driedelige classificatiemethode omvat machine learning onder toezicht, machine learning zonder toezicht en handmatige labeling van de host van elk astrovirus.

"Het belangrijkste idee achter de classificatiemethode is om machinaal leren te gebruiken om soorten te classificeren door te leren van hun 'genomische handtekeningen'", zegt Lila Kari, professor aan de David R. Cheriton School of Computer Science. "De classificatiemethode is opwindend, zowel qua snelheid als qua algemene toepasbaarheid."

"Deze methode kan ons helpen begrijpen hoe virussen tussen verschillende dieren worden overgedragen. Het kan ook worden gebruikt om virussen in andere virusfamilies zoals HIV en Dengue te classificeren."

Meer informatie: Fatemeh Alipour et al, Machine learning inzetten voor taxonomische classificatie van opkomende astrovirussen, Frontiers in Molecular Biosciences (2024). DOI:10.3389/fmolb.2023.1305506

Aangeboden door Universiteit van Waterloo