science >> Wetenschap >  >> Elektronica

AI leert complexe genziektepatronen

Een KAUST-onderzoeker gebruikt een kunstmatige-intelligentietoepassing om genen te vinden die ziekten veroorzaken. Krediet:Kiyoshi Takahase Segundo / Alamy Stock Photo

Kunstmatige intelligentie (AI) wordt door onderzoekers gebruikt om genen op te sporen die ziekten veroorzaken. Een KAUST-team neemt een creatieve, gecombineerde deep learning-benadering die gegevens uit meerdere bronnen gebruikt om algoritmen te leren patronen te vinden tussen genen en ziekten.

Machine learning gebruikt algoritmen en statistische modellen om patronen en associaties tussen gegevens te identificeren om specifieke problemen op te lossen. Door voldoende bekende gegevens in te voeren, zoals getagde afbeeldingen van "Jack, " kan het systeem uiteindelijk leren om andere niet-getagde afbeeldingen voor te stellen die Jack bevatten.

Onderzoekers gebruiken deze toepassing van AI om genen te vinden die ziekten veroorzaken. Echter, van slechts een beperkt aantal genen is experimenteel bevestigd dat ze oorzakelijk zijn. Dit betekent dat wetenschappers niet veel gegevens hebben om in hun programma's in te voeren om hen te helpen de patronen te leren die verband houden met genziekte-associaties. Dus, ze moeten creatief zijn om manieren te vinden om machine learning-algoritmen te leren leren en vervolgens naar deze patronen te zoeken.

Database- en informatiebeheerspecialist Panagiotis Kalnis, computationeel biowetenschapper Xin Gao en collega's hebben een deep learning-model ontwikkeld dat volgens hen beter presteert dan de huidige state-of-the-art methoden.

Eerst, ze namen hun toevlucht tot bekende databases om informatie te extraheren over genlocaties en -functies en over hoe en wanneer ze in- en uitschakelen. Deze gegevens werden gebruikt om algoritmen te leren genen te vinden die samenwerken. Vervolgens, ze verkregen gegevens over de kenmerken van genetische ziekten uit andere databases. Dit leerde de algoritmen hoe ze ziekten met vergelijkbare manifestaties konden identificeren. Ze combineerden deze datasets met gegevens over de bekende associaties tussen 12, 231 genen en 3, 209 ziekten.

Het KAUST-model extraheert de patronen die zijn geleerd uit hoe genen netwerken en over de overeenkomsten tussen genetische ziekten en brengt ze over naar een diepgaand leermodel dat een graafconvolutienetwerk wordt genoemd. Dit levert een andere set gegevens op die in matrices wordt geplaatst, zoals die worden gebruikt in aanbevelingssystemen, om genziekte-associatie te voorspellen.

Het model was in staat om complexe, niet-lineaire associaties tussen genen en ziekten, waardoor het nieuwe associaties kan voorspellen. "Door gebruik te maken van meer informatie, we bereikten een betere nauwkeurigheid dan de state-of-the-art methoden die momenteel worden gebruikt, " zegt Peng Han, de eerste auteur van de studie. "Maar, ook al presteerden we beter dan andere methoden in onze experimenten, het is nog steeds niet nauwkeurig genoeg om in de industrie te worden toegepast, " hij voegt toe.

Het team is van plan om de nauwkeurigheid van hun model te verbeteren door meer soorten gegevens op te nemen. Ze zullen de methode ook toepassen om andere soorten problemen op te lossen waar slechts beperkte gegevens beschikbaar zijn, zoals het aanbevelen van nieuwe locaties om te bezoeken op basis van eerdere voorkeuren van een gebruiker.