science >> Wetenschap >  >> Chemie

Algoritme voor machinaal leren helpt bij het zoeken naar nieuwe medicijnen

Krediet:CC0 Publiek Domein

Onderzoekers hebben een machine learning-algoritme ontworpen voor het ontdekken van geneesmiddelen waarvan is aangetoond dat het twee keer zo efficiënt is als de industriestandaard. die het proces van het ontwikkelen van nieuwe behandelingen voor ziekten zou kunnen versnellen.

De onderzoekers, geleid door de Universiteit van Cambridge, gebruikten hun algoritme om vier nieuwe moleculen te identificeren die een eiwit activeren waarvan wordt gedacht dat het relevant is voor symptomen van de ziekte van Alzheimer en schizofrenie. De resultaten worden gerapporteerd in het tijdschrift PNAS .

Een belangrijk probleem bij het ontdekken van geneesmiddelen is het voorspellen of een molecuul een bepaald fysiologisch proces zal activeren. Het is mogelijk om een ​​statistisch model te bouwen door te zoeken naar chemische patronen die gedeeld worden tussen moleculen waarvan bekend is dat ze dat proces activeren. maar de gegevens om deze modellen te bouwen zijn beperkt omdat experimenten duur zijn en het onduidelijk is welke chemische patronen statistisch significant zijn.

"Machine learning heeft aanzienlijke vooruitgang geboekt op gebieden zoals computervisie waar gegevens in overvloed aanwezig zijn, " zei Dr. Alpha Lee van Cambridge's Cavendish Laboratory, en de hoofdauteur van de studie. "De volgende grens zijn wetenschappelijke toepassingen zoals het ontdekken van geneesmiddelen, waar de hoeveelheid data relatief beperkt is, maar we wel fysiek inzicht hebben in het probleem, en de vraag wordt hoe je data kunt combineren met fundamentele scheikunde en natuurkunde."

Het algoritme ontwikkeld door Lee en zijn collega's, in samenwerking met biofarmaceutisch bedrijf Pfizer, gebruikt wiskunde om farmacologisch relevante chemische patronen te scheiden van irrelevante patronen.

belangrijk, het algoritme kijkt naar zowel moleculen waarvan bekend is dat ze actief zijn als moleculen waarvan bekend is dat ze inactief zijn, en leert herkennen welke delen van de moleculen belangrijk zijn voor de werking van medicijnen en welke niet. Een wiskundig principe dat bekend staat als willekeurige matrixtheorie geeft voorspellingen over de statistische eigenschappen van een willekeurige en ruisrijke dataset, die vervolgens wordt vergeleken met de statistieken van chemische kenmerken van actieve / inactieve moleculen om te destilleren welke chemische patronen echt belangrijk zijn voor binding, in plaats van simpelweg door toeval te ontstaan.

Deze methodologie stelt de onderzoekers in staat om belangrijke chemische patronen uit te vissen, niet alleen uit actieve moleculen, maar ook van moleculen die inactief zijn - met andere woorden, mislukte experimenten kunnen nu worden uitgebuit met deze techniek.

De onderzoekers bouwden een model dat begon met 222 actieve moleculen, en waren in staat om nog eens zes miljoen moleculen computationeel te screenen. Van dit, de onderzoekers kochten en screenden de 100 meest relevante moleculen. Van deze, ze identificeerden vier nieuwe moleculen die de CHRM1-receptor activeren, een eiwit dat relevant kan zijn voor de ziekte van Alzheimer en schizofrenie.

"Het vermogen om vier actieve moleculen uit zes miljoen te vissen, is als het vinden van een speld in een hooiberg, "zei Lee. "Een onderlinge vergelijking toont aan dat ons algoritme twee keer zo efficiënt is als de industriestandaard."

Het maken van complexe organische moleculen is een grote uitdaging in de chemie, en potentiële medicijnen zijn er in overvloed in de ruimte van nog niet te maken moleculen. De Cambridge-onderzoekers ontwikkelen momenteel algoritmen die manieren voorspellen om complexe organische moleculen te synthetiseren, evenals de uitbreiding van de machine learning-methodologie tot het ontdekken van materialen.

Het onderzoek werd ondersteund door het Winton Program for the Physics of Sustainability.