science >> Wetenschap >  >> Elektronica

AI leert de taal van de chemie om te voorspellen hoe medicijnen gemaakt kunnen worden

Krediet:Денис Марчук van Pixabay

Onderzoekers hebben een machine learning-algoritme ontworpen dat de uitkomst van chemische reacties veel nauwkeuriger voorspelt dan getrainde chemici en manieren suggereert om complexe moleculen te maken, het wegnemen van een belangrijke hindernis bij het ontdekken van geneesmiddelen.

Onderzoekers van de Universiteit van Cambridge hebben aangetoond dat een algoritme de uitkomsten van complexe chemische reacties kan voorspellen met een nauwkeurigheid van meer dan 90%, beter presteren dan opgeleide chemici. Het algoritme laat scheikundigen ook zien hoe ze doelverbindingen kunnen maken, het verstrekken van de chemische "kaart" naar de gewenste bestemming. De resultaten worden gerapporteerd in twee onderzoeken in de tijdschriften ACS Centrale Wetenschap en Chemische communicatie .

Een centrale uitdaging bij het ontdekken van geneesmiddelen en materiaalwetenschap is het vinden van manieren om gecompliceerde organische moleculen te maken door eenvoudigere bouwstenen chemisch met elkaar te verbinden. Het probleem is dat die bouwstenen vaak op onverwachte manieren reageren.

"Het maken van moleculen wordt vaak beschreven als een kunst die gerealiseerd wordt met trial-and-error-experimenten, omdat ons begrip van chemische reactiviteit verre van compleet is, " zei Dr. Alpha Lee van Cambridge's Cavendish Laboratory, die de studies leidde. "Machine learning-algoritmen kunnen chemie beter begrijpen omdat ze reactiviteitspatronen destilleren uit miljoenen gepubliceerde chemische reacties, iets dat een chemicus niet kan doen."

Het door Lee en zijn groep ontwikkelde algoritme gebruikt hulpmiddelen voor patroonherkenning om te herkennen hoe chemische groepen in moleculen reageren, door het model te trainen op miljoenen reacties gepubliceerd in patenten.

De onderzoekers beschouwden de voorspelling van chemische reacties als een machinevertalingsprobleem. De reagerende moleculen worden als één taal beschouwd, terwijl het product als een andere taal wordt beschouwd. Het model gebruikt vervolgens de patronen in de tekst om te leren vertalen tussen de twee talen.

Met behulp van deze aanpak, het model bereikt een nauwkeurigheid van 90% bij het voorspellen van het juiste product van ongeziene chemische reacties, terwijl de nauwkeurigheid van getrainde menselijke chemici ongeveer 80% is. De onderzoekers zeggen dat het model nauwkeurig genoeg is om fouten in de gegevens te detecteren en een overvloed aan moeilijke reacties correct te voorspellen.

Het model weet ook wat het niet weet. Het levert een onzekerheidsscore op, die onjuiste voorspellingen elimineert met een nauwkeurigheid van 89%. Omdat experimenten tijdrovend zijn, nauwkeurige voorspelling is cruciaal om te voorkomen dat dure experimentele paden worden gevolgd die uiteindelijk op een mislukking uitlopen.

In de tweede studie Lee en zijn groep, samenwerking met het biofarmaceutische bedrijf Pfizer, demonstreerde het praktische potentieel van de methode bij het ontdekken van geneesmiddelen.

De onderzoekers toonden aan dat wanneer ze getraind waren in gepubliceerd chemisch onderzoek, het model kan nauwkeurige voorspellingen doen van reacties op basis van labnotitieboekjes, waaruit blijkt dat het model de regels van de chemie heeft geleerd en deze kan toepassen op instellingen voor het ontdekken van geneesmiddelen.

Het team toonde ook aan dat het model reeksen reacties kan voorspellen die tot een gewenst product zouden leiden. Ze pasten deze methodologie toe op verschillende medicijnachtige moleculen, waaruit blijkt dat de stappen die het voorspelt chemisch redelijk zijn. Deze technologie kan de tijd van preklinische ontdekking van geneesmiddelen aanzienlijk verkorten, omdat het medicinale chemici een blauwdruk geeft van waar ze moeten beginnen.

"Ons platform is als een gps voor chemie, " zei Leen, die ook een Research Fellow is aan het St Catharine's College. "Het informeert chemici of een reactie een go of een no-go is, en hoe je reactieroutes navigeert om een ​​nieuw molecuul te maken."

De Cambridge-onderzoekers gebruiken deze reactievoorspellingstechnologie momenteel om een ​​compleet platform te ontwikkelen dat een brug slaat tussen de design-make-test-cyclus bij het ontdekken van geneesmiddelen en het ontdekken van materialen:het voorspellen van veelbelovende bioactieve moleculen, manieren om die complexe organische moleculen te maken, en het selecteren van de experimenten die het meest informatief zijn. De onderzoekers zijn nu bezig met het extraheren van chemische inzichten uit het model, proberen te begrijpen wat het heeft geleerd dat mensen niet hebben.

"We kunnen mogelijk veel vooruitgang boeken in de chemie als we leren naar wat voor soort patronen het model kijkt om een ​​voorspelling te doen, " zei Peter Bolgar, een doctoraat student synthetische organische chemie betrokken bij beide studies. "Het model en de menselijke scheikundigen zouden samen extreem krachtig worden in het ontwerpen van experimenten, meer dan de een zou zijn zonder de ander."