science >> Wetenschap >  >> Chemie

Model voor machinaal leren helpt bij het karakteriseren van verbindingen voor het ontdekken van geneesmiddelen

Krediet:CC0 Publiek Domein

Tandem-massaspectrometrie is een krachtig analytisch hulpmiddel dat wordt gebruikt om complexe mengsels te karakteriseren bij het ontdekken van geneesmiddelen en andere gebieden.

Nutsvoorzieningen, Innovators van Purdue University hebben een nieuwe methode ontwikkeld om machine learning-concepten toe te passen op het tandem-massaspectrometrieproces om de informatiestroom bij de ontwikkeling van nieuwe medicijnen te verbeteren. Hun werk is gepubliceerd in Chemische Wetenschappen .

"Massaspectrometrie speelt een integrale rol bij het ontdekken en ontwikkelen van geneesmiddelen, " zei Gaurav Chopra, een assistent-professor analytische en fysische chemie in Purdue's College of Science. "De specifieke implementatie van bootstrapped machine learning met een kleine hoeveelheid positieve en negatieve trainingsgegevens die hier worden gepresenteerd, zal de weg vrijmaken om mainstream te worden in de dagelijkse activiteiten van het automatiseren van de karakterisering van verbindingen door chemici."

Chopra zei dat er twee grote problemen zijn op het gebied van machine learning dat wordt gebruikt voor chemische wetenschappen. De gebruikte methoden bieden geen chemisch inzicht in de beslissingen die door het algoritme worden genomen, en nieuwe methoden worden doorgaans niet gebruikt om blinde experimentele tests uit te voeren om te zien of de voorgestelde modellen nauwkeurig zijn voor gebruik in een chemisch laboratorium.

"We hebben beide items behandeld voor een methodologie die isomeerselectief is en uiterst nuttig in de chemische wetenschappen om complexe mengsels te karakteriseren, identificeren van chemische reacties en metabolieten van geneesmiddelen, en op gebieden zoals proteomics en metabolomics, ' zei Chopra.

De Purdue-onderzoekers creëerden statistisch robuuste modellen voor machine learning om met minder trainingsgegevens te werken - een techniek die nuttig zal zijn voor het ontdekken van geneesmiddelen. Het model kijkt naar een algemeen neutraal reagens - 2-methoxypropeen (MOP) genaamd - en voorspelt hoe verbindingen zullen interageren met MOP in een tandemmassaspectrometer om structurele informatie voor de verbindingen te verkrijgen.

"Dit is de eerste keer dat machine learning is gekoppeld aan diagnostische gasfase-ion-molecuulreacties, en het is een zeer krachtige combinatie, de weg wijzen naar volledig geautomatiseerde massaspectrometrische identificatie van organische verbindingen, " zei Hilkka Kenttämaa, de Frank Brown Distinguished Professor in analytische chemie en organische chemie. "We introduceren nu veel nieuwe reagentia in deze methode."

Het Purdue-team introduceert stroomdiagrammen voor chemische reactiviteit om de chemische interpretatie van de beslissingen die door de machine learning-methode worden genomen, te vergemakkelijken die nuttig zullen zijn om de massaspectra voor structurele informatie te begrijpen en te interpreteren.