Science >> Wetenschap >  >> Chemie

Het AI-model vergelijkt rechtstreeks de eigenschappen van potentiële nieuwe medicijnen

Traditionele en paarsgewijze architecturen. A Traditionele modellen voor moleculair machinaal leren gebruiken enkelvoudige moleculaire input en voorspellen de absolute eigenschappen van moleculen. Voorspelde eigenschapsverschillen kunnen worden berekend door de voorspelde waarden voor twee moleculen van elkaar af te trekken. B Paarsgewijze modellen trainen op verschillen in eigenschappen van paren moleculen om eigenschapsveranderingen van moleculaire derivatiseringen direct te voorspellen. C Moleculen worden pas samengevoegd om paren te creëren na kruisvalidatiesplitsingen om het risico van gegevenslekken tijdens modelevaluatie te voorkomen. Daarom kan elk molecuul in de dataset alleen in paren voorkomen in de trainings- of testgegevens, maar niet in beide. Credit:Journal of Cheminformatics (2023). DOI:10.1186/s13321-023-00769-x

Biomedische ingenieurs aan de Duke University hebben een AI-platform ontwikkeld dat autonoom moleculen vergelijkt en leert van hun variaties om te anticiperen op verschillen in eigenschappen die cruciaal zijn voor het ontdekken van nieuwe geneesmiddelen. Het platform biedt onderzoekers een nauwkeuriger en efficiënter hulpmiddel om therapieën en andere chemicaliën met nuttige eigenschappen te ontwerpen.



Het onderzoek werd op 27 oktober gepubliceerd in het Journal of Cheminformatics .

Machine learning-algoritmen worden steeds vaker gebruikt voor het bestuderen en voorspellen van de biologische, chemische en fysische eigenschappen van kleine moleculen die worden gebruikt bij de ontwikkeling van geneesmiddelen en andere materiaalontwerptaken. Deze hulpmiddelen kunnen onderzoekers helpen de belangrijkste 'ADMET'-eigenschappen van een molecuul te begrijpen:hoe het wordt geabsorbeerd, gedistribueerd, gemetaboliseerd en uitgescheiden en de toxiciteit ervan in het lichaam. Door deze verschillende eigenschappen te begrijpen, kunnen onderzoekers moleculen identificeren en nieuwe therapieën ontwikkelen die veiliger en effectiever zijn.

Hoewel bestaande machine learning-platforms onderzoekers in staat stellen een veel groter aantal moleculen te screenen dan mogelijk zou zijn door ze allemaal fysiek in een laboratorium te maken, kunnen ze slechts de eigenschappen van één molecuul tegelijk voorspellen, waardoor hun algehele efficiëntie wordt beperkt wanneer ze de opdracht krijgen om de eigenschappen te identificeren. meest optimale verbinding.

Hoewel er een paar andere computationele benaderingen zijn om deze extra stap weg te laten en moleculen rechtstreeks te vergelijken, zijn ze beperkt in hun reikwijdte. Methoden zoals verstoring van vrije energie zijn bijvoorbeeld zeer nauwkeurig, maar rekenkundig zo complex dat ze slechts een handvol moleculen tegelijk kunnen evalueren. Benaderingen zoals gematchte molecuulparen zijn daarentegen veel sneller, maar kunnen alleen zeer vergelijkbare moleculen vergelijken, waardoor het bredere gebruik ervan wordt beperkt.

Om dit probleem aan te pakken, hebben Reker en Zachary Fralish, een Ph.D. student in het Reker-lab ontwikkelde DeepDelta, een deep learning-aanpak die twee moleculen efficiënt tegelijkertijd kan vergelijken en de verschillen in eigenschappen tussen de moleculen kan voorspellen, zelfs als ze heel verschillend zijn.

"Door het netwerk te laten leren van een één-op-één vergelijking, geef je het meer datapunten dan wanneer het van één molecuul tegelijk zou leren", zegt Reker. "Het platform leert over de structuur en eigenschappen van elk molecuul afzonderlijk, maar leert ook over de verschillen tussen de twee en hoe die verschillen de eigenschappen van het molecuul bepalen."

Het team testte het DeepDelta-platform met twee ultramoderne modellen in het veld:Random Forest, een veelgebruikt klassiek machine learning-model, en ChemProp, een diep neuraal netwerk waarop DeepDelta is gebaseerd. Elk systeem vergeleek twee bekende moleculaire structuren en voorspelde tien verschillende ADMET-eigenschappen, waaronder hoe de moleculen uit de nieren worden verwijderd, hun respectievelijke halfwaardetijden en hoe goed ze door de lever kunnen worden gemetaboliseerd.

DeepDelta bleek aanzienlijk effectiever en nauwkeuriger in het voorspellen en kwantificeren van de verschillen in moleculaire eigenschappen tussen moleculen dan de bestaande platforms.

"Training in moleculaire verschillen zorgt ervoor dat deze methode nauwkeuriger kan zijn bij het beslissen of een nieuwe chemische stof beter of slechter is dan de huidige", zegt Fralish. "Het is alsof je huiswerk maakt dat meer op je test lijkt. We hebben ook de omvang van onze datasets enorm uitgebreid door te koppelen, waardoor onze modellen in wezen meer huiswerk kregen, wat data-hongerige neurale netwerken echt helpt meer te leren."

Het team kijkt er nu naar uit om dit model in hun werk te integreren bij het ontwerpen van potentiële nieuwe therapieën en het optimaliseren van bestaande kandidaat-geneesmiddelen.

"Met dit hulpmiddel konden we kijken naar een medicijn dat bijna door de FDA-goedkeuring kwam, maar misschien had het problemen met levertoxiciteit, dus het heeft het niet helemaal gehaald", zei Fralish. "DeepDelta zou kunnen helpen moleculen te identificeren die dezelfde goede eigenschappen hebben, maar geen levertoxiciteit. Deze tool biedt veel mogelijkheden door ons te helpen beslissen welke chemische stof de beste kans heeft om te doen wat we willen in de echte wereld, waardoor tijd en geld worden bespaard. "

Meer informatie: Zachary Fralish et al, DeepDelta:ADMET-verbeteringen van moleculaire derivaten voorspellen met deep learning, Journal of Cheminformatics (2023). DOI:10.1186/s13321-023-00769-x

Aangeboden door Duke University