Science >> Wetenschap >  >> Chemie

Versnellen hoe nieuwe medicijnen worden gemaakt met machine learning

Overzicht van de HTE-dataset en het raamwerk. een Er wordt een overzicht van HiTEA en de analyse ervan getoond. Vergelijking van het literatuurreactoom met het HiTEA-reactoom zal steun aan het licht brengen voor onze mechanistische conclusies (overeenstemming van reactomen) of gebieden van vertekening/ongebruikelijk chemisch fenomeen onthullen (onenigheid van reactomen). b Er worden geabstraheerde representaties getoond van de vier reactieklassen die door HiTEA in deze publicatie zijn geanalyseerd. c Er wordt een uitsplitsing van de HTE-dataset per reactieklasse getoond. Credit:Natuurchemie (2024). DOI:10.1038/s41557-023-01393-w

Onderzoekers hebben een platform ontwikkeld dat geautomatiseerde experimenten combineert met AI om te voorspellen hoe chemicaliën met elkaar zullen reageren, wat het ontwerpproces voor nieuwe medicijnen zou kunnen versnellen.



Voorspellen hoe moleculen zullen reageren is essentieel voor de ontdekking en productie van nieuwe geneesmiddelen, maar historisch gezien is dit een proces van vallen en opstaan ​​geweest, en de reacties mislukken vaak. Om te voorspellen hoe moleculen zullen reageren, simuleren scheikundigen gewoonlijk elektronen en atomen in vereenvoudigde modellen, een proces dat rekenkundig duur en vaak onnauwkeurig is.

Nu hebben onderzoekers van de Universiteit van Cambridge een datagestuurde aanpak ontwikkeld, geïnspireerd door genomica, waarbij geautomatiseerde experimenten worden gecombineerd met machinaal leren om chemische reactiviteit te begrijpen, waardoor het proces enorm wordt versneld. Ze noemen hun aanpak, die gevalideerd is op een dataset van meer dan 39.000 farmaceutisch relevante reacties, het chemische ‘reactoom’.

Hun resultaten zijn gepubliceerd in het tijdschrift Nature Chemistry , zijn het product van een samenwerking tussen Cambridge en Pfizer.

"Het reactoom zou de manier kunnen veranderen waarop we over organische chemie denken", zegt dr. Emma King-Smith van Cambridge's Cavendish Laboratory, de eerste auteur van het artikel. "Een dieper begrip van de chemie zou ons in staat kunnen stellen veel sneller farmaceutische producten en zoveel andere nuttige producten te maken. Maar fundamenteler zal het inzicht dat we hopen te genereren gunstig zijn voor iedereen die met moleculen werkt."

De reactome-benadering pikt relevante correlaties tussen reactanten, reagentia en prestatie van de reactie uit de gegevens, en wijst op hiaten in de gegevens zelf. De gegevens worden gegenereerd op basis van zeer snelle, geautomatiseerde experimenten met een hoge verwerkingscapaciteit.

"High throughput chemie is een game-changer geweest, maar we geloofden dat er een manier was om een ​​dieper begrip van chemische reacties te ontdekken dan wat kan worden waargenomen op basis van de eerste resultaten van een high throughput experiment", aldus King-Smith.

"Onze aanpak legt de verborgen relaties tussen reactiecomponenten en uitkomsten bloot", zegt dr. Alpha Lee, die het onderzoek leidde. "De dataset waarop we het model hebben getraind is enorm:het zal helpen het proces van chemische ontdekkingen van vallen en opstaan ​​naar het tijdperk van big data te brengen."

In een gerelateerd artikel, gepubliceerd in Nature Communications heeft het team een ​​machine learning-aanpak ontwikkeld waarmee scheikundigen nauwkeurige transformaties in vooraf gespecificeerde molecuulregio's kunnen introduceren, waardoor een sneller medicijnontwerp mogelijk wordt.

Met deze aanpak kunnen scheikundigen complexe moleculen aanpassen – zoals een ontwerpwijziging op het laatste moment – ​​zonder ze helemaal opnieuw te hoeven maken. Het maken van een molecuul in het laboratorium is doorgaans een proces dat uit meerdere stappen bestaat, zoals het bouwen van een huis. Als scheikundigen de kern van een molecuul willen variëren, is de conventionele manier om het molecuul opnieuw op te bouwen, zoals het afbreken van een huis en het opnieuw opbouwen vanaf nul. Kernvariaties zijn echter belangrijk voor het ontwerpen van medicijnen.

Een klasse van reacties die bekend staat als late-stadium-functionalisatiereacties probeert chemische transformaties rechtstreeks tot de kern te introduceren, waardoor de noodzaak wordt vermeden om helemaal opnieuw te beginnen. Het is echter een uitdaging om de functionaliteit in een laat stadium selectief en gecontroleerd te maken. Er zijn doorgaans veel regio's van de moleculen die kunnen reageren, en het is moeilijk om de uitkomst te voorspellen.

"Functionalisaties in een laat stadium kunnen onvoorspelbare resultaten opleveren en de huidige modelleringsmethoden, inclusief onze eigen deskundige intuïtie, zijn niet perfect", zegt King-Smith. "Een meer voorspellend model zou ons de mogelijkheid bieden voor een betere screening."

De onderzoekers ontwikkelden een machinaal leermodel dat voorspelt waar een molecuul zou reageren en hoe de reactieplaats varieert als functie van verschillende reactieomstandigheden. Hierdoor kunnen scheikundigen manieren vinden om de kern van een molecuul nauwkeurig aan te passen.

"We hebben het model vooraf getraind op een grote hoeveelheid spectroscopische gegevens - waardoor het model effectief de algemene chemie heeft onderwezen - voordat we het hebben verfijnd om deze ingewikkelde transformaties te voorspellen", zegt King-Smith. Deze aanpak stelde het team in staat de beperking van de lage gegevens te overwinnen:er zijn relatief weinig functionele reacties in een laat stadium gerapporteerd in de wetenschappelijke literatuur. Het team heeft het model experimenteel gevalideerd op een diverse reeks medicijnachtige moleculen en was in staat nauwkeurig de plaatsen van reactiviteit onder verschillende omstandigheden te voorspellen.

"De toepassing van machinaal leren in de chemie wordt vaak belemmerd door het probleem dat de hoeveelheid gegevens klein is vergeleken met de uitgestrektheid van de chemische ruimte", zegt Lee. "Onze aanpak – het ontwerpen van modellen die leren van grote datasets die vergelijkbaar zijn met, maar niet hetzelfde zijn als het probleem dat we proberen op te lossen – lossen deze fundamentele uitdaging met weinig data op en kunnen vooruitgang boeken die verder gaat dan de late fase van functionaliteit."

Meer informatie: Emma King-Smith et al, Het chemische 'reactoom' onderzoeken met experimentele gegevens met hoge doorvoer, Natuurchemie (2024). DOI:10.1038/s41557-023-01393-w

Voorspellende Minisci Late Stage Functionalisatie met Transfer Learning, Natuurcommunicatie (2024). DOI:10.1038/s41467-023-42145-1. www.nature.com/articles/s41467-023-42145-1

Journaalinformatie: Natuurcommunicatie , Natuurchemie

Aangeboden door Universiteit van Cambridge