science >> Wetenschap >  >> Chemie

Chemie en informatica bundelen krachten om kunstmatige intelligentie toe te passen op chemische reacties

Krediet:CC0 Publiek Domein

In de laatste paar jaren, onderzoekers hebben zich steeds meer tot datawetenschapstechnieken gewend om het oplossen van problemen in organische synthese te helpen.

Onderzoekers in het lab van Abigail Doyle, Princeton's A. Barton Hepburn hoogleraar scheikunde, werkte samen met hoogleraar computerwetenschappen Ryan Adams om open-source software te ontwikkelen die hen een ultramodern optimalisatie-algoritme biedt voor gebruik in het dagelijkse werk, het opvouwen van wat is geleerd op het gebied van machine learning in synthetische chemie.

De software past de belangrijkste principes van Bayesiaanse optimalisatie aan om snellere en efficiëntere syntheses van chemicaliën mogelijk te maken.

Op basis van de stelling van Bayes, een wiskundige formule voor het bepalen van voorwaardelijke kans, Bayesiaanse optimalisatie is een veelgebruikte strategie in de wetenschappen. Uitgebreid beschreven, het stelt mensen en computers in staat om voorkennis te gebruiken om toekomstige beslissingen te informeren en te optimaliseren.

De chemici in Doyle's lab, in samenwerking met Adams, een professor in de informatica, en collega's bij Bristol-Myers Squibb, vergeleek menselijke besluitvormingsmogelijkheden met het softwarepakket. Ze ontdekten dat de optimalisatietool zowel meer efficiëntie oplevert ten opzichte van menselijke deelnemers als minder vooringenomenheid bij een testreactie. Hun werk verschijnt in het huidige nummer van het tijdschrift Natuur .

"Reactie-optimalisatie is alomtegenwoordig in chemische synthese, zowel in de academische wereld als in de chemische industrie, "zei Doyle. "Omdat de chemische ruimte zo groot is, het is voor chemici onmogelijk om de gehele reactieruimte experimenteel te evalueren. We wilden Bayesiaanse optimalisatie ontwikkelen en beoordelen als een hulpmiddel voor synthetische chemie, gezien het succes ervan voor gerelateerde optimalisatieproblemen in de wetenschappen."

Benjamin Schilden, een voormalig postdoctoraal fellow in het Doyle-lab en de hoofdauteur van het artikel, het Python-pakket gemaakt.

"Ik kom uit een synthetische chemie achtergrond, dus ik waardeer zeker dat synthetische chemici redelijk goed zijn in het zelfstandig aanpakken van deze problemen, " zei Shields. "Waar ik denk dat de echte kracht van Bayesiaanse optimalisatie erin zit, is dat het ons in staat stelt deze hoogdimensionale problemen te modelleren en trends vast te leggen die we zelf misschien niet in de gegevens zien, zodat het de gegevens een stuk beter kan verwerken.

"En twee, binnen een ruimte, het zal niet worden tegengehouden door de vooroordelen van een menselijke chemicus, " hij voegde toe.

Hoe het werkt

De software begon als een out-of-field-project om te voldoen aan de doctoraatsvereisten van Shields. Doyle en Shield vormden toen een team onder het Center for Computer Assisted Synthesis (C-CAS), een initiatief van de National Science Foundation gelanceerd op vijf universiteiten om de manier waarop de synthese van complexe organische moleculen wordt gepland en uitgevoerd, te transformeren. Doyle is sinds 2019 hoofdonderzoeker bij C-CAS.

"Reactie-optimalisatie kan een duur en tijdrovend proces zijn, " zei Adams, die tevens directeur is van het programma Statistiek en Machine Learning. "Deze aanpak versnelt het niet alleen met behulp van state-of-the-art technieken, maar vindt ook betere oplossingen dan mensen doorgaans zouden identificeren. Ik denk dat dit nog maar het begin is van wat mogelijk is met Bayesiaanse optimalisatie in deze ruimte."

Gebruikers beginnen met het definiëren van een zoekruimte - plausibele experimenten om te overwegen - zoals een lijst met katalysatoren, reagentia, liganden, oplosmiddelen, temperaturen, en concentraties. Zodra die ruimte is voorbereid en de gebruiker bepaalt hoeveel experimenten hij moet uitvoeren, de software kiest initiële experimentele omstandigheden die moeten worden geëvalueerd. Dan stelt het nieuwe experimenten voor om uit te voeren, itereren door een kleinere en kleinere reeks keuzes totdat de reactie is geoptimaliseerd.

"Bij het ontwerpen van de software, Ik heb geprobeerd manieren toe te voegen waarop mensen kunnen injecteren wat ze weten over een reactie, " zei Shields. "Het maakt niet uit hoe je dit of machine learning in het algemeen gebruikt, er zal altijd een geval zijn waarin menselijke expertise waardevol is."

De software en voorbeelden voor het gebruik ervan zijn toegankelijk via deze repository. GitHub-koppelingen zijn beschikbaar voor het volgende:software die de chemicaliën die worden geëvalueerd in een machineleesbaar formaat weergeeft via dichtheidsfunctionele theorie; software voor reactie-optimalisatie; en het spel dat de besluitvorming van chemici over optimalisatie van de testreactie verzamelt.

"Bayesiaanse reactie-optimalisatie als hulpmiddel voor chemische synthese, " door Benjamin J. Shields, Jason Stevens, juni Li, Marvin Parasram, Farhan Damani, Jezus I. Martinez Alvarado, Jacob M. Janey, Ryan P. Adams en Abigail G. Doyle, verschijnt in het nummer van 3 februari van het tijdschrift Natuur .