science >> Wetenschap >  >> Chemie

Van chemische grafieken tot structuren

Het machine learning-model Graph2Structure gebruikt grafieken van chemische verbindingen (links) om hun 3D-coördinaten te voorspellen (rechts). Krediet:Dominik Lemm, Universiteit van Wenen

3D-configuraties van atomen bepalen alle materiaaleigenschappen. Kwantitatieve voorspellingen van nauwkeurige evenwichtsstructuren, 3D-coördinaten van alle atomen, van een chemische grafiek, een weergave van de structuurformule, is een uitdagende en rekenkundig dure taak die aan het begin staat van vrijwel elke computationele chemie-workflow. Onderzoekers van de Universiteit van Wenen hebben nu een nieuw op machine learning gebaseerd model ontwikkeld om dure berekeningen te verkorten om structuren direct uit grafieken te voorspellen. De nieuwe methode voor "Machine learning-gebaseerde energievrije structuurvoorspellingen van moleculen, overgangstoestanden, en vaste stoffen" wordt gepresenteerd in het laatste nummer van Natuurcommunicatie .

Hoewel vaak afgeschilderd als rigide, chemische verbindingen zijn flexibele driedimensionale objecten die bestaan ​​uit atomen die continu bewegen en oscilleren. Cyrus Levinthal merkte al in 1969 op dat de grote hoeveelheid vrijheidsgraden van chemische verbindingen formeel leidt tot een catastrofaal groot aantal mogelijke conformaties, tot wel 10, 300 (Levinthals Paradoxon). Binnen experimentele waarnemingen, echter, 3D-configuraties van atomen komen overeen met goed gedefinieerde minima van vrije energie en dicteren daardoor alle materiaaleigenschappen. Het paradigma dat structuur de functie bepaalt, is de sleutel voor het bepalen van geneesmiddelinteracties, het optimaliseren van katalysatoren of reacties, en materialen ontdekken. Als gevolg hiervan, in de meeste computationele high-throughput screeningcampagnes (een methode voor snelle wetenschappelijke experimenten), alleen de meest stabiele configuraties zijn gewild. Afhankelijk van het niveau van verfijning binnen de benaderingen die zijn gemaakt bij het schatten van de stabiliteit van materialen, rekenkosten kunnen variëren van minuten tot uren of zelfs dagen voor de berekening van een enkele structuur. Gezien de uitgestrektheid van de ruimte van chemische verbindingen, de ruimte bevolkt door alle denkbare verbindingen (geschat op meer dan 1, 060) vormt deze afweging tussen kosten en kwaliteit een groot knelpunt in het veld.

Onderzoekers van de Universiteit van Wenen onder leiding van Anatole von Lilienfeld pakten dit probleem vanuit een ander perspectief aan, het ontwikkelen van een nieuwe methode die gebruikmaakt van gegevens en universeel toepasbaar is op elke vorm van chemie. Hun nieuwe methode, Grafiek2Structuur, gebruikt kwantumchemische gegevens van hoge kwaliteit om machinale leermodellen te trainen die nieuwe 3D-structuren kunnen voorspellen voor moleculaire grafieken van onzichtbare verbindingen. Deze directe toewijzing van een moleculaire grafiek aan een specifieke 3D-configuratie stelt het model in staat om elke vorm van energieminimalisatie effectief te omzeilen, wat leidt tot een versnelling van meer dan een miljoen in vergelijking met de conventionele methoden. "De mogelijkheid om structuren van hoge kwaliteit te genereren, versnelt niet alleen moleculair ontwerp met hoge doorvoer, maar versnelt ook de dagelijkse workflow, " zegt hoofdauteur van de studie in Natuurcommunicatie Dominik Lemm. "Betrouwbaar genereren van 3D-structuren voor zelfs exotische chemie, zoals open-shell systemen of overgangstoestanden, is een van de moeilijkste taken in atomistische simulatie."

Verdere bevindingen suggereren dat de gegenereerde structuren direct kunnen worden gebruikt als input voor de daaropvolgende evaluatie van op machine learning gebaseerde voorspellingsmodellen voor eigenschappen, waardoor een moleculaire grafiek op een rigoureuze en effectievere manier wordt gekoppeld aan een structuurafhankelijke eigenschap.