science >> Wetenschap >  >> Chemie

Wetenschappers betwijfelen of DeepMinds AI net zo goed is voor fractionele ladingssystemen als het lijkt

Relatie tussen de BBB-testsystemen en de fractionele lading-atomen uit de trainingsset. Credit:Michael Medvedev (Zelinsky Institute of Organic Chemistry of RAS)

In hun artikel gepubliceerd in Science in december 2021 liet een DeepMind-team zien hoe neurale netwerken kunnen worden gebruikt om elektroneninteracties in chemische systemen nauwkeuriger te beschrijven dan bestaande methoden. Een team van onderzoekers van Skoltech, Zelinsky Institute of Organic Chemistry, HSE University, Yandex en Kyungpook National University laten dit zien in hun commentaar in Science dat het vermogen van DeepMind AI om het gedrag van dergelijke systemen te generaliseren niet volgt uit de gepubliceerde resultaten en opnieuw moet worden bekeken.

Weten waar de elektronen zich in een molecuul bevinden, kan een grote bijdrage leveren aan het verklaren van de structuur, de eigenschappen en de reactiviteit ervan. Chemici gebruiken methoden voor de dichtheidsfunctionaaltheorie (DFT), benaderingen van de Schrödinger-vergelijking, om nauwkeurige en rekenkundig efficiënte modellen van moleculen en materialen te maken. Maar er zijn welbekende omstandigheden waarin DFT-tools falen. Een daarvan is het voorspellen hoe atomen elektronen delen; in een beroemd voorbeeld voorspellen DFT-methoden ten onrechte dat zelfs wanneer een chloor- en een natriumatoom oneindig ver van elkaar verwijderd zijn, het chlooratoom een ​​fractie van een van de elektronen van het natriumatoom vasthoudt.

Dergelijke fouten ontstaan ​​omdat DFT-vergelijkingen slechts benaderingen zijn van de fysieke realiteit. Onderzoekers van het DeepMind machine learning-project zeggen dat hun neurale netwerk die deel-van-een-elektronenfout elimineert en nauwkeurigere voorspellingen doet dan traditionele DFT-methoden

"In de kern is DFT een methode voor het oplossen van de Schrödingervergelijking. De nauwkeurigheid wordt bepaald door het uitwisselingscorrelatiegedeelte, dat helaas onbekend is. Tot op heden werden meer dan 400 verschillende benaderingen voor dit onderdeel voorgesteld", zegt Petr Zhyliaev , senior onderzoeker bij Skoltech.

"Een manier om een ​​goed uitwisselings-correlatiegedeelte te bouwen, is door er informatie over over te dragen van meer 'geavanceerde' numerieke methoden dan de dichtheidsfunctionaaltheorie, die echter ordes van grootte minder rekenkundig efficiënt zijn. In hun werk gebruikte DeepMind een neurale netwerk als een universele interpolator om het uitwisselings-correlatiegedeelte van het functionele te leren. Hun poging was verreweg niet de eerste, maar is een van de meest ambitieuze."

DeepMind construeerde een neuraal netwerkgebaseerde dichtheidsfunctionaal, aangeduid als DM21, getraind op fractionele elektronensystemen, zoals een waterstofatoom met een half elektron. Om zijn superioriteit te bewijzen, hebben de auteurs DM21 getest op een set uitgerekte dimeren (genaamd BBB-set), bijvoorbeeld twee waterstofatomen op grote afstand met in totaal één elektron.

Verwacht wordt dat de functionele DM21 uitstekende prestaties levert op de BBB-testset, die verreweg alle geteste klassieke DFT-functionaliteiten en DM21m overtreft, identiek getraind als DM21, maar zonder de fractionele elektronensystemen in de trainingsset.

Hoewel dit lijkt alsof DM21 de fysica achter de fractionele elektronensystemen heeft begrepen, blijkt bij nadere beschouwing dat alle dimeren in de BBB-set erg lijken op de systemen in de treinset. Vanwege de plaats van elektrozwakke interacties zijn atomaire interacties inderdaad alleen sterk op korte afstanden, waarbuiten de twee atomen zich in wezen gedragen alsof ze geen interactie hebben (zie bovenstaande afbeelding).

"In sommige opzichten zijn neurale netwerken net als mensen:ze krijgen liever het goede antwoord om de verkeerde reden, dan andersom. Daarom is het niet zo moeilijk om een ​​neuraal netwerk te trainen, maar om te bewijzen dat het heeft de natuurkundige wetten geleerd in plaats van de juiste antwoorden te onthouden. Het testen van een neuraal netwerk op systemen die het tijdens de training heeft gezien, is vergelijkbaar met het onderzoeken van een schooljongen met een taak die hij een leraar vijf minuten geleden heeft zien oplossen", legt Michael Medvedev uit, de leider van Groep theoretische chemie aan het Zelinsky Instituut voor Organische Chemie van de Russische Academie van Wetenschappen.

De BBB-testset is dus niet de juiste:het test het begrip van DM21 van de fractionele elektronensystemen niet:DM21 kan gemakkelijk wegkomen met onthouden. Een grondige analyse van de andere vier bewijzen van DM21-verwerking van dergelijke systemen leidde ook niet tot een beslissende conclusie:alleen de goede nauwkeurigheid op de SIE4x4-set kan betrouwbaar zijn, hoewel zelfs daar een duidelijke trend van foutengroei met de afstand suggereert dat DM21 is niet helemaal vrij van de problemen met fractionele elektronensystemen.

Het gebruik van fractionele elektronensystemen in de trainingsset is niet de enige nieuwigheid in het werk van DeepMind. Hun idee om de fysieke beperkingen in een neuraal netwerk te introduceren via de trainingsset, evenals de benadering voor het opleggen van fysieke zin door training op het juiste chemische potentieel, zullen waarschijnlijk in de toekomst op grote schaal worden gebruikt bij de constructie van DFT-functionaliteiten van neurale netwerken. + Verder verkennen

Materie op nanoschaal simuleren met AI