science >> Wetenschap >  >> Chemie

Onderzoekers kijken in de databank van waterclusters, treinnetwerk om energielandschappen te voorspellen

PNNL-onderzoekers gebruikten 500, 000 waterclusters uit een recent ontwikkelde database van meer dan 5 miljoen waterclusterminima om een ​​neuraal netwerk te trainen dat vertrouwt op de wiskundige kracht van de grafentheorie - een verzameling knooppunten en koppelingen die de moleculaire structuur vertegenwoordigen - om structurele patronen van de aggregatie van watermoleculen te ontcijferen. Krediet:Nathan Johnson | PNNL

Machine learning-algoritmen, de basis van neurale netwerken, openen deuren naar nieuwe ontdekkingen - of bieden op zijn minst verleidelijke aanwijzingen - één enorme database tegelijk. Voorbeeld:Pacific Northwest National Laboratory (PNNL)-onderzoekers gingen diep in op het modelleren van de interacties tussen watermoleculen, informatie vinden over waterstofbruggen en structurele patronen terwijl je een pad baant met - je raadt het al - deep learning.

"Neurale netwerken zijn een manier voor de computer om automatisch verschillende eigenschappen van systemen of gegevens te leren, " zei PNNL datawetenschapper, Jenna paus. "In dit geval, het neurale netwerk leert de energie van verschillende waterclusternetwerken op basis van eerdere gegevens."

PNNL-onderzoekers gebruikten 500, 000 waterclusters uit een recent ontwikkelde database van meer dan 5 miljoen waterclusterminima om een ​​neuraal netwerk te trainen dat vertrouwt op de wiskundige kracht van de grafentheorie - een verzameling knooppunten en koppelingen die de moleculaire structuur vertegenwoordigen - om structurele patronen van de aggregatie van watermoleculen te ontcijferen. Werken met de moleculaire, gasvormige vorm van water, ze besteedden bijzondere aandacht aan de relatie tussen waterstofbinding en energie ten opzichte van de meest stabiele structuur.

"Dat is de heilige graal, "zei paus. "Op dit moment, het kost veel moeite om een ​​nauwkeurig interactiepotentieel voor water te ontwikkelen. Maar met neurale netwerken, het uiteindelijke doel is om de netwerken te laten leren, uit een grote dataset, wat is de energie van een netwerk op basis van de onderliggende moleculaire structuur."

Na het opmeten van 500, 000 waterclusters, het neurale netwerk in de door PNNL geleide studie werd getraind in de verschillende manieren waarop watermoleculen met elkaar interageren. De dataset zou theoretisch de hele database van 5 miljoen waternetwerken kunnen bevatten. Maar om praktische redenen gebeurde dat niet.

"Het gebruik van de hele database om het neurale netwerk te trainen zou te veel rekentijd hebben gekost, "zei Pope. De diepe neurale netwerken trainen om die 500 te onderzoeken, 000 waterclusters - slechts een tiende van de volledige database - namen meer dan twee en een halve dag in beslag met behulp van vier ultramoderne computers met omvangrijke grafische verwerkingseenheid (GPU) prestaties, de klok rond werken.

Onderdeel van een groter geheel

Neurale netwerken bestaan ​​al tientallen jaren. Grotere verwerkingskracht van GPU-chips in de afgelopen 10 jaar, echter, heeft de mogelijkheden van deze netwerken sterk verbeterd, ook geassocieerd met de uitdrukking 'diep leren'. Zelfs met zo'n belofte, het trainen van neurale netwerken is een dure computationele uitdaging. En hoe nauwkeurig ze ook zijn, neurale netwerken worden vaak bekritiseerd als zwarte dozen die geen informatie bieden over waarom ze het antwoord geven dat ze geven.

Het Exascale Computing Project (ECP) van het Amerikaanse Department of Energy (DOE's) werd in 2016 gelanceerd om de meest hardnekkige supercomputingproblemen te onderzoeken, inclusief de verfijning van neurale netwerken. in 2018, ECP heeft het ExaLearn Co-Design Center voortgebracht, gericht op machine learning-technologieën. PNNL is een van de acht nationale laboratoria die deelnemen aan het ExaLearn-project. James Ang, PNNL's hoofdwetenschapper voor informatica in Physical and Computational Sciences, leidt de deelname van het Laboratorium.

Database dicht bij huis

Een van de belangrijkste doelen van ExaLearn is het ontwikkelen van kunstmatige-intelligentietechnologieën die nieuwe chemische structuren kunnen ontwerpen door te leren van enorme datasets. Onderzoek geleid door Sutanay Choudhury, een PNNL computerwetenschapper, gebruik gemaakt van de enorme database met waterclusters die door Sotiris Xantheas op de PNNL-Richland-campus is ontwikkeld, een PNNL Laboratorium fellow. Xantheas, bekend in de chemische fysica voor zijn onderzoek naar intermoleculaire interacties in waterige ionenclusters, is een co-auteur van de neurale netwerken studie gepubliceerd in het speciale nummer "Machine Learning Meets Chemical Physics" van de Tijdschrift voor Chemische Fysica .

"Verschillende macroscopische eigenschappen van water zijn toegeschreven aan zijn vluchtige waterstofbindingsnetwerk, dat bestaat uit een dynamisch netwerk van bindingen die bij kamertemperatuur in een fractie van een seconde breken en hervormen, " zei Xantheas, wiens databasewerk werd ondersteund door DOE's Office of Science, Basisopleiding Energiewetenschappen, Chemische Wetenschappen, Geowetenschappen, en de afdeling Biowetenschappen. "Waterclusters bieden een testbed voor het onderzoeken van dit vluchtige waterstofbindingsnetwerk door de structuur-energierelatie van de verschillende waterstofbindingsarrangementen te begrijpen."

De onderzoekers van PNNL hadden een strategie om deze specifieke zwarte doos te ontcijferen. Ze gebruikten grafentheorie - een tak van de wiskunde die bestudeert hoe dingen in een netwerk met elkaar verbonden zijn - om weer te geven, in grafische vorm, moleculen en hun veelhoekige substructuren. De grafiektheoretische descriptoren die het team ontwikkelde, gaven verschillende inzichten in de samenstelling van de waterclusters.

"Wat we hebben gedaan, " zei paus, "Het biedt aanvullende analyse nadat het netwerk is getraind. De analyse kwantificeert verschillende structurele eigenschappen van deze waterclusternetwerken. Dan kunnen we ze vergelijken met ons voorspelde neurale netwerk en, in daaropvolgende datasetonderzoeken, het begrip van het netwerk te verbeteren."

Water heeft een toekomst voor neuraal netwerk

De bevindingen van het onderzoek vormen een basis voor analyse van de structurele patronen van waterclusters in complexere waterstofgebonden netwerken, zoals vloeibaar water en ijs.

"Als je een neuraal netwerk zou kunnen trainen, " zei paus, "Dat neurale netwerk zou computationele chemie kunnen doen op grotere systemen. En dan zou je vergelijkbare inzichten kunnen krijgen in computationele chemie over chemische structuur of waterstofbinding of de reactie van moleculen op temperatuurveranderingen. Dat zijn enkele van de doelen van dit onderzoek."