science >> Wetenschap >  >> Chemie

Een nieuw neuraal netwerk om symmetrie te begrijpen, snelheid materiaal onderzoek

Laagdimensionale uniforme veelvoudige benaderingsprojectie om te visualiseren hoe neurale netwerken semantische gelijkenis van natuurlijke beelden leren. Krediet:Joshua Agar/Lehigh University

Het begrijpen van structuur-eigenschap relaties is een belangrijk doel van materiaalonderzoek, volgens Joshua Agar, een faculteitslid in de afdeling Materials Science and Engineering van de Lehigh University. En toch bestaat er momenteel geen metriek om de structuur van materialen te begrijpen vanwege de complexiteit en multidimensionale aard van structuur.

Kunstmatige neurale netwerken, een soort machine learning, kan worden getraind om overeenkomsten te identificeren en zelfs parameters zoals structuur en eigenschappen te correleren, maar er zijn twee grote uitdagingen:zegt Agar. Een daarvan is dat de meeste grote hoeveelheden gegevens die door materiaalexperimenten worden gegenereerd, nooit worden geanalyseerd. Dit komt grotendeels doordat dergelijke beelden, geproduceerd door wetenschappers in laboratoria over de hele wereld, worden zelden op een bruikbare manier opgeslagen en meestal niet gedeeld met andere onderzoeksteams. De tweede uitdaging is dat neurale netwerken niet erg effectief zijn in het leren van symmetrie en periodiciteit (hoe periodiek de structuur van een materiaal is), twee kenmerken die van het grootste belang zijn voor materiaalonderzoekers.

Nutsvoorzieningen, een team onder leiding van Lehigh University heeft een nieuwe machine learning-aanpak ontwikkeld die gelijkenisprojecties kan creëren via machine learning, waardoor onderzoekers voor het eerst een ongestructureerde beelddatabase kunnen doorzoeken en trends kunnen identificeren. Agar en zijn medewerkers ontwikkelden en trainden een neuraal netwerkmodel om symmetriebewuste functies op te nemen en pasten hun methode vervolgens toe op een set van 25, 133 piëzorespons-krachtmicroscopiebeelden verzameld op verschillende materiaalsystemen gedurende vijf jaar aan de Universiteit van Californië, Berkeley. De resultaten:ze waren in staat om vergelijkbare materiaalklassen te groeperen en trends te observeren, een basis vormen om structuur-eigenschap relaties te gaan begrijpen.

"Een van de nieuwigheden van ons werk is dat we een speciaal neuraal netwerk hebben gebouwd om symmetrie te begrijpen en we gebruiken dat als een functie-extractor om het veel beter te maken in het begrijpen van afbeeldingen, " zegt Agar, een hoofdauteur van het artikel waarin het werk wordt beschreven:"Symmetry-Aware Recursive Image Similarity Exploration for Materials Microscopy, " vandaag gepubliceerd in npj Computational Materials . Naast Agar, auteurs omvatten, van Lehigh University:Tri N.M. Nguyen, Yichen Guo, Shuyu Qin en Kylie S. Frew en, van Stanford University:Ruijuan Xu. Nguyen, een hoofdauteur, was een undergraduate aan de Lehigh University en volgt nu een Ph.D. bij Stanford.

Het team kon tot projecties komen door gebruik te maken van Uniform Manifold Approximation and Projection (UMAP), een niet-lineaire dimensionaliteitsreductietechniek. Deze aanpak, zegt Agar, stelt onderzoekers in staat om te leren "... op een vage manier, de topologie en de structuur op een hoger niveau van de gegevens en comprimeren deze naar 2D."

"Als je een neuraal netwerk traint, het resultaat is een vector, of een reeks getallen die een compacte descriptor is van de functies. Die kenmerken helpen bij het classificeren van dingen, zodat enige overeenkomst wordt geleerd, "zegt Agar. "Wat er wordt geproduceerd, is nog steeds vrij groot in de ruimte, Hoewel, omdat je misschien 512 of meer verschillende functies hebt. Dus, dan wil je het comprimeren tot een ruimte die een mens kan begrijpen, zoals 2D, of 3D-of, kan zijn , 4D."

Door dit te doen, Agar en zijn team wisten de 25 te pakken, 000-plus afbeeldingen en groepeer zeer vergelijkbare klassen materiaal bij elkaar.

"Vergelijkbare soorten structuren in materiaal liggen semantisch dicht bij elkaar en ook bepaalde trends kunnen worden waargenomen, vooral als je wat metadatafilters toepast, " zegt Agar. "Als je gaat filteren op wie de afzetting heeft gedaan, wie heeft het materiaal gemaakt, wat probeerden ze te doen, wat is het materiële systeem... je kunt echt gaan verfijnen en meer en meer gelijkenis krijgen. Die gelijkenis kan dan worden gekoppeld aan andere parameters zoals eigenschappen."

Laag-dimensionale uniforme veelvoudige benaderingsprojectie die symmetriebewuste beeldovereenkomst toont uit een database van meer dan 25, 000 piëzoresponskrachtmicroscopiebeelden. Krediet:Joshua Agar/Lehigh University

Dit werk laat zien hoe verbeterde gegevensopslag en -beheer het ontdekken van materialen snel kan versnellen. Volgens Agar, van bijzondere waarde zijn afbeeldingen en gegevens die zijn gegenereerd door mislukte experimenten.

"Niemand publiceert mislukte resultaten en dat is een groot verlies, want een paar jaar later herhaalt iemand dezelfde lijn van experimenten, "zegt Agar. "Dus, je verspilt echt goede middelen aan een experiment dat waarschijnlijk niet zal werken."

In plaats van al die informatie te verliezen, de gegevens die al zijn verzameld, kunnen worden gebruikt om nieuwe trends te genereren die nog niet eerder zijn gezien en de ontdekking exponentieel te versnellen, zegt Agar.

Deze studie is de eerste "use case" van een innovatieve nieuwe onderneming voor gegevensopslag, gehuisvest in het Oak Ridge National Laboratory, genaamd DataFed. DataFed, volgens haar website is "... een federatieve, big data-opslag, samenwerking, en full-life-cycle managementsysteem voor computationele wetenschap en/of data-analyse binnen gedistribueerde high-performance computing (HPC) en/of cloud-computing-omgevingen."

"Mijn team bij Lehigh heeft deel uitgemaakt van het ontwerp en de ontwikkeling van DataFed om het relevant te maken voor wetenschappelijke use-cases, ", zegt Agar. "Lehigh is de eerste live-implementatie van dit volledig schaalbare systeem. Het is een federatieve database, zodat iedereen zijn eigen server kan openen en verbonden kan worden met de centrale faciliteit."

Agar is de machine learning-expert in het Presidential Nano-Human Interface Initiative-team van Lehigh University. Het interdisciplinaire initiatief, integratie van de sociale wetenschappen en techniek, streeft ernaar de manieren waarop mensen omgaan met instrumenten van wetenschappelijke ontdekking te transformeren om innovaties te versnellen.

"Een van de belangrijkste doelen van Lehigh's Nano/Human Interface Initiative is om relevante informatie binnen handbereik van experimentatoren te brengen om bruikbare informatie te verstrekken die een beter geïnformeerde besluitvorming mogelijk maakt en wetenschappelijke ontdekkingen versnelt, " zegt Agar. "Mensen hebben een beperkte capaciteit voor geheugen en herinnering. DataFed is een moderne Memex; het biedt een geheugen van wetenschappelijke informatie die gemakkelijk kan worden gevonden en opgeroepen."

DataFed biedt een bijzonder krachtig en waardevol hulpmiddel voor onderzoekers die zich bezighouden met interdisciplinaire teamwetenschap, waardoor onderzoekers die samenwerken aan teamprojecten op verschillende/externe locaties toegang hebben tot elkaars onbewerkte gegevens. Dit is een van de belangrijkste onderdelen van ons Lehigh Presidential Nano/Human Interface (NHI)-initiatief voor het versnellen van wetenschappelijke ontdekkingen, " zegt Martin P. Harmer, Alcoa Foundation Professor in Lehigh's Department of Materials Science and Engineering en directeur van het Nano/Human Interface Initiative.