science >> Wetenschap >  >> Fysica

De fysica lezen die zich in gegevens verstopt

Krediet:International School of Advanced Studies (SISSA)

Informatie wordt gecodeerd in data. Dit geldt voor de meeste aspecten van het moderne leven, maar het is ook waar in de meeste takken van de hedendaagse natuurkunde, en het extraheren van nuttige en betekenisvolle informatie uit zeer grote datasets is een belangrijke missie voor veel natuurkundigen.

In de statistische mechanica, grote datasets zijn dagelijkse kost. Een klassiek voorbeeld is de partitiefunctie, een complex wiskundig object dat fysieke systemen in evenwicht beschrijft. Dit wiskundige object kan worden gezien als bestaande uit vele punten, die elk een vrijheidsgraad van een fysiek systeem beschrijven, dat wil zeggen, het minimum aantal gegevens dat al zijn eigenschappen kan beschrijven.

Een interdisciplinair team van wetenschappers van het Abdus Salam International Centre for Theoretical Physics (ICTP) en de Scuola Internazionale Superiore di Studi Avanzati (SISSA) toonde aan dat zo'n enorme verzameling gegevens kan worden doorgekamd, het naar voren brengen van fundamentele fysieke eigenschappen van een onbekend systeem.

Deze resultaten werden benadrukt in een paper dat net is gepubliceerd in Fysieke beoordeling X , het introduceren van een nieuwe op data gebaseerde kijk op faseovergangen. Het team toonde aan dat een generieke statistische eigenschap van grote datasets die een breed scala aan fysieke systemen in evenwicht beschrijven, bekend als intrinsieke dimensie, kan in feite het optreden van een faseovergang onthullen.

De auteurs van het artikel, gecoördineerd door Marcello Dalmonte, een onderzoeker in de sectie gecondenseerde materie en statistische fysica van ICTP en SISSA-medewerker, komen uit verschillende achtergronden. Tiago Mendes, een voormalig postdoctoraal fellow bij ICTP en nu bij het Max Planck Institute for the Physics of Complex Systems, in Dresden, Duitsland, werkt voornamelijk in numerieke methoden die worden toegepast op statistische mechanica. Alex Rodriguez is een chemicus, voorheen werkzaam bij SISSA en nu bij ICTP, die werkt aan de implementatie van complexe systeemalgoritmen en de ontwikkeling van machine learning-methoden. Xhek Turkeshi, een doctoraat student aan SISSA, werkt voornamelijk in de statistische fysica.

De onderzoekers richtten zich op een generieke statistische eigenschap van de datasets, de intrinsieke dimensie genoemd. De eenvoudigste manier om deze eigenschap te beschrijven is als het minimum aantal variabelen dat nodig is om een ​​gegeven dataset te vertegenwoordigen, zonder enig verlies van informatie. "Nemen, bijvoorbeeld, alle mensen over de hele wereld, " legt Rodriguez uit. "Dat is een dataset op zich. Nutsvoorzieningen, als je de positie van de mensen over de hele wereld wilt specificeren, in theorie, je zou de coördinaten van al hun posities in de ruimte nodig hebben, dat is, drie gegevens voor elke persoon. Maar aangezien we de aarde kunnen benaderen als een tweedimensionaal oppervlak, we hebben maar twee parameters nodig, dat is, de breedtegraad en de lengtegraad. Dit is wat intrinsieke dimensie is:als de dataset de mensheid was, zou de intrinsieke dimensie 2 zijn, niet 3."

In de meer theoretische context van statistische systemen, het artikel laat zien dat deze eigenschap van intrinsieke dimensie collectieve eigenschappen van partitiefuncties bij thermische faseovergangen kan onthullen. Dit betekent dat, ongeacht welk systeem wordt overwogen, de gegevens kunnen aantonen of en wanneer dat systeem een ​​faseovergang ondergaat. Het team heeft een theoretisch raamwerk ontwikkeld om uit te leggen waarom generieke gegevens zo'n 'universeel' gedrag vertonen, gemeenschappelijk voor een breed scala van verschillende faseovergangen, van smeltend ijs tot ferromagneten.

"Het werk introduceert een nieuwe kijk op faseovergangen door te laten zien hoe de intrinsieke dimensie corresponderende structurele overgangen in de dataruimte onthult, " zeggen de wetenschappers, "wanneer ijs smelt, de datastructuur doet dat ook."

Wat echt nieuw is in dit werk, is dat onbewerkte gegevens het fysieke gedrag van de systemen in kwestie weerspiegelen, en dat is belangrijk voor natuurkundigen, omdat het hen in staat stelt een systeem te analyseren zonder de onderliggende fysica te kennen. Kijken naar de gegevens is voldoende om te zien of er een overgang plaatsvindt in het systeem of niet, zonder zelfs maar te weten wat voor soort overgang het is. "We zouden kunnen zeggen dat deze methode volledig agnostisch is, " zegt Mendes. "Je hoeft niet a priori alle parameters van het systeem te kennen; je werkt gewoon met ruwe data en kijkt wat eruit komt."

Na de interessante resultaten van dit onderzoek, het team is van plan om in dezelfde richting samen te blijven werken, hun analysegebied te verbreden. Ze werken al aan een tweede paper, gericht op de zogenaamde 'kwantumfaseovergangen', dat is, kwantumsystemen waarbij faseovergangen plaatsvinden bij een temperatuur gelijk aan nul en worden geïnduceerd door externe parameters, zoals het magnetische veld.

In termen van toepassingen van deze bevindingen, de mogelijkheden zijn legio - van experimenten met computersimulaties van kwantumsystemen tot meer fundamentele takken van de natuurkunde, zoals kwantumchromodynamica, dat zou ook een impact kunnen hebben op de kernfysica. "Een interessante toepassingsmogelijkheid is het gebruik van statistische fysica-technieken om machinaal leren te begrijpen, " zegt Rodriguez. "Bij dit soort onderzoek, dat gaat van quantum computing tot bijvoorbeeld de studie van neurale netwerken, faseovergangen zijn heel vaak betrokken en we zouden kunnen proberen om onze methode te gebruiken om al dit soort verschillende problemen aan te pakken."