science >> Wetenschap >  >> Fysica

Succes door bedrog

Krediet:publiek domein

Theoretisch natuurkundigen van ETH Zürich hebben opzettelijk intelligente machines misleid, en zo het proces van machine learning verfijnd. Ze creëerden een nieuwe methode waarmee computers gegevens kunnen categoriseren, zelfs als mensen geen idee hebben hoe deze categorisering eruit zou kunnen zien.

Wanneer computers onafhankelijk waterlichamen en hun contouren identificeren in satellietbeelden, of versla 's werelds beste professionele spelers bij het bordspel Go, dan werken adaptieve algoritmen op de achtergrond. Programmeurs voorzien deze algoritmen van bekende voorbeelden in een trainingsfase:afbeeldingen van water- en landlichamen, of reeksen Go-bewegingen die hebben geleid tot succes of mislukking in toernooien. Net zoals onze hersenzenuwcellen nieuwe netwerken produceren tijdens leerprocessen, de speciale algoritmen passen zich in de leerfase aan op basis van de voorbeelden die hen worden voorgelegd. Dit gaat door totdat ze in staat zijn om watermassa's van land te onderscheiden op onbekende foto's, of succesvolle reeksen zetten van niet-succesvolle.

Tot nu, deze kunstmatige neurale netwerken zijn gebruikt in machine learning met een bekend beslissingscriterium:we weten wat een waterlichaam is en welke reeksen bewegingen succesvol waren in Go-toernooien.

Het kaf van het koren scheiden

Nutsvoorzieningen, een groep wetenschappers die werken onder Sebastian Huber, Hoogleraar gecondenseerde materietheorie en kwantumoptica aan de ETH Zürich, hebben de toepassingen voor deze neurale netwerken uitgebreid door een methode te ontwikkelen die niet alleen het categoriseren van gegevens mogelijk maakt, maar herkent ook of complexe datasets überhaupt categorieën bevatten.

Dit soort vragen rijzen in de wetenschap:bijvoorbeeld de methode zou nuttig kunnen zijn voor de analyse van metingen van deeltjesversnellers of astronomische waarnemingen. Zo konden natuurkundigen uit hun vaak onhandelbare hoeveelheden meetgegevens de meest kansrijke metingen filteren. Farmacologen zouden moleculen met een bepaalde kans op een specifiek farmaceutisch effect of neveneffect kunnen extraheren uit grote moleculaire databases. En datawetenschappers konden enorme massa's ongeordende datarimpelingen sorteren en bruikbare informatie verkrijgen (datamining).

Zoek een grens

De ETH-onderzoekers pasten hun methode toe op een intensief onderzocht fenomeen van de theoretische fysica:een veellichamensysteem van op elkaar inwerkende magnetische dipolen dat nooit een evenwichtstoestand bereikt - zelfs niet op de lange termijn. Dergelijke systemen zijn onlangs beschreven, maar het is nog niet in detail bekend welke kwantumfysische eigenschappen voorkomen dat een veellichamensysteem in een toestand van evenwicht komt. Vooral, het is onduidelijk waar precies de grens ligt tussen systemen die evenwicht bereiken en systemen die dat niet doen.

Om deze grens te lokaliseren, ontwikkelden de wetenschappers het "act as if"-principe:gegevens uit kwantumsystemen halen, ze stelden een willekeurige grens vast op basis van één parameter en gebruikten deze om de gegevens in twee groepen te verdelen. Vervolgens trainden ze een kunstmatig neuraal netwerk door te doen alsof de ene groep een evenwichtstoestand bereikte en de andere niet. Dus, de onderzoekers deden alsof ze wisten waar de grens lag.

Wetenschappers hebben het systeem in de war gebracht

Ze hebben het netwerk ontelbare keren getraind, met telkens een andere grens, en testte het vermogen van het netwerk om gegevens na elke sessie te sorteren. Het resultaat was dat, vaak, het netwerk had moeite om de gegevens te classificeren zoals de wetenschappers hadden gedaan. Maar in sommige gevallen, de verdeling in de twee groepen was zeer nauwkeurig.

De onderzoekers konden aantonen dat deze sorteerprestatie afhankelijk is van de locatie van de grens. Evert van Nieuwenburg, een doctoraatsstudent in de groep van Huber, legt dit als volgt uit:"Door ervoor te kiezen om te trainen met een grens ver weg van de werkelijke grens (die ik niet ken), Ik kan het netwerk misleiden. Uiteindelijk trainen we het netwerk verkeerd - en verkeerd getrainde netwerken zijn erg slecht in het classificeren van gegevens." als bij toeval een grens wordt gekozen die dicht bij de werkelijke grens ligt, een zeer efficiënt algoritme wordt geproduceerd. Door de prestaties van het algoritme te bepalen, de onderzoekers konden de grens opsporen tussen kwantumsystemen die evenwicht bereiken en die niet:de grens ligt waar de sorteerprestaties van het netwerk het hoogst zijn.

De onderzoekers demonstreerden ook de mogelijkheden van hun nieuwe methode met behulp van twee andere vragen uit de theoretische fysica:topologische faseovergangen in eendimensionale vaste stoffen en het Ising-model, die magnetisme in vaste stoffen beschrijft.

Categorisering zonder voorkennis

De nieuwe methode kan ook vereenvoudigd worden geïllustreerd met een gedachte-experiment, waar we rood willen classificeren, roodachtig, blauwachtige en blauwe ballen in twee groepen. We nemen aan dat we geen idee hebben hoe een dergelijke classificatie er redelijkerwijs uit zou kunnen zien.

Als een neuraal netwerk wordt getraind door het te vertellen dat de scheidslijn ergens in het rode gebied ligt, dan zal dit het netwerk in de war brengen. "Je probeert het netwerk te leren dat blauwe en roodachtige ballen hetzelfde zijn en vraagt ​​het om onderscheid te maken tussen rode en rode ballen, waar het gewoon niet toe in staat is, ", zegt Huber.

Anderzijds, als je de grens in het violette kleurenspectrum plaatst, het netwerk leert een echt verschil en sorteert de ballen in rode en blauwe groepen. Echter, men hoeft niet van tevoren te weten dat de scheidslijn in het violette gebied moet liggen. Door de sorteerprestaties op verschillende gekozen grenzen te vergelijken, deze grens kan worden gevonden zonder voorkennis.