science >> Wetenschap >  >> Elektronica

De onzekere eenwieler die zichzelf leerde en hoe het AI helpt om goede beslissingen te nemen

Krediet:het district

Cambridge-onderzoekers pionieren met een vorm van machine learning die begint met slechts een beetje voorkennis en voortdurend leert van de wereld eromheen.

In het midden van het scherm staat een kleine eenwieler. De animatie begint, de eenwieler slingert naar voren en valt. Dit is proef #1. Het is nu proef #11 en er is een verandering - een bijna onmerkbare vertraging in de herfst, misschien een poging om zichzelf te herstellen voor de onvermijdelijke crash. "Het is leren van ervaring, " knikt professor Carl Edward Rasmussen.

Na een minuut, de eenwieler schommelt zachtjes heen en weer terwijl hij ter plaatse cirkelt. Het heeft ontdekt hoe dit extreem onstabiele systeem werkt en heeft zijn doel onder de knie. "De eenwieler begint met niets te weten over wat er aan de hand is - er is alleen verteld dat het zijn doel is om rechtop in het midden te blijven. Terwijl hij voor- en achterwaarts begint te vallen, het begint te leren, " legt Rasmussen uit, die het Computational and Biological Learning Lab leidt in de afdeling Engineering. "We hadden een echte eenwielerrobot, maar die was eigenlijk best gevaarlijk - hij was sterk - en daarom gebruiken we nu gegevens van de echte om simulaties uit te voeren, en we hebben een miniversie."

Rasmussen gebruikt de autodidactische eenwieler om te demonstreren hoe een machine kan beginnen met heel weinig gegevens en dynamisch kan leren, het verbeteren van zijn kennis telkens wanneer het nieuwe informatie uit zijn omgeving ontvangt. De gevolgen van het aanpassen van het gemotoriseerde momentum en het evenwicht helpen de eenwieler om te leren welke bewegingen belangrijk waren om hem te helpen rechtop te blijven in het midden.

"Dit is net zoals een mens zou leren, " legt professor Zoubin Ghahramani uit, die de Machine Learning Group leidt in de afdeling Engineering. "We beginnen niet alles te weten. We leren dingen stapsgewijs, van slechts enkele voorbeelden, en we weten wanneer we nog niet zeker zijn van ons begrip."

Het team van Ghahramani pioniert met een tak van AI die continue machine learning wordt genoemd. Hij legt uit dat veel van de huidige vormen van machine learning gebaseerd zijn op neurale netwerken en deep learning-modellen die complexe algoritmen gebruiken om patronen te vinden in enorme datasets. Veelgebruikte toepassingen zijn onder meer het vertalen van zinnen in verschillende talen, het herkennen van mensen en objecten in beelden, en het detecteren van ongebruikelijke uitgaven aan creditcards.

"Deze systemen moeten worden getraind op miljoenen gelabelde voorbeelden, wat tijd en veel computergeheugen kost, " legt hij uit. "En ze hebben gebreken. Als je ze test buiten de gegevens waarop ze zijn getraind, presteren ze meestal slecht. Zelfrijdende auto's, bijvoorbeeld, kunnen worden getraind op een enorme dataset van afbeeldingen, maar ze zijn mogelijk niet in staat om te generaliseren naar mistige omstandigheden.

"Erger dan dat, de huidige deep learning-systemen kunnen ons soms met vertrouwen verkeerde antwoorden geven, en beperkt inzicht geven in waarom ze tot bepaalde beslissingen zijn gekomen. Dit is wat mij stoort. Het is oké om ongelijk te hebben, maar het is niet oké om vol vertrouwen ongelijk te hebben."

De sleutel is hoe je omgaat met onzekerheid - de onzekerheid van rommelige en ontbrekende gegevens, en de onzekerheid van het voorspellen van wat er zou kunnen gebeuren. "Onzekerheid is niet goed - het is iets waar je tegen vecht, maar je kunt er niet tegen vechten door het te negeren, ", zegt Rasmussen. "We zijn geïnteresseerd in het vertegenwoordigen van de onzekerheid."

Het blijkt dat er een wiskundige theorie is die je vertelt wat je moet doen. Het werd voor het eerst beschreven door de 18e-eeuwse Engelse statisticus Thomas Bayes. Ghahramani's groep was een van de eerste gebruikers van AI van de Bayesiaanse waarschijnlijkheidstheorie, waarin wordt beschreven hoe de waarschijnlijkheid van een gebeurtenis (zoals rechtop blijven in het midden) wordt bijgewerkt naarmate er meer bewijs (zoals de beslissing die de eenwieler het laatst nam voordat hij omviel) beschikbaar komt.

Dr. Richard Turner legt uit hoe de regel van Bayes omgaat met continu leren:"het systeem neemt zijn voorkennis, weegt het door hoe nauwkeurig het denkt dat kennis is, combineert het vervolgens met nieuw bewijs dat ook wordt gewogen door de nauwkeurigheid ervan.

"Dit is veel data-efficiënter dan de manier waarop een standaard neuraal netwerk werkt, "Hij voegt eraan toe. "Nieuwe informatie kan ertoe leiden dat een neuraal netwerk alles vergeet wat het eerder heeft geleerd - catastrofaal vergeten genoemd - wat betekent dat het alle gelabelde voorbeelden opnieuw moet bekijken, zoals het opnieuw leren van de regels en de woordenlijst van een taal elke keer dat je een nieuw woord leert.

"Ons systeem hoeft niet alle gegevens die het eerder heeft gezien opnieuw te bekijken - net zoals mensen niet alle ervaringen uit het verleden onthouden; in plaats daarvan leren we een samenvatting en werken we deze bij terwijl de dingen doorgaan." Ghahramani voegt toe:"Het mooie van Bayesiaanse machine learning is dat het systeem beslissingen neemt op basis van bewijs - het wordt soms gezien als 'het automatiseren van de wetenschappelijke methode' - en omdat het gebaseerd is op waarschijnlijkheid, het kan ons vertellen wanneer het buiten zijn comfortzone is."

Ghahramani is ook Chief Scientist bij Uber. Hij ziet een toekomst waarin machines voortdurend leren, niet alleen individueel maar als onderdeel van een groep. "Of het nu gaat om bedrijven als Uber die vraag en aanbod optimaliseren, of autonome voertuigen die elkaar waarschuwen voor wat er op de weg ligt, of robots die samenwerken om een ​​zware last op te tillen – samenwerking, en soms concurrentie, in AI zal helpen bij het oplossen van problemen in een groot aantal industrieën."

Een van de echt opwindende grenzen is het kunnen modelleren van waarschijnlijke resultaten in de toekomst, zoals Turner beschrijft. "De rol van onzekerheid wordt heel duidelijk wanneer we beginnen te praten over het voorspellen van toekomstige problemen zoals klimaatverandering."

Turner werkt samen met klimaatwetenschappers Dr. Emily Shuckburgh en Dr. Scott Hosking bij de British Antarctic Survey om zich af te vragen of technieken voor machinaal leren het inzicht in de risico's van klimaatverandering in de toekomst kunnen verbeteren.

"We moeten het toekomstige risico en de gevolgen van extreem weer op lokale schaal kwantificeren om beleidsreacties op klimaatverandering te informeren, " legt Shuckburgh uit. "De traditionele computersimulaties van het klimaat geven ons een goed inzicht in de gemiddelde klimaatomstandigheden. Wat we met dit werk willen doen, is die kennis te combineren met waarnemingsgegevens van satellieten en andere bronnen om beter grip te krijgen op, bijvoorbeeld, het risico van weersgebeurtenissen met een lage waarschijnlijkheid maar met een grote impact."

"Het is eigenlijk een fascinerende machine learning-uitdaging, " zegt Turner, die helpt te identificeren welk gebied van klimaatmodellering het meest vatbaar is voor het gebruik van Bayesiaanse waarschijnlijkheid. "De gegevens zijn extreem complex, en soms ontbrekend en ongelabeld. De onzekerheden zijn wijdverbreid." Een belangrijk element van onzekerheid is het feit dat de voorspellingen zijn gebaseerd op onze toekomstige emissiereductie, waarvan de omvang nog niet bekend is.

"Een interessant onderdeel hiervan voor beleidsmakers, afgezien van de prognosewaarde, is dat je je een machine kunt voorstellen die voortdurend leert van de gevolgen van mitigatiestrategieën zoals het verminderen van emissies - of het gebrek daaraan - en zijn voorspellingen dienovereenkomstig aanpast, ", voegt Turner eraan toe.

Wat hij beschrijft is een machine die – net als de eenwieler – zich voedt met onzekerheid, leert continu van de echte wereld, en beoordeelt en herbeoordeelt vervolgens alle mogelijke uitkomsten. Als het om het klimaat gaat, echter, het is ook een machine van alle mogelijke toekomsten.