science >> Wetenschap > >> Elektronica

DeepCube-oplosserbenadering kan verder gaan dan kubus in ander onderzoek

Een illustratie van DeepCube. Het training- en oplossingsproces is opgesplitst in ADI en MCTS. Eerst, we trainen iteratief een DNN door de werkelijke waarde van de invoerstatussen te schatten met behulp van breedte-eerst zoeken. Vervolgens, de DNN gebruiken om verkenning te begeleiden, we lossen kubussen op met behulp van Monte Carlo Tree Search. Krediet:arXiv:1805.07470 [cs.AI]

Manieren ontketenen voor een machine om de Rubik's Cube op te lossen? Talloze teams kunnen opstaan en zeggen dat je er geweest bent, gedaan. We hebben veel koppen gezien, te, over hoe ze inklokten om tijdrecords te vestigen. Dus wat is er zo belangrijk aan het nieuwste verhaal over machine-oplossende kubussen?

David Grossman in Populaire mechanica merkte op dat de Californische wetenschappers dingen naar de derde dimensie brachten met een algoritme dat kan uitvinden hoe een Rubik's Cube kan worden opgelost.

Een team van de University of California Irvine staat achter een aanpak die speciale aandacht trok. "Het oplossen van de Rubik's Cube zonder menselijke kennis" is de titel van hun paper, die hun verkenning beschrijft, en het papier staat op arXiv.

Stephen McAleer, Bos Agostinelli, Alexander Shmakov en Pierre Baldi zijn de auteurs.

"We introduceren autodidactische iteratie:een nieuw leeralgoritme voor versterking dat zichzelf kan leren hoe de Rubik's Cube kan worden opgelost zonder menselijke hulp."

Paul Lilly in HotHardware :Machines gebruiken doorgaans een zelflerende methode op basis van een beloningssysteem. Onderzoekers voeren de machine de regels van het spel, en dan gebruikt het een beloningsproces om te bepalen of een zet goed of slecht was,

Echter, zoals de auteurs schreven, "voor veel combinatorische optimalisatie-omgevingen, beloningen zijn schaars en afleveringen zijn niet gegarandeerd te beëindigen."

Ze namen het autodidactische iteratiepad. Ze zeiden, "Om de Rubik's Cube op te lossen met behulp van wapeningsleren, het algoritme zal een beleid leren. Het beleid bepaalt welke zet in een bepaalde staat moet worden genomen."

MIT Technology Review vastgelegd hoe het werkt. "Gegeven een onopgeloste kubus, de machine moet beslissen of een bepaalde beweging een verbetering is ten opzichte van de bestaande configuratie. Om dit te doen, het moet in staat zijn om de verhuizing te evalueren. Autodidactische iteratie doet dit door te beginnen met de voltooide kubus en achteruit te werken om een configuratie te vinden die vergelijkbaar is met de voorgestelde zet."

De auteurs schreven dat "DeepCube een opmerkelijke hoeveelheid Rubik's Cube-kennis ontdekte tijdens het trainingsproces, inclusief de kennis van het gebruik van complexe permutatiegroepen en strategieën die vergelijkbaar zijn met de beste menselijke 'speed-cubers'."

Hun trainingsmachine was een 32-core Intel Xeon E5-2620-server met drie NVIDIA Titan XP GPU's. Ze noemden hun oplosser DeepCube.

Lilly's beoordeling:het is geen perfecte oplossing voor het probleem, maar is onberispelijk in termen van nauwkeurigheid.

Het team verklaarde in de samenvatting van het artikel:"Ons algoritme is in staat om 100% van de willekeurig gecodeerde kubussen op te lossen, terwijl het een mediane oploslengte van 30 zetten bereikt - minder dan of gelijk aan oplossers die gebruik maken van menselijke domeinkennis."

Waarom dit belangrijk is:het is een verhaal over het oplossen van kubussen en meer. Het team noemde extra goals.

"Naast verder werken met de Rubik's Cube, we werken aan het uitbreiden van deze methode om benaderingsoplossingen te vinden voor andere combinatorische optimalisatieproblemen, zoals de voorspelling van de tertiaire eiwitstructuur. Veel combinatorische optimalisatieproblemen kunnen worden gezien als sequentiële besluitvormingsproblemen, in dat geval kunnen we versterkend leren gebruiken."

MIT Technology Review zei dat de nieuwe aanpak "een belangrijk probleem in de informatica aanpakt:hoe complexe problemen op te lossen als de hulp minimaal is."

Ideaal, zei Lilly, "het zou kunnen leiden tot het vinden van genezingen voor ziekten, als de methode in staat is om op zulke dingen te werken als bij het oplossen van een Rubiks kubus."

MIT Technology Review :"De echte test, natuurlijk, zal zijn hoe deze benadering omgaat met complexere problemen zoals eiwitvouwing. We zullen kijken om te zien hoe het gaat."

Optische scantechnologie die wordt gebruikt om wasopnames van inheemse talen te herstellen

Purdue foneemproject creëert nieuwe toekomst voor haptische communicatie

Hoofdlijnen

Wetenschap

Elektronica
Biologie
Zonsverduistering
Wiskunde
French | Italian | Spanish | Portuguese | Swedish | German | Dutch | Danish | Norway |