science >> Wetenschap >  >> Elektronica

Hoe hoog is de toren in Parijs? Hoe vector zoeken weet dat je naar de Eiffeltoren vraagt

Krediet:CC0 Publiek Domein

Nog maar een paar jaar geleden, zoeken op internet was eenvoudig. Gebruikers typten een paar woorden en waadden door pagina's met resultaten.

Vandaag, diezelfde gebruikers kunnen in plaats daarvan een foto op een telefoon maken en deze in een zoekvak plaatsen of een intelligente assistent gebruiken om een ​​vraag te stellen zonder een apparaat fysiek aan te raken. Ze kunnen ook een vraag typen en een daadwerkelijk antwoord verwachten, geen lijst met pagina's met waarschijnlijke antwoorden.

Deze taken dagen traditionele zoekmachines uit, die zijn gebaseerd op een omgekeerd indexsysteem dat afhankelijk is van trefwoordovereenkomsten om resultaten te produceren.

"Algoritmen voor het zoeken op trefwoorden falen gewoon wanneer mensen een vraag stellen of een foto maken en de zoekmachine vragen, 'Wat is dit?'" zei Rangan Majumder, groepsprogrammamanager in het Bing-zoek- en AI-team van Microsoft.

Natuurlijk, het bijhouden van de zoekvoorkeuren van gebruikers is niet nieuw - het is een worsteling geweest sinds het begin van zoeken op internet. Maar nu, het wordt steeds gemakkelijker om aan die veranderende behoeften te voldoen, dankzij de vooruitgang in kunstmatige intelligentie, inclusief die van het zoekteam van Bing en onderzoekers van het Aziatische onderzoekslaboratorium van Microsoft.

"De AI maakt de producten waarmee we werken natuurlijker, "zei Majumder. "Vroeger, mensen moesten denken, 'Ik gebruik een computer, dus hoe typ ik mijn invoer op een manier die de zoekopdracht niet verbreekt?'"

Microsoft heeft een van de meest geavanceerde AI-tools die het gebruikt om beter te voldoen aan de veranderende zoekbehoeften van mensen, voor iedereen beschikbaar gemaakt als een open source-project op GitHub. Op woensdag, het heeft ook gebruiksvoorbeeldtechnieken en een begeleidende video voor die tools vrijgegeven via het AI-lab van Microsoft.

Het algoritme, genaamd Space Partition Tree And Graph (SPTAG), stelt gebruikers in staat om te profiteren van de intelligentie van deep learning-modellen om door miljarden stukjes informatie te zoeken, vectoren genoemd, in milliseconden. Dat, beurtelings, betekent dat ze sneller relevantere resultaten aan gebruikers kunnen leveren.

Vector zoeken maakt het gemakkelijker om op concept te zoeken in plaats van op trefwoord. Bijvoorbeeld, als een gebruiker typt "Hoe hoog is de toren in Parijs?" Bing kan een resultaat in natuurlijke taal retourneren om de gebruiker te vertellen dat de Eiffeltoren 1 is 063 voet, ook al kwam het woord "Eiffel" nooit voor in de zoekopdracht en het woord "lang" komt nooit voor in het resultaat..

Microsoft gebruikt vector zoeken voor zijn eigen Bing-zoekmachine, en de technologie helpt Bing de bedoeling achter miljarden zoekopdrachten op het web beter te begrijpen en het meest relevante resultaat te vinden tussen miljarden webpagina's.

Vectoren gebruiken om beter te zoeken

In wezen een numerieke weergave van een woord, beeldpixel of ander datapunt, een vector helpt vast te leggen wat een stuk gegevens eigenlijk betekent. Dankzij vooruitgang in een tak van AI die deep learning wordt genoemd, Microsoft zei dat het de zoekintentie kan gaan begrijpen en weergeven met behulp van deze vectoren.

Krediet:Microsoft

Nadat het numerieke punt aan een gegeven is toegewezen, vectoren kunnen worden gerangschikt, of in kaart gebracht, met dichte nummers die in de buurt van elkaar zijn geplaatst om gelijkenis weer te geven. Deze proximale resultaten worden weergegeven aan gebruikers, zoekresultaten verbeteren.

De technologie achter de vectorzoekfunctie die Bing gebruikt, is ontstaan ​​toen bedrijfsingenieurs ongebruikelijke trends in de zoekpatronen van gebruikers begonnen op te merken.

"Bij het analyseren van onze logboeken, het team ontdekte dat zoekopdrachten steeds langer werden, " zei Majumder. Dit suggereerde dat gebruikers meer vragen stelden, te veel uitleggen vanwege het verleden, slechte ervaringen met zoeken op trefwoord, of "probeerden zich als computers te gedragen" bij het beschrijven van abstracte dingen - allemaal onnatuurlijk en onhandig voor gebruikers.

Met Bing zoeken, de vectoriseringsinspanning is uitgebreid tot meer dan 150 miljard stukjes gegevens die door de zoekmachine zijn geïndexeerd om verbetering te brengen ten opzichte van traditionele zoekwoordovereenkomsten. Deze omvatten enkele woorden, karakters, webpagina fragmenten, volledige vragen en andere media. Zodra een gebruiker zoekt, Bing kan de geïndexeerde vectoren scannen en de beste match leveren.

Vectoropdracht wordt ook getraind met behulp van deep learning-technologie voor voortdurende verbetering. De modellen houden rekening met invoer zoals klikken van eindgebruikers na een zoekopdracht om de betekenis van die zoekopdracht beter te begrijpen.

Hoewel het idee om media en zoekgegevens te vectoriseren niet nieuw is, het is pas sinds kort mogelijk om het te gebruiken op de schaal van een enorme zoekmachine zoals Bing, Microsoft-experts gezegd.

"Bing verwerkt elke dag miljarden documenten, en het idee is nu dat we deze items als vectoren kunnen weergeven en door deze gigantische index van meer dan 100 miljard vectoren kunnen zoeken om de meest verwante resultaten te vinden in 5 milliseconden, " zei Jeffrey Zhu, programmamanager in het Bing-team van Microsoft.

Om dat in perspectief te plaatsen, Majumder zei, overweeg dit:een stapel van 150 miljard visitekaartjes zou zich uitstrekken van hier tot aan de maan. Binnen een oogwenk, Bing's zoekopdracht met SPTAG kan 10 verschillende visitekaartjes achter elkaar vinden binnen die stapel kaarten.

Gebruik voor visuele, audio zoeken

Het Bing-team zei dat ze verwachten dat het open source-aanbod kan worden gebruikt voor zakelijke of consumentgerichte applicaties om een ​​taal te identificeren die wordt gesproken op basis van een audiofragment, of voor diensten met veel afbeeldingen, zoals een app waarmee mensen foto's van bloemen kunnen maken en kunnen identificeren welk type bloem het is. Voor dat soort toepassingen een langzame of irrelevante zoekervaring is frustrerend.

"Zelfs een paar seconden voor een zoekopdracht kan een app onbruikbaar maken, ’ merkte Majumder op.

Het team hoopt ook dat onderzoekers en academici het zullen gebruiken om andere gebieden van zoekdoorbraken te verkennen.

"We zijn pas begonnen te onderzoeken wat er echt mogelijk is rond vectorzoeken op deze diepte, " hij zei.