science >> Wetenschap >  >> Elektronica

AI is een vies geheimpje:het wordt mogelijk gemaakt door mensen

Deze foto van augustus 2017, geleverd door Shamima Khatoon, toont Khatoon in New Delhi. Khatoon's taak om auto's te annoteren, rijstrookmarkeringen en verkeerslichten bij een volledig vrouwelijke buitenpost van datalabelbedrijf iMerit in Metiabruz, Indië, vertegenwoordigt de enige kans die ze heeft om buitenshuis te werken in een conservatieve moslimregio van India. (Mushtari Fatma Zarin/Met dank aan Shamima Khatoon via AP)

Er is een vies klein geheimpje over kunstmatige intelligentie:het wordt aangedreven door honderdduizenden echte mensen.

Van visagisten in Venezuela tot vrouwen in conservatieve delen van India, mensen over de hele wereld doen het digitale equivalent van handwerken — dozen tekenen rond auto's op straatfoto's, afbeeldingen taggen, en het transcriberen van spraakfragmenten die computers niet helemaal kunnen onderscheiden.

Dergelijke gegevens worden rechtstreeks ingevoerd in 'machine learning'-algoritmen die zelfrijdende auto's helpen door het verkeer te kronkelen en Alexa erachter te laten komen dat je de lichten aan wilt. Veel van dergelijke technologieën zouden niet werken zonder enorme hoeveelheden van deze door mensen gelabelde gegevens.

Deze repetitieve taken betalen centen per stuk. Maar massaal, dit werk kan in veel delen van de wereld een fatsoenlijk loon bieden, zelfs in de VS. verbale commando's uitvoeren zonder fouten, en, mogelijk, op een dag zelf nadenken.

____

Deze menselijke input-industrie wordt al lang gekoesterd door de zoekmachines Google en Bing, die al meer dan tien jaar mensen gebruiken om de nauwkeurigheid van hun resultaten te beoordelen. Sinds 2005, Amazon's Mechanical Turk-service, die freelancers koppelt aan tijdelijke online banen, heeft ook crowd-sourced data entry beschikbaar gemaakt voor onderzoekers over de hele wereld.

Recenter, investeerders hebben tientallen miljoenen dollars gestoken in startups zoals Mighty AI en CrowdFlower, die software ontwikkelen die het gemakkelijker maakt om foto's en andere gegevens te labelen, zelfs op smartphones.

Deze ongedateerde combinatie van afbeeldingen geleverd door CrowdFlower toont voor en na renderings van CrowdFlower's Human-in-the-Loop-technologie, die geavanceerde tools biedt waarmee een persoon elk deel van een normale foto kan labelen en structureren en deze kan omzetten in gestructureerde "trainingsgegevens" die een AI-systeem kan begrijpen en interpreteren. (CrowdFlower via AP)

Durfkapitalist S. "Soma" Somasegar zegt dat hij "miljarden dollars aan kansen" ziet in het voldoen aan de behoeften van machine learning-algoritmen. zijn firma, Madrona Venture-groep, geïnvesteerd in Mighty AI. Mensen zullen in de lus "voor een lange, lang, lange tijd te komen, " hij zegt.

Nauwkeurige etikettering zou het verschil kunnen maken tussen een zelfrijdende auto die onderscheid maakt tussen de lucht en de zijkant van een vrachtwagen - een onderscheid dat Tesla's Model S faalde bij het eerste bekende dodelijke ongeval met zelfrijdende systemen in 2016.

"We bouwen geen systeem om een ​​spel te spelen, we bouwen een systeem om levens te redden, ", zegt Daryn Nakhuda, CEO van Mighty AI.

____

Marjorie Aguilar, een 31-jarige freelance visagiste in Maracaibo, Venezuela, besteedt vier tot zes uur per dag aan het tekenen van dozen rond verkeersobjecten om zelfrijdende systemen te trainen voor Mighty AI.

Ze verdient ongeveer 50 cent per uur, maar in een door crisis geteisterd land met op hol geslagen inflatie, met een paar uurtjes werk kun je in bolivars een maandhuur betalen.

"Het klinkt niet als veel geld, maar voor mij is het redelijk, "zegt ze. "Je kunt je voorstellen hoe belangrijk het voor mij is om in Amerikaanse dollars betaald te worden."

Deze ongedateerde foto van Marjorie Aguilar toont Aguilar in Maracaibo, Venezuela. Aguilar, een freelance visagist in Maracaibo, besteedt vier tot zes uur per dag aan het tekenen van dozen rond verkeersobjecten om zelfrijdende systemen te trainen voor Mighty AI. (Met dank aan Marjorie Aguilar via AP)

Aria Khrisna, een 36-jarige vader van drie kinderen in Tegal, Indonesië, zegt dat hij door dingen te doen zoals het toevoegen van woordlabels aan kledingfoto's op websites zoals eBay en Amazon hem ongeveer $ 100 per maand betaalt, ongeveer de helft van zijn inkomen.

En voor de 25-jarige Shamima Khatoon, haar baan annoteren van auto's, rijstrookmarkeringen en verkeerslichten bij een volledig vrouwelijke buitenpost van datalabelbedrijf iMerit in Metiabruz, Indië, vertegenwoordigt de enige kans die ze heeft om buitenshuis te werken in haar conservatieve moslimgemeenschap.

"Het is een goed platform om je vaardigheden te vergroten en je gezin te ondersteunen, " ze zegt.

____

Grote autofabrikanten zoals Toyota, Nissan en Ford, ride-hailing bedrijven zoals Uber en andere tech giganten zoals Waymo van Alphabet Inc. betalen stapels labelers, vaak via externe leveranciers.

De voordelen van grotere nauwkeurigheid kunnen onmiddellijk zijn.

Bij InterContinental Hotels Group, elke oproep die zijn digitale assistent Amelia van een mens kan aannemen, bespaart $ 5 tot $ 10, zegt IT-directeur Scot Whigham.

In deze 8 november, 2017, foto Jessica McShane, een medewerker bij Interactions Corp., controleert persoon-naar-computer communicatie, computers helpen begrijpen wat een mens zegt, in de 'intent analysis'-kamer op het hoofdkantoor van het bedrijf in Franklin, Mass. Wanneer een computer een klantoproep naar de Hyatt Hotels-keten niet kan verstaan, een audiofragment wordt verzonden naar AI-aangedreven callcenter Interactions. Daar, terwijl de klant aan de telefoon wacht, een analist transcribeert alles, van verkeerd begrepen getallen tot godslastering, en geeft de computer snel instructies hoe te reageren. (AP Foto/Steven Senne)

Als Amelia faalt, het programma luistert terwijl een oproep wordt omgeleid naar een van de ongeveer 60 servicedeskmedewerkers. Het leert van hun reactie en probeert de techniek uit bij de volgende oproep, menselijke werknemers vrijmaken om andere dingen te doen.

"We hebben die banen getransformeerd, ' Zegt Whigham.

Wanneer een computer een klantoproep naar de Hyatt Hotels-keten niet kan verstaan, een audiofragment wordt verzonden naar AI-aangedreven callcenter Interactions in een oud bakstenen gebouw in Franklin, Massachusetts.

Daar, terwijl de klant aan de telefoon wacht, een van een kamer vol met koptelefoons dragende "intentie-analisten" transcribeert alles, van verkeerd begrepen getallen tot godslastering, en geeft de computer snel instructies hoe te reageren.

Die informatie komt terug in het systeem. "De volgende keer door, we hebben een grotere kans om succesvol te zijn, " zegt Robert Nagle, Chief Technology Officer van Interactions.

____

Onderzoekers hebben geprobeerd om oplossingen te vinden voor door mensen gelabelde gegevens, maar de resultaten zijn vaak onvoldoende.

In deze 8 november, 2017, foto, Jessica Mc Shane, een medewerker bij Interactions Corp., voorgrond, controleert persoon-naar-computer communicatie, computers helpen begrijpen wat een mens zegt, in de 'intent analysis'-kamer op het hoofdkantoor van het bedrijf in Franklin, Mass. "Die informatie wordt gebruikt voor feedback in het systeem met behulp van machine learning om ons model te verbeteren, " zei Robert Nagle, Chief Technology Officer van Interactions. "De volgende keer door, we hebben meer kans om succesvol te zijn." (AP Photo/Steven Senne)

In een project dat Google Street View-afbeeldingen van geparkeerde auto's gebruikte om de demografische samenstelling van buurten te schatten, Toenmalig Stanford-onderzoeker Timnit Gebru probeerde haar AI te trainen door Craigslist-foto's van te koop aangeboden auto's te schrapen die door hun eigenaren waren gelabeld.

Maar de productfoto's leken helemaal niet op de autoafbeeldingen in Street View, en het programma kon ze niet herkennen. Uiteindelijk, ze zegt, ze gaf $35 uit, 000 om autodealerexperts in te huren om haar gegevens te labelen.

De behoefte aan menselijke labelers is "enorm" en "dynamisch, " zegt Robin Bordoli, CEO van labeltechnologiebedrijf CrowdFlower. "Je kunt het algoritme niet 100 procent vertrouwen."

____

Momenteel, uitzoeken hoe computers kunnen leren zonder de zogenaamde "grondwaarheid"-gegevens die door mensen worden verstrekt, blijft een open onderzoeksvraag.

Trevor Darrell, een machine learning-expert aan de University of California Berkeley, zegt dat hij verwacht dat het vijf tot tien jaar zal duren voordat computeralgoritmen kunnen leren presteren zonder menselijke etikettering.

Alleen al zijn groep besteedt honderdduizenden dollars per jaar aan het betalen van mensen om afbeeldingen te annoteren. "Direct, als je een product verkoopt en je wilt perfectie, het zou nalatig zijn om het geld niet in dat soort aantekeningen te investeren, " hij zegt.

Deze woensdag, 29 november, 2017, foto van Aria Khrisna toont Krishna en zijn 3-jarige zoon Raka. Krisna, een 36-jarige vader van drie kinderen in Tegal, Indonesië, zegt dat hij door dingen te doen zoals het toevoegen van woordlabels aan kledingfoto's op websites zoals eBay en Amazon hem ongeveer $ 100 per maand betaalt, ongeveer de helft van zijn inkomen. (Indah Nurul Hidayah/Aria Khrisna via AP)

Verschillende bedrijven zoals Waymo van Alphabet en gamemaker Unity Technologies ontwikkelen gesimuleerde werelden om hun algoritmen te trainen in gecontroleerde scenario's waarin elk object vooraf gedefinieerd wordt.

Voor het grootste gedeelte, zelfs bedrijven die mensen uit de lus proberen te duwen, vertrouwen nog steeds op hen.

WolkZicht, bijvoorbeeld, biedt website- en app-ontwikkelaars een handig hulpmiddel om een ​​foto te uploaden en een paar woorden terug te krijgen om het te beschrijven. De retailer Kohl's gebruikt de service voor een visuele zoekfunctie "Snap and Shop" op zijn app.

Maar het is niet alleen een fraai computerprogramma dat reacties terugspuugt. Als het algoritme geen goed antwoord heeft, een van de 800 werknemers in plaatsen als India, Zuidoost-Azië of Afrika typ het antwoord in realtime in.

"Wij willen degenen zijn die elk beeld kunnen labelen zonder enige menselijke tussenkomst, " zegt Ian Parnes, CloudSight's hoofd bedrijfsontwikkeling. "Hoe lang dat zal duren, is een gok."

© 2018 The Associated Press. Alle rechten voorbehouden.