Bloomberg duizenden Amazon-werknemers luisteren naar Echo-spraakopnamen

Amazon laat duizenden werknemers luisteren naar Echo-audioclips als onderdeel van het verbeteren van Alexa's machine learning, zodat de persoonlijke assistent beter kan reageren op spraakopdrachten.

Deze mensen luisteren naar wat sommige Alexa-eigenaren de assistent vertellen, bekijken, transcriberen en annoteren van audio-opnamen om het machine learning-model van Alexa te helpen trainen.

Bloomberg heeft het verhaal:

Het werk is meestal alledaags. Een medewerker in Boston zei dat hij verzamelde spraakgegevens voor specifieke uitingen zoals 'Taylor Swift' heeft gedolven en er annotaties op heeft aangebracht om aan te geven dat de zoeker de muzikale artiest bedoelde.

Tot nu toe zo goed, maar ...

Af en toe pakken de luisteraars dingen op die Echo-eigenaars waarschijnlijk liever privé houden: een vrouw die bijvoorbeeld slecht onder de douche zingt, of een kind dat om hulp schreeuwt. De teams gebruiken interne chatrooms om bestanden te delen wanneer ze hulp nodig hebben bij het ontleden van een verward woord of een grappige opname tegenkomen.

Ik deel de audio-opname van een klant met een collega om de klus te klaren. Maar het delen van een audioclip met een collega alleen omdat de gebruiker misschien iets grappig of doms heeft gezegd, voelt me ​​helemaal verkeerd en onprofessioneel.

Soms horen ze opnames die ze verontrustend of mogelijk crimineel vinden. Twee van de werknemers zeiden dat ze hadden opgepikt wat volgens hen een seksuele aanval was. Wanneer zoiets gebeurt, kunnen ze de ervaring in de interne chatroom delen als een manier om stress te verlichten.

Hoewel Amazon een proces heeft dat zijn werknemers moeten volgen wanneer ze iets verontrustends horen, werden sommige werknemers in niet mis te verstane beweringen afgewezen met de uitleg dat het niet de taak van Amazon was om zich ermee te bemoeien.

Voor degenen die zich zorgen maken over privacy, beweert het rapport dat mensen in dit team luisteren naar slechts enkele van de spraakopnamen die zijn gemaakt in de huizen en kantoren van Echo-eigenaren.

Een woordvoerder van Amazon zei:

We nemen de beveiliging en privacy van de persoonlijke gegevens van onze klanten serieus. We annoteren alleen een extreem kleine steekproef van Alexa-spraakopnamen om de klantervaring te verbeteren.

Deze informatie helpt ons bijvoorbeeld om onze systemen voor spraakherkenning en natuurlijk taalbegrip te trainen, zodat Alexa uw verzoeken beter kan begrijpen en ervoor kan zorgen dat de service voor iedereen goed werkt.

Audiobestanden zijn ontdaan van identificeerbare informatie zoals de volledige naam en het adres van een gebruiker. Dat gezegd hebbende, zou Amazon transparanter kunnen zijn met zijn gegevensverzameling:

Het Alexa voice review-proces, beschreven door zeven mensen die aan het programma hebben gewerkt, benadrukt de vaak vergeten menselijke rol in algoritmen voor trainingssoftware. In marketingmateriaal zegt Amazon dat Alexa in de cloud leeft en steeds slimmer wordt. Maar zoals veel softwaretools die zijn gebouwd om van ervaring te leren, doen mensen een deel van het onderwijs.

Gebruikers kunnen instellingen aanpassen om te voorkomen dat Amazon hun stemopnames gebruikt om Alexa te verbeteren.

De online retailgigant erkent dat Alexa-verzoeken worden gebruikt "om onze spraakherkenningssystemen en ons begrip van de natuurlijke taal te trainen", maar dit is begraven in een lijst met veelgestelde vragen op hun website. Hoe je het ook bekijkt, contextuele spraakherkenning is een moeilijke noot om te kraken, maar machine learning belooft de juiste oplossing te zijn. Het probleem is dat machine learning-modellen moeten worden getraind.

Amazon heeft teams van mensen die Alexa-stemvragen labelen en categoriseren

Apple heeft bijvoorbeeld Face ID getraind met meer dan een miljard foto's van gezichten van mensen. Wat spraakherkenning betreft, vereist het bereiken van hoge nauwkeurigheid grote hoeveelheden gelabelde gegevens.

Daarom is het niet mogelijk om Siri in een nieuwe taal te lanceren zonder voldoende gegevens te hebben om de akoestische modellen te trainen, en die gegevens moeten afkomstig zijn van echte mensen die echte stemvragen uitvoeren. Het enige verschil tussen Amazon en Apple is dat de eerste mensen naar sommige van die opnames laat luisteren, terwijl de laatste, vermoedelijk, niet.

Nu je weet dat Amazon een wereldwijd team heeft dat naar Alexa-audioclips luistert, is het meer of minder waarschijnlijk dat je Echo-producten blijft gebruiken?

Laat het ons weten door hieronder een reactie achter te laten.