Niet populaire mening Apple-aannemers luisteren naar Siri-audio om de service te verbeteren. Wat is er nog meer nieuw?

In het rapport van de Britse krant The Guardian van afgelopen weekend staat dat Apple contractanten inhuurt die moeten luisteren naar Siri-audio, waardoor critici het verhaal als bewijs nemen dat Apple's toewijding aan privacy niets anders is dan marketingpraatjes.

Een fragment uit het rapport van de Guardian:

Apple-aannemers horen regelmatig vertrouwelijke medische informatie, drugshandelingen en opnames van paren die seks hebben, als onderdeel van hun werk voor kwaliteitscontrole, of 'beoordelen', de Siri-stemassistent van het bedrijf, heeft de Guardian geleerd.

Hoewel Apple dit niet expliciet openbaar maakt in de privacydocumentatie voor consumenten, wordt een klein deel van de Siri-opnames doorgegeven aan contractanten die voor het bedrijf over de hele wereld werken.

Ben je daar honderd procent zeker van? Omdat ik zojuist de privacyschermen van Apple, verspreid over alle besturingssystemen, heb bekeken en zeker duidelijk vertel dat sommige Siri-opnames kunnen worden gebruikt om de Siri-service te verbeteren. Bovendien was ik in staat om het volgende fragment te vinden door de Apple-softwarelicentieovereenkomst voor iOS snel te doorzoeken:

Door Siri of Dictation te gebruiken, stemt u ermee in en stemt u in met de overdracht, verzameling, onderhoud, verwerking en gebruik van deze informatie, inclusief uw steminvoer en gebruikersgegevens, van Apple en zijn dochterondernemingen en agenten om Siri, dicteer- en dicteerfunctionaliteit te leveren en te verbeteren in andere Apple-producten en -services.

Die hele passage is vetgedrukt en ik denk dat het vrij ondubbelzinnig is over de bedoelingen van Apple.

De 'openbaring' dat het bedrijf de door de Siri-persoonlijke assistent verzamelde spraakgegevens verkoopt aan derden - aannemers die belast zijn met het trainen van het Siri-algoritme - als onderdeel van haar poging om de Siri-service te verbeteren, is niets nieuws als u technologie.

Zelfs de Guardian erkent zoveel:

Ze beoordelen de antwoorden op verschillende factoren, waaronder of de activering van de spraakassistent opzettelijk of toevallig was, of de vraag iets was waarmee Siri kon helpen en of de reactie van Siri geschikt was.

Dit is niet de eerste keer dat mensen hebben "ontdekt" dat sommige Siri-audiofragmenten worden doorgegeven aan een derde partij. In 2015 schreef een anonieme medewerker van een bedrijf genaamd Walk N'Talk Technologies op Reddit dat de spraakgegevens die door het bedrijf werden geanalyseerd afkomstig waren van persoonlijke assistenten zoals Siri en Cortana.

Apple gaf de volgende verklaring af aan de Guardian en anderen:

Een klein deel van Siri-verzoeken wordt geanalyseerd om Siri en dictaat te verbeteren. Gebruikersverzoeken zijn niet gekoppeld aan de Apple ID van de gebruiker. Siri-antwoorden worden geanalyseerd in beveiligde faciliteiten en alle reviewers zijn verplicht zich te houden aan de strikte vertrouwelijkheidsvereisten van Apple.

De essentie van het verhaal van de Guardian komt van een "klokkenluider", eigenlijk een Apple-werkgever die aangaf dat hij tijdens privé-activeringen een aantal privé-dingen hoorde.

Dit is wat de klokkenluider de krant vertelde:

Er zijn talloze opnames geweest met privégesprekken tussen artsen en patiënten, zakelijke deals, schijnbaar criminele transacties, seksuele ontmoetingen enzovoort. Deze opnames gaan vergezeld van gebruikersgegevens met locatie, contactgegevens en app-gegevens.

Audio-opnamen van zoekopdrachten van gebruikers maken gebruik van metagegevens zoals locatie om de context beter te begrijpen. Het zorgwekkende deel is het feit dat aannemers in de eerste plaats privégesprekken kunnen horen. Zoals het rapport zelf erkent, is dat mogelijk omdat een gebruiker per ongeluk Siri kan oproepen zonder het te beseffen, en op zijn beurt de audio-opname van alles wat wordt uitgesproken na de wake-up zin "Hey Siri" naar de server moet laten uploaden, en zeker niet omdat Siri neemt in het geheim gesprekken op zonder toestemming van de gebruiker.

Mijn gevoelens hierover zijn zeker niet hetzelfde als de rest van het internet.

Van een digitale assistent wordt niet verwacht dat deze in de loop van de tijd zal verbeteren op basis van alleen kunstmatige intelligentie en machine learning. Dat komt omdat het machine learning-model dat door een assistent wordt gebruikt eerst door menselijke redacteuren moet worden getraind - er zijn gewoon geen twee manieren.

Google Photos zou gezichten niet met griezelige precisie kunnen herkennen als het bedrijf het algoritme niet had getraind met behulp van foto's van echte mensen. Apple's Face ID zou niet mogelijk zijn geweest als de machine learning niet was getraind op meer dan een miljoen foto's van verschillende menselijke gezichten. Zelfs iets als "gewoon" als spraakherkenning kan drastisch worden verbeterd door een machine learning-algoritme te gebruiken met behulp van getrainde gegevens.

De harde waarheid is dat machines (nog) geen machine learning-modellen van andere machines kunnen trainen met bevredigende resultaten - dat is het werk waar wij mensen goed in zijn.

Iedereen in de industrie die kunstmatige intelligentie serieus neemt, gebruikt menselijke editors om hun algoritmen voor machine learning te trainen met het doel de service te verbeteren. Deze werknemers worden blootgesteld aan de inhoud die centraal staat in hun inspanningen, of het nu korte audiofragmenten zijn die zijn vastgelegd door slimme sprekers tijdens spraakinteracties of foto's die mensen uploaden naar een foto-uitwisselingsservice of gemarkeerde items in de feed van sociale media, u snapt het idee.

Sommige bedrijven nemen privacy serieuzer dan andere bedrijven. Sommige bedrijven zijn misschien niet zo transparant in termen van hoe hun menselijke redacteuren de taak die ze uitvoeren benaderen als anderen. En uiteindelijk zullen sommige bedrijven die niet zo sterk zijn in het beschermen van de privacy van gebruikers waarschijnlijk meer door de media en het algemene publiek worden bekeken dan de andere,.

Maar ik geloof geen seconde dat het in het belang van elk bedrijf is om te eisen dat hun werknemers daadwerkelijk luisteren naar onze gesprekken met een persoonlijke digitale assistent alleen omdat ze dat kunnen of omdat ze misschien op de een of andere manier bruikbare informatie willen afleiden van die privé gesprekken - en kom er vele, vele jaren mee weg zonder dat iemand iets merkt of klaagt. Dat is gewoon niet mogelijk in de netwerkwereld van vandaag.

Begrijp me niet verkeerd, ik waardeer het harde onderzoekswerk van een deel van de journalisten die over deze dingen rapporteren omdat ze privacykruisers iets geven om op te kauwen. Maar ik koop geen seconde hun dun verhulde of impliciete conclusie dat Big Tech niet alleen menselijke editors in dienst heeft om Siri, Alexa en Google Assistant te trainen, maar ook om onze gesprekken af ​​te luisteren voor een nog te onthullen, maar zeker snode doeleinden.

Ja, sommige Amazon-medewerkers die naar Alexa-aanvragen luisteren, hebben inderdaad toegang tot de thuisadressen van gebruikers, omdat sommige gesproken aanvragen de locatie bevatten. En ja, sommige door mensen beoordeelde Google Assistent-opnames kunnen mogelijk privégesprekken bevatten omdat klanten vrij zijn om te zeggen wat ze maar willen tegen hun digitale assistent.

Het is wat deze werknemers wordt gevraagd om te doen met die opnames die telt aan het einde van de dag. Het is het feit dat een of andere malafide redacteur misbruik kan maken van informatie van particuliere klanten waarover we ons zorgen moeten maken, niet het feit dat mensen luisteren naar het selecteren van audio-opnamen in een verafgelegen beveiligde faciliteit met het expliciete doel om de service te verbeteren.

gedachten?