Hoe leert Siri precies een nieuwe taal? In het interview van vandaag met Reuters bood Apple's speechteamhoofd Alex Acero een kijkje achter de schermen van de manier waarop Siri nieuwe talen wordt onderwezen, een proces waarbij scripts worden geschreven, stemmen worden vastgelegd in meerdere accenten en dialecten en machine learning en kunstmatige intelligentie om in de loop van de tijd nieuwe taalmodellen te bouwen en te ontwikkelen. Het systeem vereist een team van mensen die belast zijn met het lezen van passages van handmatig getranscribeerde tekst.
Voordat Apple Siri daadwerkelijk bijwerkt, implementeert Apple eerst ondersteuning voor dicteren voor een nieuwe taal.
Siri spreekt momenteel 21 talen in 36 landen. Ter vergelijking: Microsoft's Cortana ondersteunt acht talen op maat voor dertien landen, Google Assistant spreekt vier talen, terwijl Alexa van Amazon alleen in het Engels en Duits werkt.
Het onderwijzen van Siri in een nieuwe taal omvat de volgende stappen:
- Mensen lezen aangepaste tekstpassages in een reeks accenten en dialecten
- Opnamen worden met de hand getranscribeerd, zodat Siri precies weet wat het zou moeten leren
- Ze vangen ook geluiden op met verschillende stemmen
- Er is een nieuw taalmodel gebouwd dat woordenreeksen probeert te voorspellen
Apple rolt dicteerondersteuning uit voor de nieuwe taal voordat deze aan Siri wordt toegevoegd - daarom ondersteunt de Diction-functie meer talen dan Siri (de aankomende macOS Sierra 10.12.4-software-update zal bijvoorbeeld dicteerondersteuning inschakelen voor Shanghainese, een Chinees dialect dat wordt gesproken alleen rond die stad).
Met dicteren kan Apple geanonimiseerde audio-opnames maken, compleet met achtergrondgeluid en gemompel. De audio wordt handmatig getranscribeerd door mensen, een proces waarvan Acero beweert dat het het aantal fouten bij spraakherkenning met de helft kan verminderen.
Het is pas nadat voldoende gegevens zijn verzameld dat Apple een acteur opdracht geeft om stemmen op te nemen voor Siri. Wanneer een nieuwe Siri-taal klaar is voor prime time, wordt deze vrijgegeven met antwoorden op wat Apple schat dat de meest voorkomende vragen zullen zijn.
Apple heeft grote bedragen geïnvesteerd in kunstmatige intelligentie en machine learning om de taalmodellen in de loop van de tijd te helpen evolueren terwijl Siri meer leert over wat gebruikers vragen.
Ze updaten Siri elke twee weken met meer tweaks, zei Acero.
Abonneer je op iDownloadBlog op YouTube
Een mogelijk probleem met de aanpak van Apple, volgens Charles Jolley, de maker van een intelligente assistent genaamd Ozlo, is dat je niet genoeg schrijvers kunt inhuren om het systeem te bedenken dat je in elke taal nodig hebt.
Andere persoonlijke assistenten, waaronder Google Now en Microsoft Cortana, verminderen het schaalprobleem door de antwoorden te synthetiseren, iets waar Siri niet erg goed in is.
Viv, een startup opgericht door Siri's oorspronkelijke makers die Samsung vorig jaar heeft overgenomen, werkt daar precies aan. "De enige manier om de beperkte functionaliteitsversies van vandaag te laten springen is door het systeem open te stellen en de wereld hen te laten onderwijzen."
Hoewel Siri nu meer talen spreekt dan haar rivalen (Google en Amazon zeiden dat ze van plan zijn om meer talen naar hun respectieve assistenten te brengen), blijft de gebruiker nog steeds een sub-par ervaring omdat, zoals ik al zei, andere assistenten zijn beter in het begrijpen van context en het bieden van meer gespreksreacties.
De acquisitie van $ 200 miljoen van het in Australië gevestigde opstarten van Turi door het Amerikaanse bedrijf Turpert in augustus 2016, moet de taal- en kennismodellen van Siri helpen verbeteren.
Van Apple wordt verwacht dat het op zijn jaarlijkse pelgrimstocht voor ontwikkelaars die op 5 juni van start gaan met verbeterde Siri-mogelijkheden (al dan niet exclusief voor iPhone 8) zal pronken met Siri-verbeteringen, waaronder ondersteuning voor meerdere talen.
iOS 10 ondersteunt typen in twee talen zonder van toetsenbord te hoeven wisselen, dus misschien begrijpt Siri binnenkort meerdere talen zonder dat u er handmatig een moet kiezen in Instellingen → Siri → Taal?
Een meertalige Siri zou ook geweldig moeten werken op Apple TV.
Een interview in november 2015 met verschillende Apple TV-projectmanagers suggereerde dat Apple Siri aanvankelijk beperkte op de settopbox tot slechts acht landen vanwege de verschillen in de uitspraak van acteursnamen, films en regisseurs in verschillende talen en dialecten.
Bron: Reuters