Een digitale assistent die dingen voor je regelt als je daarom vraagt. Het klinkt als een ideale wereld waarin je altijd een hulp meedraagt, maar in werkelijkheid kom je constant terecht in een Babylonische spraakverwarring. NU.nl-redacteur Rutger Otto maakte een week lang zoveel mogelijk gebruik van spraakassistenten.

Op de redactie wordt de stemming snel melig als ik het Lenovo Smart Display, een soort tablet met spraakbediening, heb aangesloten. We komen niet veel verder dan spraakopdrachten als "Vertel eens iets leuks" en "Gaat het nog regenen vandaag?". We proberen de assistent uit te dagen met lastigere vragen, maar in plaats van antwoorden, krijgen we vaak te horen dat de assistent "nog veel moet leren".

Stemassistenten zoals Google Assistent en Siri van Apple werken al een paar jaar via slimme luidsprekers, computers en telefoons. In sciencefictionfilms zoals Her (2013) is de toekomst van de virtuele butlers al geschetst. In die film wordt de hoofdpersoon zelfs verliefd op zijn stemassistent (Scarlett Johansson).

Die mate van intelligentie en emotie hebben we nog lang niet bereikt, merk ik direct tijdens onze tests op de redactie. Ik neem de proef op de som en maak een week lang zoveel mogelijk gebruik van spraakassistenten. Ik kies voor Siri en Google Assistent, omdat ze allebei Nederlands spreken en hier het meest worden gebruikt.

Enkele feitjes over spraakassistenten

  • Volgens Telecompaper gebruikt een derde van de Nederlanders een spraakassistent.
  • Van de grote assistenten spreken alleen Google Assistent en Siri Nederlands.
  • Eind 2018 gebruikte 12 procent van de Nederlanders Siri, schreef Ipsos.
  • Google Assistent werd door 8 procent gebruikt.

Informatie over films zoeken is soms verwarrend.

Zoeken naar een film, eindigen bij de huisarts

Ik begin met mijn proef en tijdens de lunch op de eerste dag gaat het over de nieuwe Stephen King-verfilming Doctor Sleep. Mijn collega heeft hem gezien en zegt dat het een lange zit is, maar heeft de exacte speelduur niet paraat. Ik grijp deze kans en vraag het aan mijn iPhone. Al snel verandert een simpele vraag in grote verwarring.

"Hoe lang duurt Doctor Sleep?" Mijn opdracht wordt verwerkt als "Hoe lang duurt de dokter sliep" en als antwoord toont Siri huisartsenpraktijken in de buurt. Goed, misschien moet ik duidelijker zijn. "Hoe lang duurt de film Doctor Sleep?" Het biedt geen soelaas. "Ik kan geen overeenkomstige locaties vinden", meldt Siri.

De volgende avond ga ik naar een lezing in de Utrechtse Janskerk. "Kun je me de route naar Janskerk laten zien?", vraag ik Siri. Niets. "Sorry, ik weet niet waar dat is."

Het werkt pas als ik specifiek Google Maps in mijn vraag opneem. Het probleem is waarschijnlijk dat Siri van Apple is en Maps van Google. Omdat de assistenten het beste werken met apps binnen hun eigen ecosysteem, ben ik meteen beperkt in mijn mogelijkheden. Ik vraag het nog eens aan de Assistent van Google en ik heb meteen een gewenst resultaat.

Mijn probleem is dat ik diensten van Google en Apple door elkaar gebruik, en daarin ben ik vast niet de enige. Mijn agenda staat bij Google, maar als ik mijn afspraken opvraag bij Siri, wordt standaard de agenda van Apple geopend. Van mijn persoonlijke assistent mag ik toch verwachten dat hij me een beetje kent?

Het opvragen van een route gaat niet altijd goed.

Ik voel me een clown

Ik ben nooit een grootgebruiker van spraakassistenten geweest. Ja, soms zette ik een kookwekker, meer niet. Al vroeg in mijn testweek merk ik dat het simpelweg niet in mijn systeem zit. Het openen van apps met mijn duim is sneller.

Op straat heb ik geen moeite om met een spraakopdracht een hardlooptraining te starten. Maar als ik in een volle trein zit, voelt een spraakopdracht ongemakkelijk.

Ik wil een bericht versturen en ik begin aan mijn opdracht. "Hey Siri, stuur een WhatsApp-bericht naar Wessel." Ik voel me een clown en vraag me af: Waarom zou de coupé moeten meeluisteren met wat ik tegen mijn vrienden zeg? En hoe omslachtig is deze werkwijze? Ik heb last van Siri-schaamte.

Khiet Truong, universitair docent aan de Universiteit Twente, onderzoekt de spraakcommunicatie tussen mens en machine. Ze kijkt niet raar op van mijn Siri-schaamte. "Dit heet in de psychologie het Hawthorne-effect", zegt ze. "Word je bekeken, dan gedraag je je anders. Als je een stemassistent gebruikt, trek je de aandacht en kunnen mensen een mening over je vormen."

Ik besluit mijn WhatsAppjes in de trein gewoon weer te typen.

“Langzamer tegen een assistent praten moet je vooral niet doen.”
Odette Scharenborg, hoofddocent TU Delft

De ene assistent is de andere niet

Google Assistent en ik begrijpen elkaar een stuk beter dan Siri en ik. Met een beetje mompelen kom je bij de Google Assistent een heel eind. Waarom moet ik tegen de ene assistent duidelijker praten dan tegen de andere?

Odette Scharenborg, universitair hoofddocent aan de TU Delft, heeft daar meerdere verklaringen voor. "Als je mompelt, spreek je veel klanken niet uit."

Duidelijk articuleren levert betere resultaten op. De manier waarop een assistent is getraind, is belangrijk. "Er zijn veel opnames nodig van verschillende soorten mensen", zegt Scharenborg. "Hoe meer data, des te beter."

Op de redactie valt het mijn chef op dat ik heel anders tegen de assistenten begin te praten. Ik spreek langzamer, gebruik een andere intonatie en laat pauzes vallen. "Doe dat vooral niet", zegt Scharenborg. Het blijkt juist verwarrender voor de assistent.

Praten met een assistent voelt tijdens mijn test nooit als een gesprek met een mens. Sterker: ik hoor mezelf steeds meer praten als een robot. Ik vraag niet meer of Siri een liedje op Apple Music wil afspelen, maar ik hou het kort: "Siri, speel muziek!" De machine wordt niet menselijker, ik verander in een machine.

“Uiteindelijk willen we toe naar een menselijke dialoog.”
Khiet Truong, docent universiteit Twente

De toekomst van Her is nog ver weg

Peter Ruijten-Dodoiu, die aan de TU Eindhoven onderzoek doet naar interacties tussen mens en techniek, weet waarom. "Toen de eerste auto's verschenen, moesten wij ons in onmogelijke bochten wringen. Maar er waren weinig alternatieven, dus namen we er genoegen mee. Zo is het ook met stemassistenten. Er zijn er nog niet veel, dus is er weinig noodzaak om natuurlijk over te komen."

Volgens Ruijten-Dodoiu begrijpen assistenten essentiële onderdelen in onze spraak nog niet om menselijk over te kúnnen komen. "Ze snappen onze onderliggende gedachten, emoties en intonatie niet."

Zelf reageren de assistenten ook op een monotone manier. "Als de assistenten op gepaste momenten sneller en met verschillende toonhoogtes praten, komen ze waarschijnlijk menselijker over", aldus Ruijten-Dodoiu.

Er is dus een goede verklaring waarom ik meer als een robot praat. Truong merkt in haar onderzoek dat mensen zich in het algemeen aanpassen aan de machine. "Jij weet dat de technologie nog niet 100 procent werkt en je leert hoe je met minder woorden hetzelfde resultaat bereikt. Uiteindelijk willen we graag toe naar een menselijke dialoog."

Die is er op dit moment niet. Met mijn duimen navigeer ik zo snel over mijn telefoonscherm, dat spraakassistenten vaak vertragend lijken te werken. Misschien begrijpen de assistenten me over een paar jaar een stuk beter, maar voorlopig hou ik het bij simpele opdrachten, zoals het instellen van timers.

Ik neem afscheid van Siri: "Ik hoef je voorlopig niet meer te spreken". Het antwoord: "Hallo. Ben je naar mij op zoek?". Zucht.