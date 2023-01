De nieuwe software VALL-E van Microsoft hoeft maar drie seconden je stem te horen om hem bijna foutloos te kunnen imiteren. Moeten we ons daar zorgen over maken?

Ook al doen Siri, Alexa en je navigatiesysteem nog zo hun best, de computerstemmen die je vertellen wanneer je linksaf moet slaan of hoe laat het is klinken toch een beetje vlak. Maar er zijn steeds meer programma's die daar verandering in brengen. Deze week kwam computerbedrijf Microsoft met nieuwe 'slimme' software die iedere menselijke stem kan nadoen. En dat op basis van een spraakfragment van slechts drie seconden.

Het systeem, VALL-E gedoopt, is daarmee sneller dan bestaande software die stemmen imiteert, zegt Microsoft. Ook zou VALL-E beter zijn in het laten doorklinken van emotie. De artificial intelligence (AI) is door Microsoft getraind met 60.000 uur aan opnames van mensenstemmen en wordt geïntegreerd met ChatGPT, de kunstmatig intelligente tekstbot die met een paar simpele hints allerlei tekst kan produceren.

VALL-E is nog niet beschikbaar, maar de Amerikaanse universiteit Cornell heeft de papegaaiensoftware al wel getest. De universiteit maakte fragmenten openbaar waarbij je als luisteraar een fragment ingesproken door een echt persoon kunt vergelijken met de imitatie door VALL-E. Daaruit blijkt dat VALL-E sommige stemmen erg goed kan nadoen. Maar ondanks wat Microsoft beweert, is emotie soms wat lastig. 'Geamuseerd' is bijvoorbeeld voor VALL-E nog een te grote opgave.

Morgan Freeman leest je boodschappenlijst voor

Online wordt intussen al druk gespeculeerd over de mogelijkheden van VALL-E. Stel je bijvoorbeeld voor dat je in de supermarkt je boodschappenlijstje kan beluisteren voorgelezen in het diepe timbre van Morgan Freeman, fantaseerde techblog New Atlas.

Volgens technologie-expert Jarno Duursma past VALL-E in een grotere ontwikkeling. "Er komt steeds meer kunstmatig intelligente software die menselijke vaardigheden beheerst of zelfs verbetert, en het is onvermijdelijk dat die uiteindelijk in de handen van de consument zal komen. Naast ChatGPT en VALL-E is er bijvoorbeeld al langer DALL-E, dat heel snel foto's kan genereren na een paar aanwijzingen." Het is ook niet gek dat juist Microsoft zich hier zo mee bezighoudt. "Microsoft is aandeelhouder in OpenAI, het bedrijf dat alle genoemde software maakt."

De AI wordt in het leven geroepen om ons werk uit handen te nemen. "Het idee is dat we efficiënter, productiever en creatiever kunnen werken als we sommige dingen door AI laten doen."

Jongeren meer gericht op beeld en geluid dan op tekst

Programma's als VALL-E zouden bijvoorbeeld de toegankelijkheid van een geschreven tekst kunnen vergroten, door mensen die moeite hebben met lezen door AI gegenereerde audio aan te bieden. Dat heeft voordelen voor bijvoorbeeld nieuwsmedia. Maar, zegt Duursma, VALL-E is vooral ontworpen met het oog op de steeds sterker wordende audio- en beeldcultuur. "Jonge mensen zijn veel meer gericht op audio en video dan op lezen, en dat wordt alleen maar meer. We gaan toe naar een tijd waarin ieder nieuwsbericht door AI gegenereerde video en bijbehorende audio heeft. Daarom is het ook commercieel interessant om dergelijke AI te ontwikkelen."

Zelf heeft Duursma twee jaar geleden zijn stem gekloond met een ander programma, Descript. "In zes seconden kan ik een tekst door mijn stem laten inspreken. Maar voor podcasts of lange artikelen bleek het nog niet van de kwaliteit te zijn die ik wilde. AI blijft eentonig; zeker bij een lang verhaal mis je de gelaagdheid die je hoort als een echt persoon je iets vertelt."

Spraakberichten van een nep-familielid

De ethische vraagstukken rondom AI zoals VALL-E doemen al snel op, zegt Duursma. "Mogelijkheden tot fraude zijn er volop. Denk aan identiteitsfraude: als iemand een fragmentje van je stem heeft, kan hij je alles laten zeggen." Kwaadwillenden zouden bijvoorbeeld politici alles in de mond kunnen leggen. En neem whatsappfraude, waarbij een wildvreemde je spraakberichten zou kunnen sturen met de stem van een familielid.

In Nederland is er al heel veel wetgeving die dergelijke fraude aanpakt, stelt hij. "Zaken als identiteitsdiefstal en smaad zijn al verboden. Met bestaande regelgeving zou je fraude dus al wel kunnen bestrijden."