Onderzoekers van de Carnegie Mellon-universiteit in het Amerikaanse Pittsburgh hebben software ontwikkeld die in de pokervariant Texas Hold 'em beter presteerde dan vijf professionals aan dezelfde tafel. De bevindingen zijn gepubliceerd in het wetenschappelijke tijdschrift Science.

Bij de pokervariant Texas Hold 'em proberen spelers uit twee kaarten in de hand en vijf kaarten op tafel de beste combinatie van vijf kaarten te halen. Spelers kunnen fiches inbrengen en bluftactieken toepassen om rondes te winnen.

De onderzoekers van Carnegie Mellon ontwikkelden een softwareprogramma, Pluribus, dat poker leerde door het spelletje tegen zichzelf te spelen. Op die manier begint de software als leek, maar 'leert' gaandeweg het spel kennen en tactieken toe te passen om beter te worden.

Toen Pluribus vervolgens tegenover menselijke pokerspelers werd geplaatst, paste de software zich aan aan de situatie door in realtime op zoek te gaan naar een geschikte strategie voor de situatie waarin de computer zich bevond.

Ook programmeerden de onderzoekers Pluribus zo dat de computer er rekening mee kan houden dat een tegenstander gedurende het pokerspel zijn strategie kan aanpassen. Daarnaast werd de software geprogrammeerd om voor tegenstanders in zekere mate onvoorspelbaar te zijn.

Software speelde aan tafel tegen vijf mensen

Pluribus speelde Texas Hold 'em aan een tafel met vijf professionele pokerspelers die in hun carrière meer dan 1 miljoen dollar (ongeveer 888.000 euro) hebben gewonnen.

In totaal deden dertien professionele pokerspelers mee aan het experiment, waarbij tienduizend handen werden gespeeld. In die setting wist Pluribus, na een correctie waarbij de factor geluk werd verminderd, gemiddeld 48 big blinds per duizend handen te winnen.

"Dit wordt beschouwd als een heel erg hoge winratio in Texas Hold 'em met zes spelers, zeker tegen een groep professionals", schrijven de onderzoekers. "Het impliceert dat Pluribus sterker is dan de menselijke tegenstanders."

Poker is een relatief moeilijke vaardigheid om door middel van kunstmatige intelligentie aan een computer te leren, omdat een deel van de informatie verborgen is. Dit in tegenstelling tot bijvoorbeeld de bordspellen schaken of go, waarbij het bord en de stukken voor alle deelnemers zichtbaar zijn.