abonneren

Schaken en AI: Zijn computers beter dan mensen?

schaken en AI
Schaken werd eeuwenlang beschouwd als bezigheid voor mensen met grote intellectuele gaven. Maar onlangs versloeg een zelflerende computer na slechts enkele uren studie het sterkste schaakprogramma. Hoe is het zover gekomen?

Computers rekenden er al zo’n vijftien jaar vrolijk op los toen programmeurs van het beroemde Los Alamos Laboratory (toevallig ook de geboorteplaats van de atoombom) zich afvroegen of een machine niet geprogrammeerd kon worden om iets te doen waar tot dan toe – naar men dacht – grote intelligentie voor nodig was: schaken. Er was alleen één probleem: de Maniac I was niet krachtig genoeg voor gewoon schaken op een 8x8-bord, dus bedacht men een 6x6-variant zonder lopers.

Het was aanvankelijk bepaald geen succes; een sterke menselijke tegenspeler won met groot gemak. In de jaren die volgden nam de computer echter langzaam in kracht toe, waardoor ook het gewone schaak weer in zicht kwam. Aanvankelijk leek dat wederom nog nergens naar, maar in 1997 – veel later dan menig deskundige in de jaren vijftig en zestig had gedacht – versloeg de krachtige en speciaal voor schaken geprogrammeerde supercomputer Deep Blue II dan toch eindelijk de sterkste schaker tot dan toe: Gary Kasparov.

AlphaZero vs Stockfish

De kracht van schakende computers is – zoals alles in de wereld van ict – een exponentieel proces. In plaats van de kracht elk jaar met een vast getal te laten toenemen, moeten we die kracht elk jaar met een getal vermenigvuldigen, waardoor niet alleen de kracht elk jaar groter wordt, maar ook de toename – zoals in rente op rente op rente. Dat zorgt ervoor dat de ontwikkelingen steeds sneller gaan.

In de jaren die volgden werden pc-programma’s dan ook steeds sterker, en zo’n vijftien jaar na de successen van supercomputer Deep Blue II kon je al gewoon gratis schaaksoftware voor de pc downloaden waarvan geen mens meer kan winnen. Dat is echter wel software die speciaal geschreven is om miljoenen schaakstellingen razendsnel te kunnen evalueren.

En toen was daar plotseling AlphaZero, een zelflerend systeem dat alleen de spelregels aangereikt kreeg, vervolgens een handvol uren tegen zichzelf ging spelen en aan het eind daarvan sterker was dan het sterkste pc-programma.

schaken en AI

AlphaGo en DeepMind

Het bordspel go is niet alleen aanzienlijk ouder, maar ook aanzienlijk complexer dan schaken – onder meer omdat de speler die aan zet is bij go veel meer zetten in overweging moet nemen. Veel schaaksoftware moest het vooral van brute kracht hebben (veel stellingen per seconde analyseren), en met die aanpak boek je in go aanzienlijk minder succes.

Het duurde dan ook tot de opkomst van deep learning voordat ook in go een serieuze gooi naar de wereldtop kon worden gedaan. Dat gebeurde in 2016 en 2017, toen wereldtoppers Lee Sedol en Ke Jie in een match onder toernooiomstandigheden werden verslagen door AlphaGo. 2017 bracht ons ook een nieuwere versie van AlphaGo, die uitsluitend was getraind via partijen tegen zichzelf. Deze versie was nog veel sterker en versloeg zijn voorganger in 89 uit 100 partijen.

Gesterkt door deze successen richtte DeepMind (de Google-dochter achter dit succes) ook een algemener systeem in voor andere spellen, dat ze AlphaZero noemden. AlphaZero is de machine die verantwoordelijk is voor de doorbraak waarmee we ons verhaal begonnen. Door de machine een handvol uren tegen zichzelf te laten schaken, konden de makers het neurale netwerk dusdanig sterk maken dat Stockfish regelrecht werd vernederd – voor zover dat voor een programma mogelijk is.

“Wat is Stockfish?” vraagt de niet-schaker. Dat is de tot nu toe sterkste schaak-engine met een rating rond 3450 (ter vergelijking: de nummer 1 bij de mensen, Magnus Carlsen, moet het doen met ‘slechts’ 2843).

De overwinningen van AlphaGo en AlphaZero brachten de successen van kunstmatige intelligentie onder de aandacht van een aanzienlijk breder publiek. Niet omdat die er eerder niet waren, maar die kwamen zo sluipenderwijs dat de meeste mensen ze vanwege het eerdergenoemde AI-effect niet als zodanig herkenden.

schaken en AI

De volgende stap

Dat is ook het verraderlijke van exponentiële groei; aanvankelijk lijkt het nog mee te vallen, maar voor je het weet schiet de grafiek vrijwel recht omhoog. Denk maar aan het beroemde verhaal van de man die voor bewezen diensten van de koning een wens mocht doen. “Ach,” zei hij, “geef me maar een schaakbord met één graankorrel op het eerste veld, twee op het tweede, vier op het derde, acht op het vierde …”, enzovoort. Dat lijkt goed te behappen, totdat je beseft dat het totaal meer dan duizend keer de wereldproductie is.

Die exponentiële groei valt ons nu pas op als het gaat om AI, maar een intelligent schakende computer is natuurlijk nog maar het begin. Binnen zeer afzienbare tijd zullen zelflerende computers niet meer worden beperkt tot het leren van één spelletje, maar kunnen ze putten uit álle kennis uit álle digitale bibliotheken of – in het geval van DeepMind – álles wat op de Google-servers te vinden is. Goed, dat is theoretische kennis, maar inmiddels kan de computer ook praktijkervaring opdoen; we hebben hem immers ook al leren lopen.

Tekst: Ap de Smits

Geschreven door: Redactie PCM op

Category: Nieuws, Algemeen

Tags: deepmind, AI