Niks meer missen?
Schrijf je in voor onze nieuwsbrief!
Foto: Donarreiskoffer (cc, via Flickr)
wetenschap

Verliest de mens na schaakspel ook Go van computer?

Max Rozenburg,
9 maart 2016 - 09:21

Van 9 tot 15 maart verdedigt Go-wereldkampioen Lee Sedol in de Zuid-Koreaanse hoofdstad Seoul de eer van de mens tegen het Google-programma AlphaGo. Waar de mensheid twintig jaar geleden al het schaken verloor van de computer, bleek het Oost-Aziatische Go lange tijd een niet te veroveren vesting voor computers. Maar Google denkt dankzij deep learning-technieken het spel nu toch gekraakt te hebben.

‘Schaken heeft ingewikkelde regels. Go heeft daarentegen vrij eenvoudige regels maar is toch een ingewikkeld spel. Daarom is het voor veel mensen moeilijk in te beelden dat het zo lang heeft geduurd voordat het spel gekraakt werd,’ vertelt Leo Dorst van het Instituut voor Informatica van de UvA. ‘De regels leg ik je in vijf minuten uit, dus je zou denken dat een computer het dan ook moet kunnen.’

 

10 tot de macht 42

Toch is er één groot verschil, stelt Dorst. ‘Schaken wordt beperkt door een grote hoeveelheid regels en een klein speelveld. Bij Go mag je je stukken overal willekeurig neerzetten, en heb je een veel groter speelveld – negentien bij negentien vakken, in vergelijking met een schaakbord dat maar acht bij acht is.’ Dit zorgt voor een onvoorstelbare hoeveelheid mogelijke zetten. ‘Het aantal mogelijke zetten in één partij is 10 tot de macht 42. Schaakcomputers kon je handmatig programmeren om op een bepaalde manier op een situatie te reageren, bij Go kan dat niet.’

Foto: Katpatuka (cc, via Wikimedia Commons)
Het mogelijke begin van een partij Go, waarbij het doel is om stenen van de ander in te sluiten

Het schaakspel is twintig jaar geleden gekraakt Bekijk hier een documentaire over de strijd tussen IBM-computer Deep Blue en schaakgrootmeester Garry Kasparovaan de hand van de ‘brute force-methode, vertelt Dorst. Daarbij rekent de computer botweg alle mogelijke opties uit totdat de optie is gevonden die het probleem het best oplost. ‘Maar bij Go zijn er gewoon teveel opties om het op die manier te doen,’ zegt Dorst.

 

Met de introductie van Machine learning leek de eerste stap gezet. Machine learning is een methode waarbij de computer zichzelf reacties op herhaalde patronen aanleert, en deze dan toepast wanneer hij wordt geconfronteerd met een bekend patroon. Maar ‘in Go zijn er te weinig herhaalde patronen om het met native machine learning op te lossen,’ stelt Dorst.

‘AlphaGo heeft evenveel partijen gespeeld als een mens in duizend jaar kan doen – daar heeft hij vast iets van geleerd'

Deep machine learning

Googles AlphaGo maakt echter gebruik van deep machine learning, ‘Deep learning dient vooral om grote hoeveelheden data te analyseren en daar dan een patroon in te vinden. Als je bijvoorbeeld een grote hoeveelheid medische gegevens hebt – bijvoorbeeld een hele hoop MRI-scans – en je weet welke ziektes je patiënten krijgen, dan zoekt de computer daar bepaalde patronen in. De AlphaGo doet hetzelfde. Hij speelt gewoon een paar miljoen spellen met zichzelf, zoekt daar patronen in en weet dan hoe hij op bepaalde situaties moet reageren.’

 

Toch zal wereldkampioen Lee Sedol volgens Dorst als overwinnaar uit de bus komen. ‘De berichten zijn dat AlphaGo ondertussen evenveel partijen heeft gespeeld als een mens in duizend jaar kan doen – daar heeft hij vast wel iets van geleerd. Toch wordt het gewoon 5-0 voor Lee Sedol. Over vijf jaar zal hij het er moeilijk mee hebben, maar ik denk dat we nu nog niet zo ver zijn.’

 

N.B. Het gesprek met Leo Dorst vond plaats voor de eerste wedstrijd, die gewonnen werd door AlphaGo.

 

 

 

Dorst van het Instituut voor Informatica aan de UvA organiseert samen met collega Max Welling op 10 maart Let IT Go, waarbij uitgebreid wordt ingegaan op de reeks wedstrijden tussen AlphaGo en Sedol.