torsdag 28. desember 2017

Superintelligensen kommer

Kronikk i Fredrikstad Blad 28.12.2017

Peter Heine Nielsen, Magnus Carlsens trener og sparringspartner, uttalte nylig til BBC: "I always wondered how it would be if a superior species landed on earth and showed us how they played chess. Now I know." Uttalelsen  kom etter at en nyvinning innen kunstig intelligens, Alphazero, hadde utklasset det sterkeste sjakkprogrammet i verden.

Alphazero er ikke et vanlig sjakkprogram. Det er utviklet av DeepMind, et firma grunnlagt i 2010, som ble kjøpt opp av Google (Alphabet) i 2014. Firmaet utvikler kunstig intelligens. Demis Hassabis, en av grunnleggerne av DeepMind, har uttalt at de først skal løse problemet med intelligens, deretter alt annet. Målet er med andre ord å utvikle en så generell og smart kunstig intelligens at den vil kunne løse mange av menneskehetens store spørsmål, enten det er innen forskning, medisin eller klima.

Alphazero er et steg i den retningen. Med spillereglene som eneste forhåndskunnskap har programmet lært seg selv sjakk og feid all motstand av brettet. Det samme programmet har ikke bare lært sjakk, det har lært seg selv  tre av de mest komplekse spillene vi har: sjakk, det kinesiske brettspillet go og det japanske brettspillet shogi. Også i de to andre spillene har Alphazero fått en spillestyrke som overgår både mennesker og maskiner.

Alphazero startet med blanke ark og med en programstruktur som imiterer hjernen. Hassabis har selv doktorgrad innen kognitiv nevrovitenskap, en bakgrunn han har brukt for å utvikle sin nye intelligens. Enkelt fortalt har programmet flere lag av ”hjerneceller” som bindes sammen i et nettverk, på samme måte som hjernen er oppbygd. Nettverket forsøker å se frem i tid og predikere hva motstanderen kommer til å gjøre, og hvis motstanderen gjør et bedre trekk enn hva Alphazero forutser, så vil programmet lære ved at forbindelsene mellom de kunstige hjernecellene forandres.

Med en slik struktur i sekken, kombinert med sjakkspillets regler, startet programmet å spille mot seg selv. I begynnelsen var trekkene tilfeldige, dårlige trekk, men Alphazero fant fort ut hva som var gode trekk og hva som ikke fungerte. Etter bare fire timer intensiv spilling mot seg selv på 5000 TPUer (Googles egenproduserte prosessorer) hadde Alphazero parkert alle mennesker, sjakkcomputere og århundrer med teoretiske studier av sjakk. Det var verdens beste sjakkprogram, Stockfish, som ble feid av brettet. Resultatet var oppsiktsvekkende. Etter hundre partier hadde Alphazero 28 seire, 72 remiser (uavgjort) og null tap.

Det var ikke bare resultatet, men måten Alphazero vant på, som fikk Peter Heine Nielsen til å sammenligne programmet med noe utenomjordisk. Lignende sammenligninger har vi vært vitne til tidligere i kamper mellom mennesker og intelligente maskiner. I et parti i brettspillet go vant en tidligere versjon av Alphazero, AlphaGo, mot en av verdens beste spillere, Lee Sedol. Det var særlig trekk 37 i parti 2 som fikk Lee Sedol til å rive seg i håret. Flere kommentatorer trodde trekket var en stor tabbe av AlphaGo. Kommentatoren Fan Hui kalte derimot trekket fantastisk og utbrøt: ”Det er ikke et menneskelig trekk. Jeg har aldri sett et menneske spille slik.”

Da jeg så kommentarene rundt trekk 37 til AlphaGo minnet det meg på kommentarer nesten to tiår tidligere da Kasparov spilte mot Deep Blue i 1997. I første parti gjorde Deep Blue et ”umenneskelig” trekk, det berømte trekk 44. Trekket var langt fra intuitivt, og Kasparov mente det var tegn på ”superior intelligence”. Det viste seg raskt at det heller var tegn på programmets feilbarlighet. Trekket kom av en feilprogrammering, hvor Deep Blue ikke klarte å bestemme seg for hvilket trekk som var best og gikk inn i en modus hvor programmet i stedet for å gjøre det beste trekket valgte trekket som gjorde minst skade. Men AlphaGos trekk 37 viste seg raskt å være annerledes. Med dette trekket ble det klart at superintelligensen var ekte. Dette var ikke en feil, det var et trekk på et høyere nivå enn det mennesker ville spilt.

DeepMind har nå utviklet sin kunstige intelligens slik at den fra tabula rasa har lært seg tre komplekse brettspill og vist seg overlegen både mennesker og eksisterende programmer. Utviklingen innen kunstig intelligens går i en rivende fart. Skal vi tro teknologioptimisten Ray Kurzweil, sjefingeniør i Google, så vil programmene ha intelligens på menneskers nivå allerede i 2029. Så får vi se hvor lang tid det tar før de klarer å predikere hvilke julegaver som ligger under juletreet.



Tillegg

Kunstig intelligens: kunstig intelligens blir innen informatikk definert som studiet og utviklingen av intelligente agenter, der en intelligent agent er et system som observerer sitt miljø og tar avgjørelser for å maksimere sin egen suksess (fra Wikipedia).

Resultatene beskrevet i artikkelen ble publisert som preprint fra Hassabis og hans kolleger i DeepMind 5. desember under tittelen ”Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm ” (https://arxiv.org/abs/1712.01815).

Den 17. desember publiserte Brown og Sandholm artikkelen ” Superhuman AI for heads-up no-limit poker: Libratus beats top professionals” i Science om en kunstig intelligens som har slått profesjonelle spillere i det mer psykologiske spillet poker, hvor programmet også må forholde seg til skjult informasjon.