AlphaZero de Google arrasa a Stockfish
Hoy el ajedrez cambió para siempre. Y quizá el resto del mundo también.
Hace poco más de un año, AlphaGo venció sensacionalmente al mejor jugador de go. Ahora, el programa de inteligencia artificial AlphaZero ha obliterado al módulo de ajedrez más fuerte del mundo.
Stockfish, que es la herramienta de preparación de la mayoría de ajedrecistas de élite y que ganó el Campeonato TCEC 2016 y el Campeonato entre Computadoras de Chess.com 2017, no fue rival para AlphaZero, que ganó el match a puerta cerrada de 100 partidas con 28 victorias, 72 tablas y 0 derrotas.
Ah, y AlphaZero solo tardó cuatro horas en "aprender" ajedrez. Lo siento, humanos; hicisteis lo que pudisteis.
Así es: Los programadores de AlphaZero, alojado en la división DeepMind de Google, hicieron que usara un tipo de "aprendizaje automático", concretamente aprendizaje de refuerzo. Dicho de forma simple, AlphaZero no "aprendió" el juego de ajedrez en el sentido tradicional. No se enfrentó a libros de ajedrez, tablas de finales de partida ni complicados algoritmos que diseccionan diferencias minúsculas entre peones centrales y peones laterales.
La sede de Google en Londres desde dentro, en cuya octava planta se encuentra la división de DeepMind. | Foto: Maria Emelianova/Chess.com.
Esto sería comparable con dar a un robot acceso a miles de piezas y partes metálicas pero sin darle conocimiento de un motor de combustión; luego él experimenta infinidad de veces con cada combinación posible hasta que construye un Ferrari. Todo ello en menos tiempo del que se tarda en ver la trilogía de El Señor de los Anillos. El programa tuvo cuatro horas para jugar contra sí mismo muchas, muchas veces, de modo que se convirtió en su propio profesor.
De momento, el equipo de programación se ha abstenido de hacer declaraciones. Prefirieron no dar comentarios a Chess.com, alegando que el estudio "se está revisando". Un miembro del equipo de investigación es Demis Hassabis, un maestro candidato de Inglaterra y cofundador de DeepMind (comprada por Google en 2014). Hassabis, que jugó en el evento ProBiz del London Chess Classic, está ahora en la conferencia de Sostemas de Procesamiento de Información Neuronal en California, donde es coautor de otro estudio sobre un tema distinto.
Demis Hassabis juega con Michael Adams en el evento ProBiz en la sede de Google en Londres hace pocos días. | Foto: Maria Emelianova/Chess.com.
Una persona que sí habló con Chess.com tiene mucha experiencia de primera mano jugando contra ordenadores. Al GM Garry Kaspárov no le sorprende que DeepMind pasara del Go al ajedrez.
"Es un logro reseñable, claro que era de esperar después de AlphaGo", dijo a Chess.com. "Da al ajedrez automático el enfoque de "Tipo B", más humano, con el que soñaron Claude Shannon y Alan Turing en lugar de la fuerza bruta."
Una de las 10 partidas seleccionadas que se aportan en el estudio.
Efectivamente, de forma similar a los humanos, AlphaZero busca menos posiciones que sus antecesores. El estudio declara que "solo" mira 80.000 posiciones por segundo, frente a los 70 millones por segundo de Stockfish.
El GM Peter Heine Nielsen, analista del campeón mundial Magnus Carlsen, dijo a Chess.com: "Tras leer el estudio y, especialmente, tras ver las partidas, pensé: Bueno, siempre me he preguntado cómo sería si una raza superior aterrizara en la tierra y nos enseñara cómo juegan ellos al ajedrez, y ahora siento que ya lo sé".
La entrevista de Chess.com con Nielsen sobre AlphaZero.
También hemos descubierto, aunque no nos sorprende, que las blancas también son las favoritas de las máquinas. De las 28 victorias de AlphaZero, 25 las logró con las blancas.
La máquina también aumentó la frecuencia de aperturas que prefería. Lo siento, amantes de la India de Rey, porque vuestra niña no es la elegida. La Francesa también fue perdiendo el entusiasmo del programa con el tiempo, mientras que el Gambito de Dama y sobre todo la Apertura Inglesa tuvieron mucha representación.
Frecuencia en la que AlphaZero usó las aperturas a lo largo de su fase de aprendizaje. Imagen sacada del estudio.
¿Qué haces cuando eres una cosa que nunca se cansa y acabas de dominar un juego de 1400 años? Conquistas otro. Tras el match con Stockfish, AlphaZero "se entrenó" escasas dos horas y venció al mejor programa de ordenador de Shogi, "Elmo".
Las ramificaciones de una forma de aprendizaje tan inventiva, por supuesto, no se limitan a los juegos.
"Siempre hemos dado por sentado que el ajedrez requería demasiado conocimiento empírico como para que una máquina juegue tan bien desde cero, sin añadir ningún conocimiento humano" dijo Kaspárov. "Por supuesto me encantará ver lo que podemos aprender sobre el ajedrez de AlphaZero, pues esa es la gran promesa del aprendizaje automático en general: que las máquinas descifran reglas que los humanos no podemos detectar. Pero obviamente las implicaciones van mucho más allá del ajedrez y otros juegos. La habilidad de una máquina de replicar y superar siglos de conocimiento humano en sistemas cerrados complejos es una herramienta que puede cambiar el mundo".
Garry Kaspárov y Demis Hassabis juntos en el evento ProBiz en Londres. | Foto: Maria Emelianova/Chess.com.
Chess.com entrevistó a ocho de los 10 jugadores que participan en el London Chess Classic y les pidió sus impresiones con respecto del match. Pronto publicaremos una recopilación de vídeos con sus impresiones.
El ajedrecista que más objetaba a las condiciones del match era el GM Hikaru Nakamura. Mientras que en internet se está viviendo un intenso debate sobre el poder de procesamiento de ambas partes, Nakamura pensaba que ese es un tema secundario.
El estadounidense tachó el match de "deshonesto" y señaló que la metodología de Stockfish requiere que tenga un libro de aperturas para un rendimiento óptimo. Aunque no piensa que el ganador habría cambiado, Nakamura sí opina que el margen de la victoria habría sido inferior.
"Estoy bastante seguro de que ni siquiera Dios podría vencer a Stockfish el 75% de las veces con las blancas sin ciertas ventajas", dijo sobre las 25 victorias y 25 tablas de AlphaZero con las blancas.
El GM Larry Kaufman, consultor jefe de ajedrez del programa Komodo, espera ver el rendimiento del nuevo programa en máquinas caseras, sin los beneficios de los ordenadores de Google. También repitió las objeciones de Nakamura con respecto de la falta de conocimiento de apertura estándar de Stockfish.
"Por supuesto, resulta increíble" dijo. "Aunque después de oír sobre los logros de AlphaGo me esperaba algo parecido, especialmente dado que el equipo cuenta con un maestro de ajedrez, Demis Hassabis. Lo que aún no está claro es si AlphaZero podría jugar al ajedrez en PC normales y qué fuerza tendría ahí. Puede que el dominio actual de módulos de ajedrez minimax se acerque a su fin, pero aún es pronto para afirmarlo. Debemos señalar también que AlphaZero había construido su propio libro de aperturas, así que habría sido más justo el enfrentamiento contra un módulo con acceso a un buen libro de aperturas".
Sean cuales sean los méritos de las condiciones del match, Nielsen está ansioso por ver qué otras disciplinas refinará o dominará este tipo de aprendizaje.
"Esto es inteligencia artificial de verdad" dijo. "Pasa de tener algo que es relevante para el ajedrez a algo que va a ganar Premios Nobel o incluso más importante. Creo que para nosotros es una suerte que decidieran dedicarle cuatro horas al ajedrez porque podemos obtener un montón de conocimiento. Sentimos que es un gran día para el ajedrez pero, desde luego, va mucho más allá".