¿Sabías que un programa de inteligencia artificial le ganó al campeón mundial de Go?

¿Sabías que un programa de inteligencia artificial le ganó al campeón mundial de Go?
29 mayo, 2018 Ignacio Uman

En marzo de 2016 el programa de inteligencia artificial AlphaGo, desarrollado por Google Deepmind, ganó en su última y definitiva partida al campeón coreano del juego de mesa Go, Lee Sedol. La máquina completó su cuarta victoria frente a una única del humano, en lo que ha sido planteado como el gran reto de la inteligencia artificial, debido a la dificultad de ese juego, muy popular en Asia.

Pero en enero de 2017 fue mucho más lejos: después de haberle ganado al campeón chino Ke Jie, obtuvo la victoria en más de 50 partidas anónimas frente a los mejores jugadores del mundo, identificado en el juego con el usuario “Master”.

20 años después de la emblemática victoria en ajedrez donde Deep Blue (programa de IBM) venció por primera vez a Gary Kaspárov, los expertos en inteligencia artificial se lanzaron a un nuevo reto. Sin embargo, ganar al Go es mucho más difícil que al ajedrez, ya que las variables son prácticamente infinitas, lo que demanda capacidades humanas más allá del simple análisis de una jugada y las siguientes. En el Go las fichas no están en el tablero, sino que se van colocando con plena libertad por toda su superficie con el objetivo que abarcar un territorio mayor que el del rival y, a la vez, capturar sus fichas.

Para las máquinas el Go es un juego mucho más complejo por tener un tablero de 19 x 19 (vs. 8 x 8 en el ajedrez). La mayoría de las movidas en ese tablero son lícitas (aunque no necesariamente buenas), a diferencia del ajedrez donde las movidas a analizar están limitadas por las reglas particulares de cada pieza. En este sentido, la potencia de una supercomputadora, tratando de analizar de forma exhaustiva todas las posibilidades, sería inviable.

No obstante, AlphaGo ha desarrollado algo que podría denominarse «intuición», gracias al trabajo de IA en varios niveles. El algoritmo se basa en una combinación de redes neuronales (aprendizaje profundo centrado en visualizar posibilidades en cascada) junto a una búsqueda selectiva. La herramienta desarrollada por Google es capaz de evaluar a la vez el movimiento próximo y la posición general del tablero: el paso siguiente y también la importancia estratégica de una situación.

Deep Blue fue creado para el ajedrez; AlphaGo es un programa que aprende de los datos y se retroalimenta jugando contra sí mismo para perfeccionarse: le enseñaron a observar los movimientos de jugadores reales hasta que tuvo suficiente información como para ser capaz de adivinar qué iban a hacer con su siguiente ficha. Luego, esas redes neuronales se basaron en el llamado aprendizaje por refuerzos, practicando solas para consolidar la toma de decisiones inteligentes centrándose en elegir entre las posibilidades ganadoras y obviando las demás.

A fines de 2017 surgió una versión posterior a AlphaGo, llamada AlphaGoZero, con varias optimizaciones sobre la versión original y que adquiere su maestría en el Go únicamente aprendiendo a jugar contra sí misma. A diferencia del aprendizaje del juego en base a partidas de expertos, AlphaGoZero empezó a jugar partiendo de una «tabula rasa» y sin ningún conocimiento de partidas humanas previas. Con movimientos de fichas al azar fue entrenándose y aprendiendo en cada partida en base a los errores y aciertos cometidos.

En este aspecto, la revista científica Nature ha explicado que el reto de la inteligencia artificial era desarrollar algoritmos que aprendan conceptos difíciles con una competencia humana. Ahora AlphaGoZero lo ha logrado.

Acerca del GO
Surgido en China hace más de 2.500 años bajo la influencia de los principios espirituales taoístas, el juego del Go enfrenta sobre un tablero a dos oponentes que deben colocar alternativamente piedras negras y blancas en las intersecciones libres de una cuadrícula de 19 por 19. Las piedras aisladas se eliminan de la partida y el objetivo principal es dominar la mayor superficie del tablero, por lo que los jugadores deben elegir entre ubicar las fichas juntas y protegerlas entre sí para evitar que sean capturadas, o separarlas para ganar terreno en la cuadrícula.

Para saber más sobre la Inteligencia Artificial

Actualmente el Departamento de Computación y el Instituto de Ciencias de la Computación (ICC UBA/CONICET) cuentan con un Laboratorio de Inteligencia Artificial Aplicada. Es un laboratorio interdisciplinario, que combina proyectos de la Lingüística Computacional, Neurociencia Computacional (como la percepción del azar), Procesamiento de Lenguaje Natural, Sistemas de Diálogo, Reconocimiento del Habla y Análisis en Tiempo Real de Señales del Cerebro.

Desde este Laboratorio, los investigadores de DC/ICC vienen participando en diferentes proyectos de neurociencia integrativa basados en el estudio de la toma de decisiones y cómo actúa nuestro cerebro cuando jugamos al ajedrez (uno de estos proyectos se desarrolló con el Laboratorio de Neurociencia Integrativa originado por el Departamento de Física de la UBA).

Recientemente el grupo liderado por Diego Fernández Slezak, profesor del DC e investigador del ICC, publicó los resultados de un estudio donde se desarrolló un modelo que describe cómo reaccionamos -fuera del laboratorio- ante múltiples alternativas (que fue probado con éxito en el juego de ajedrez y en un popular sitio de ventas online).

La noticia completa está disponible acá: http://nexciencia.exactas.uba.ar/cuando-no-es-blanco-o-negro

0 Comentarios

Dejar una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*