Un algoritmo que ha aprendido a resolver el Cubo de Rubik «sin asistencia humana»

Por @Alvy — 19 de junio de 2018

Este trabajo reciente resulta bastante interesante; es un pasito más en el campo de los algoritmos de inteligencia artificial que aprenden por sí mismos sin supervisión humana. En este caso el dominio es bastante limitado (un Cubo de Rubik) pero al aprendizaje reforzado que se ha empleado ha obtenido estupendos resultados sin supervisión alguna – más allá de la definición de las reglas y el objetivo. En arXiv: Solving the Rubik’s Cube Without Human Knowledge.

El método empleado por DeepCube –que es como se llama el algoritmo– se asemeja un poco a los que recientemente se han usado en juegos como el ajedrez y el go. Se definen las reglas –los movimientos del cubo– y el «objetivo» –el cubo resuelto– aunque curiosamente dicen que el algoritmo funciona «al revés»: imagina el cubo resuelto y busca cómo llegar al cubo desordenado inicial, para luego invertir los movimientos.

El método empleado se llama iteración autodidáctica e incluye búsquedas en profundidad, una función de evaluación y recompensas que dependen del estado del cubo en cada momento – básicamente si se está más cerca de la solución o no. De esta forma repitiendo una y otra vez diferentes movimientos el algoritmo aprende con qué giros se acerca más a la solución o cuáles no debe hacer porque le alejan. Repítase millones de veces.

El resultado es que DeepCube puede resolver el cubo en un promedio de unos 30 movimientos. Matemáticamente sabemos que 20 movimientos es el número máximo de giros necesarios para resolver el cubo desde cualquier posición –y por tanto el mejor algoritmo lo podría siempre hacer en 20 o menos– y en competición los speedcubers humanos suelen necesitar entre 50 y 60 movimientos (Fridrich) o alrededor de 25-30 en las competiciones de «soluciones óptimas» (donde se valora el menor número de movimientos y no el tiempo). Así que 30 movimientos es una marca que no está nada mal.

Relacionado:

La mujer capaz de resolver un cubo mientras da el parte meteorológico
Nuevo Récord Guinness: 3 cubos de Rubik + malabarismos
Feliks Zemdegs bate nuevamente el récord del cubo: 4,22 segundos
Una máquina de récord que resuelve el cubo de Rubik en 0,38 segundos
Cubestormer 3: resuelve el cubo de Rubik en poco más de 3 segundos
El Multicuber 999: un robot de Lego que resuelve el cubo 9x9x9
Récord de Europa del cubo de Rubik 3x3x3 «a ciegas» para Berta García
Esto es lo que ve un experto «speedcuber» mientras resuelve el cubo
El método Fridrich para resolver el cubo de Rubik
La segunda juventud del cubo de Rubik, artículo 30º aniversario
Resolviendo Rubiks colosales de hasta 20×20×20
Resolver el Cubo de Rubik: mi explicación en un PDF con ilustraciones y todo tipo de detalles. Es uno de los más tradicionales (e ineficientes), pero fácil de aprender. Permite resolverlo en menos de 60 segundos