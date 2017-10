Por @Alvy — 24 de Octubre de 2017

El profesor Villatoro ha publicado en La Ciencia de la Mula Francis un excelente artículo explicando Las diferencias entre AlphaGo Fan, AlphaGo Lee, AlphaGo Master y AlphaGo Zero.

Todas ellas son versiones diferentes de la inteligencia artificial para jugar al Go salidas de los laboratorios de Google DeepMind. Si ya se consideró un proeza vencer al campeón humano, que un nuevo programa (AlphaGo Zero) venza 100-0 a la versión anterior llega mucho más allá. Tal y como explica Villatoro lo que se ha demostrado con esta nueva versión que ha aprendido «jugando contra sí misma» millones de veces es que en el caso del Go «el aprendizaje supervisado de las versiones anteriores de AlphaGo, cómo juegan los humanos, era irrelevante».

La diferencia entre ambas versiones es de «un orden de magnitud en la potencia de cálculo» (4 TPUs vs. 48 TPUs), pero aunque su eficiencia al jugar al Go sea espectacular no cambia mucho el panorama de la IA:

¿Estamos hoy más cerca de una inteligencia artificial intuitiva y/o consciente? No, faltaría más. Problemas triviales para un humano (más difíciles de formalizar que jugar al Go) son imposibles para las máquinas (todavía) […] Google DeepMind ha vuelto a demostrar que el aprendizaje no supervisado en un entorno controlado por reglas muy sencillas (como el juego del Go) puede superar las habilidades humanas en dicho entorno […] Sin embargo, la mayoría de los entornos en los que viven los humanos carecen de reglas que los describan y cuando las hay son de extrema complejidad. En dichos casos es imposible concebir que una inteligencia artificial con aprendizaje no supervisado pueda aproximarse a las habilidades de los humanos (inconcebible al menos durante las próximas décadas).

Supongo que para los jugadores de Go debe haber sido un día triste, algo así como si de repente se desarrollara un software para jugar al ajedrez que ignorara los siglos de estudios y aprendizaje que hemos acumulado los humanos pero pudiera batir a cualquiera sin pestañear, simplemente habiendo aprendido a jugar enfrentándose a sí mismo millones de veces. «Soy mejor que vosotros y no me habéis enseñado nada», bien podría decir esa bestia desde la crueldad.

De todos modos, como apunta Villatoro, en muchas otras tareas del MundoReal™ «el aprendizaje supervisado es irreemplazable», así que podría decirse aquello de que de momento para los humanos todavía hay esperanza.