On Intelligence

Por @Alvy — 16 de enero de 2005

On Intelligence. Jeff Hawkins con Sandra Blakeslee. Times Books. Octubre 2004. Inglés. 272 páginas. Web oficial: OnIntelligence.org.

Hace un mes que comenté por aquí la existencia de este libro (ver Jeff Hawkins sobre el cerebro humano y el interesante hilo de comentarios original) y prometí una reseña completa en cuanto pudiera leerlo porque era de lo más prometedor.

Efectivamente, On Intelligence no defraudada en lo más mínimo. Es provocador, profundo y sin duda se podría decir que revolucionario (en cierto modo, tanto como A New Kind of Science). Habla sobre el cerebro, la mente, el funcionamiento de los sentidos, la memoria y el aprendizaje y, sobre todo, de la inteligencia artificial: por qué fracasó, pero también cómo funcionará realmente en el futuro — que no es como la mayoría de los expertos piensan.

Jeff Hawkins, ayudado por la periodista Sandra Blakeslee, comienza explicando con total humildad que tal vez él puede proponer esta teoría sobre el funcionamiento de la inteligencia precisamente por estar fuera de los circuitos científicos habituales. él es más conocido por haber fundado Palm Computing y haber inventado la Palm y el sistema de escritura Graffiti para las PDA. Resulta que él es un ingeniero (no un biólogo ni un neurocirujano), acostumbrado a traajar en productos que fallan, así que puede permitirse aprender de los errores — mientras que un científico probablemente vería frustrada su carrera para toda la vida si tras cinco o diez años investigando publicara se atreviera a publicar algo como este libro y resultara ser un fiasco.

El córtex cerebral

La teoría de Hawkins comienza explicando que en el córtex cerebral es donde residen realmente la memoria y por tanto la inteligencia — otras partes del cerebro se encargan de los instintos básicos, mas primitivos y automáticos. El córtex es básicamente igual en todas partes, y aunque se sabe que diversas zonas tienen relación con ciertos sentidos y atributos (ej. la visión, el tacto, el lenguaje, etc.) en realidad todas sus partes, capas celulares, densidad, etc. son básicamente iguales. Según Hawkins, todas las capas del córtex pueden realizar las mismas funciones. Lo cual explicaría por qué funciones en zonas que son dañadas por accidentes o enfermedad (ej. el lenguaje), se puedan volver a desarrollar en otra zona distinta. El hecho de que ciertas zonas del córtex esten relacionadas con ciertos sentidos o funciones se debe únicamente a dónde están conectadas (ej. al nervio óptico o auditivo). Pero esa situación es circunstancial, no «obligatoria». De hecho, ya se ha demostrado que se puede «ver» a traves de un sensor en la lengua, por ejemplo.

El número y disposición de las conexiones al córtex, así como la diferencia de tamaño relativo (cuerpo/cerebro), y el tipo y número de neuronas en el córtex humano y el de los animales es lo que nos hace básicamente diferentes: los humanos somos inteligentes porque somos en cierto modo más «conscientes» del mundo que nos rodea y porque tenemos mayor capacidad de predicción y «simulación mental».

El mundo de los sentidos

Conocemos el mundo a través de los sentidos. Incluso hay muchos más sentidos que los cinco habituales que suelen enseñar en el colegio. El equilibro, por ejemplo, podría considerarse un sentido. En cierto modo, todos estos sentidos «digitalizan» información del exterior y la transmiten al córtex a través del sistema nervioso. Hawkins propone que esa información entrante se procesa siempre mediante los mismos algoritmos, se guarda de la misma forma y se accede a ella de idéntica manera. Da igual si es la foto de un dálmata o el olor de una magdalena. Este proceso (algoritmo) es tan simple pero tan versátil que puede explicarlo todo sobre el funcionamiento de la mente. Incluso aunque el cerebro lo utilice para acciones tan distintas como ver, oler u ordenar mover una mano (que no es una sensación sino una acción).

La memoria

El algoritmo que utiliza la mente es un proceso que almacena patrones y hace predicciones sobre los patrones que encuentra o espera encontrar. La exposición a los diversos estímulos (inputs) se guarda en el córtex. Pero el córtex es muy diferente a lo que habitualmente conocemos como «la memoria» de un ordenador. Las diferencias fundamentales de cómo funciona la memoria en el cerebro respecto a otros tipos de memorias (como un archivo o un ordenador) son estas:

La memoria almacena secuencias de patrones en vez de los datos en sí. Esto es como almacenar las diferencias de una nota a otra en una canción en vez de almacenar las notas en sí. Esto permite reconocer canciones aunque estén en otra «escala» o palabras escritas aunque estén «en otro tipo de letra». Las secuencia, ademas, están almacenadas siempre en un orden determinado. Todo el mundo recuerda el alfabeto, pero es difícil recitarlo al revés. Lo mismo sucede con tu número de teléfono: tienes almacenada la secuencia pero no sabrías decirlo al revés sin pensarlo cuatro o cinco veces. Es como si en realidad no tuvieras memorizado el número en sí. Además, para recordar cosas, debemos hacerlo siempre en cierto orden («pensando en ello»: «ayer fui al parque y en el parque había un lago y en el lago peces...», no somos capaces de recordar todo de una sola vez «instantáneamente»).

La memoria es accesible de forma auto-asociativa. Todos los recuerdos están asociados unos con otros de algún modo: ver una parte de una cara está asociado con que esa cara corresponde a una cabeza completa. Las cabezas están encima de cuerpos, los cuerpos corresponden a personas, etc. Oímos una frase y la entendemos, aunque en realidad no hayamos escuchado todas las palabras exactamente (pero las completamos). Aunque fltn algns ltrs pdmos ntndr frss cm sta sn myr prblm. Eso eso porque lo que almacenamos son los patrones y sencuencias, y asociamos patrones incompletos con patrones que conocemos (y predecimos), a pesar de que a veces haya pequeños errores. Las imágenes imposibles nos llaman la atención y resultan divertidas precisamente por esto.

La memoria almacena los patrones enformato invariante. Una vez que has aprendido a leer, puedes reconocer las palabras y leerlas en cualquier ángulo, perspectiva, condición luminosa o aunque cambie el tipo de letra. Puedes reconocer una cara como perteneciente a la misma persona de día, noche, vista de perfil, etc. Imagine de John Lennon existe en miles de versiones, y podrías reconocerlas todas como tal oyendo unas pocas notas, aunque no las hayas escuchado completas nunca antes. Esta forma de almacenamiento es radicalmente distinta de forma en que se almacenan datos en los ordenadores. Además, funciona también «al revés»: puedes haber aprendido una poesía de memoria simplemente leyéndola, pero puedes reproducirla escribiéndola a mano, a máquina o recitándola de viva voz (incluso en otro idioma).

Los patrones se almacenan en una jerarquía. El concepto de jerarquía tiene que ver con las diversas capas del córtex, y básicamente consiste en una estructura que podría denominarse fractal, bellamente simétrica porque además cuenta con retroalimentación, en el que las regiones de menor nivel transmiten los patrones y los «nombres» que asignan a los patrones a las zonas de nivel superior. Pero todas son iguales y equivalentes en realidad. Esta jerarquía se corresponde, curiosamente, con el hecho de que también el Mundo en sí sea jerárquico. Las notas musicales forman melodías, las melodías secuencias, las secuencias canciones, las canciones álbumes, etc. Las hojas estan en las ramas, las ramas en los árboles, los árboles en el bosque. Las letras forman palabras que forman frases que forman párrafos, capítulos, libros y los libros están en estanterías, dentro de bibliotecas. Entendemos y almacenamos la información así la realidad del mundo es así, por tanto es la forma más práctica de hacerlo. Las diversas capas del córtex transmiten esa información según esos conceptos de «nombres» asignados a los patrones. La información más básica va primero, luego más elaborada, etc. asignándole «nombres» como «mmm... veo algo», «tiene forma de cara», «es una persona», «es Juan, mi hermano».

Acciones y comportamiento

Adicionalmente, todo esto funciona también al revés. La estructura del córtex está llena de señales que viajan en dirección opuesta a la de la percepción, hacia los centros motores. Está todo lleno de retroalimentación (feedback). Cuando queremos hacer algo como «voy a coger el vaso», realizamos la acción mediante una predicción, es decir «visualizamos» qué va a suceder («mi mano derecha agarrará el vaso así») y el hecho de recuperar ese patrón de la memoria automáticamente envía esas señales («patrones») a los lugares adecuados para que se cumpla esa predicción («mano, muévete y coge el vaso»). Al hacerlo, vemos el resultado, que queda reforzado en la memoria por el hecho de que ese patrón ha funcionado realmente. Todo esto puede sonar extraño, pero explica todas las habilidades aparentemente tan complicadas que demostramos los seres inteligentes. Explica cómo una persona (o un perro) pueden predecir la trayectoria de una pelota para cogerla, sin calcular ecuaciones físicas. También explica por qué muchos deportistas y personas mejoran su rendimiento «visualizando» que hacen algo, antes de hacerlo realmente, como por ejemplo descender una pista nevada o dar una conferencia.

El nuevo modelo de la inteligencia

En el capítulo dedicado al nuevo modelo de la Inteligencia [supongo que esa es la traducción habitual de framework] es donde Hawkins combina todas las ideas sobre cómo funciona el cerebro y la memoria para explicar qué es en realidad la inteligencia y cómo y por qué funciona como funciona. Previamente, también explica por qué cree que el Test de Turing no sirve para demostrar genuinamente que algo es inteligente. Tú puedes ser inteligente simplemente estando sentado en una habitación oscura sin hacer nada. Comportarse inteligentemente no quiere decir que realmente lo seas, como demuestra el experimento de la sala china. Deep Blue no es inteligente, simplemente calcula rápido jugadas de ajedrez.

Hawkins propone que la capacidad de predicción de patrones es la clave de la inteligencia. Durante nuestra existencia, aprendemos y memorizamos patrones. El córtex tiene algoritmos para almacenarlos y reconocerlos. Somos inteligentes porque somos capaces de predecir qué sigue a un patrón determinado en base a la experiencia. Y cuando fallamos, eso nos sorprende. Entonces podemos añadirlo a la lista y seguir aprendiendo. Tal vez más revolucionario es que ese modelo y la existencia de la retroalimentación de patrones en el córtex explique también por qué cuando pensamos «hacer algo» en realidad podemos hacerlo.

Aunque Hawkins admite que parte de estas ideas de es probable que ya existieran anteriormente, pero que su teoría las une todas en un conjunto comprensible, consistente, y mucho más simplificado, que cubre desde cómo funcionan los sentidos (y el hecho relevante de que todos funcionan igual) a cómo esto está relacionado con la memoria y la inteligencia, nuestra capacidad de aprender y llevar a cabo acciones — todo ello mediante un único algoritmo extremadamente simple.

Datos sobre el cerebro

Una buena parte del libro está dedicada a explicar cómo funciona físicamente el córtex. Es tal vez la más técnica y complicada, aunque no hace falta ser neurocirujano para entenderlo, dado que los autores han tenido la habilidad de simplificar y poner ejemplos suficientemente claros. A los autores, de todos modos, les puede achacar la falta de ejemplos visuales y de datos concretos que seguramente son importantes para entender mejor lo que cuentan. El libro sólo tiene unas diez o quince figuras y diagramas ilustrativos, y datos como el número de neuronas en el córtex, la velocidad de transmisión de las señales se mencionan sólo de pasada — aunque algunas veces es porque ni siquiera los neurocientíficos tienen claro todo eso.

Se calcula, por ejemplo, que en el córtex puede haber unos 32 billones de sinapsis en las neuronas, que podrían equivaler a unos 8 billones de bits informáticos. Eso son 8 terabytes, que a día de hoy puedes comprar en forma de discos duros por unos 10.000 euros y guardar en un cajón. Pero no tendrías la misma memoria que en tu cerebro. La diferencia es que en el cerebro la «memoria» está en realidad altamente interconectada, de modo que para replicarla el principal problema no es tanto de capacidad como de conectividad — aunque esto puede resolverse tanto en la teoría como en la práctica, del mismo modo que una misma línea telefónica puede contener señales para cientos de conversaciones.

Otro dato curioso del libro: se sabe que en un segundo una señal puede transmitirse digamos linealmente a través de unas 200 neuronas si estuvieran puestas en línea (en otras palabras: una neurona unos tarda 5 milisegundos en recibir, procesar y transmitir una señal). Esa es la «velocidad del pensamiento». No es nada espectacular, la verdad. Pero sí es sorprendente que si en un experimento nos enseñan una serie de fotos podamos reconocer en 0,5 segundos si hay en ellas un gato o no y pulsar rápidamente un botón — algo que ningún ordenador puede hacer hoy en día. Eso significa que la «solución» a ese problema visual (o a casi cualquier otro problema) existe realmente a menos de 100 neuronas de distancia en nuestro cerebro. Eso, según Hawkins es indicativo de que el cerebro no calcula la solución siguiendo una serie de «pasos», sino que simplemente recupera la solución, que ya existe, desde la memoria.

Cuando oí hablar de este libro una de mis dudas era si sería demasiado teórico y poco práctico o realista. Sin ser ningún experto, creo que no está demasiado alejado de la realidad. Las explicaciones sobre el funcionamiento real de las neuronas en el córtex están dentro de lo aceptado por la comunidad científica, y su modelo (teórico) sobre los patrones tiene la elegancia de la simplicidad, que tantas veces esta detrás de muchos aciertos. También tiene ese punto curioso de desvelar que «el emperador está desnudo» que tanto fastidia a muchos científicos (lo poco que en realidad se conoce sobre el tema XYZ, el hecho de que en realidad se estaban haciendo las preguntas equivocadas, etc.) así que es de esperar un buen número de críticas y refutaciones, que por supuesto habrá que leer con avidez.

Preguntas, respuestas y vacíos

En uno de los últimos capítulos Hawkins responde a las preguntas a las que habitualmente contesta cada vez que da conferencias: ¿Qué es la imaginación? ¿Son inteligentes los animales? ¿Qué es la creatividad? ¿Se puede ser más creativo? ¿Qué es la consciencia? Todas ellas tienen una respuesta clara, incluso diría que de sentido común, dentro de su modelo de la inteligencia.

La que más me llamó la atención es la descripción de por qué la inteligencia humana es fundamentalmente diferente de la de los animales. Según Hawkins se trata básicamente de diferencias físicas a las que hemos llegado tras siglos de evolución natural en cuanto al modelo de memoria y capacidad de predicción de patrones. Nuestro córtex es más grande y por tanto mejor que el de otros animales.

Los organismos más simples tenían una capacidad de predicción básica, del tipo «debo nadar hacia donde haya comida» pero eran incapaces de transmitirla. Sólo existía cierta capacidad de transmitir una especie de «memoria» generacional a través del ADN, durante la reproducción (y vinculada a la selección natural). De repente, se desarrolló una memoria predictiva que llegó a tener utilidad durante la vida del organismo (ya más larga), que es la que actualmente tienen los animales («no debo acercarme al fuego», «si veo un león, debo correr, porque ya ví cómo se comían a mis congéneres»). Los delfines probablemente tienen un modelo o conocimiento muy amplio del mundo que les rodea, memoria de todos los sitios que han visitado alguna vez e incluso pueden comunicar conceptos básicos a otros delfines y entender a las personas con el entrenamiento adecuado.

Pero solo el ser humano alcanzó la capacidad más diferenciadora de todas: desarrollar profundamente el lenguaje. El lenguaje nos permite intercambiar de forma práctica y rápida nuestras memorias (recuerdos y patrones) con otros seres de nuestra especie. Y no sólo durante nuestra vida, sino a través de generaciones. Y actualmente, no sólo con nuestros vecinos, sino con cualquier otro ser humano del planeta. Aunque otros mamíferos, animales e incluso plantas tienen sus particulares versiones del lenguaje, no son tan sofisticados y eso nos diferencia profundamente de ellos.

Algunas otras preguntas o temas se quedan por desgracia sin respuesta. Temas por ejemplo como qué son los sueños, por qué soñamos o por qué es necesario soñar, no se tratan a lo largo del libro. ¿Qué es realmente un déjà-vu? No hay comentarios. El libro sí explica en cambio cómo encajan en su teoría algunas enfermedades relacionadas con el cerebro (como la sinestesia o incluso la curiosa anterograde amnesia que sufre el protagonista de Memento), pero no cómo encajan otras como la amnesia normal, el Parkinson, los distintos tipos de retraso mental u otras deficiencias y enfermedades. Habla en cambio de por qué las alucionaciones son tan reales o por qué es tan fácil engañar al cerebro: sencillamente porque los humanos estamos diseñados para encontrar patrones, y tendemos a verlos incluso donde no los hay. Hawkins tampco entra a hablar, en cambio (todo un acierto) de las cuestiones filosóficas sobre la inteligencia, la personalidad, la consciencia y demás. Tal vez porque ese tipo de debates es para otro tipo de libros, y el suyo tiene un carácter más práctico.

Inteligencia y ordenadores

Jeff Hawkins es ingeniero. El supergeek. Inventó la Palm, incluyendo el sistema de reconocimiento de escritura Graffiti^*, y posteriormente la Handspring (finalmente, todo eso se fusionó de nuevo cuando Palm compró Handspring). En el libro, afirma que creó Palm para poder ganar dinero en una industria que también le interesaba, pero para poder dedicarse realmente a investigar el cerebro. Con el dinero que ganó fundó el Redwood Neuroscience Institute que es donde realiza su trabajo científico.

(*) Curiosamente, Graffiti no es en sí un sistema inteligente que «aprenda» la escritura humana, al contrario de lo que mucha gente piensa. Hawkins explica exactamente cómo lo inventó: «En 1994 mis colegas y yo estábamos intentando adivinar cuál sería un buen sistema para introducir datos en los ordenadores de mano. Todo el mundo estaba concentrado en los sistemas de reconocimiento de texto inteligentes. Sin embargo, esos sistemas resultaron ser muy difíciles de realizar y nunca funcionaban bien (...) Un día, decidí dar un paso atrás y ver el problema desde otra perspectiva. Me dijo a mí mismo: «¿Cómo introducimos ahora texto en los ordenadores? Tecleamos en un teclado. ¿Cómo aprendemos a teclear? Bueno, no es fácil. Es un invento reciente y requiere su tiempo aprender (...) Sin embargo, millones de personas lo hacen. ¿Por qué? Sencillamente, porque funciona. De modo que continué mi analogía: Tal vez yo pueda inventar un sistema para introducir texto que no sea intuitivo, que requiera que la gente lo tenga que aprender, pero que lo utilicen sencillamente porque funcione. Literalmente, así es el proceso que seguí para inventarlo.»

Lógicamente, Hawkins no podía dejar pasar la oportunidad de explicar en su libro todas las diferencias entre el cerebro humano y los ordenadores, así como su visión sobre la inteligencia artificial, cómo cambia esa visión bajo la luz de su teoría y cuál es el posible futuro que nos espera.

Nada más empezar el libro dedica un capítulo a explicar el porqué del fracaso de la IA durante las últimas décadas del siglo XX. Ninguno de los sistemas era genuinamente inteligente. Algunos se comportaban «como si pensaran» pero en entornos terriblemente limitados (Eliza, Deep Blue). Todo el mundo creía que las capacidades de memoria y cálculo eran la verdadera limitación y que los ingenieros del hardware vendrían a salvar a la AI. Redes neurnales, redes bayesianas, sistemas expertos... nada. Todo esto demostró ser claramente un error.

Hawkins se atreve a predecir que no habrá en el futuro sistema de inteligencia artificial como Robbie el Robot, C-3PO o el malévolo HAL, que se comporten como humanos, sencillamente porque para eso deberían ser humanos: tener las mismas capacidades sensoriales que un humano, el mismo tipo de memoria y con la misma capacidad, exactamente el mismo algoritmos pero además... vivir exactamente la vida de un humano desde su nacimiento. Y además, aunque parezca que se haya desentrañado cómo funciona el cerebro, todavía desconocemos todavía muchos de los detalles (por ejemplo, los 30 millones de sinapsis de un cerebro típico podrían ser en realidad 300 ó 3.000) y algunos efectos como la conectividad exacta entre dichas sinapsis permanecen inexplorados.

En cambio, Hawkins sí predice que si su teoría es correcta se podrán crear sistemas inteligentes que tal vez no hablen como C-3PO, pero si que resulten prácticos y últiles, realmente revolucionarios. Basándose en su teoría de reconocimiento de patrones desarrolla ideas sobre de sistemas de reconocimiento de voz, coches verdaderamente inteligentes, sistemas de predicción del clima y de otras aplicaciones industriales.

Su ejempo de coche inteligente es realmente interesante. Si dentro de 10 ó 20 años (el plazo que él estima) se desarrolla un sistema predictivo con las capacidades que propone, los fabricantes crearían un coche con todo tipo de sensores visuales y de radar (e incluso otros: un sensor acústico podría predecir cierto tipo de situaciones). Dicho coche partiría de un conocimiento «cero». No habría que pre-programarle nada, pero sí que debería pasar meses o años aprendiendo del mundo real — como un bebé: circulando conducido por una persona. Con el tiempo, crearía un modelo de patrones predictivos en su interior y se formaría un modelo del mundo real — el primero paso para demostrar inteligencia. En un momento dado, el coche ya sería capaz de poder predecir situaciones y, con los mecanismos adecuados, de tomar el control del vehículo y circular como lo hace una persona. Haría cosas realizando acciones que cumplieran sus predicciones. Con el suficiente aprendizaje, ese coche sería incluso capaz de frenar si ve una pelota rebotando que cruza la carretera, porque sabría que probablemente saldrá un niño corriendo detrás de ella y no debe atropellarle. La diferencia entre la inteligencia de ese coche y la de una persona sería que se podrían tomar los patrones de la memoria del coche y «clonarlos» en toda una línea de coches idénticos, al instante. El fabricante podría decidir además que el coche siga aprendiendo (o no) tras vendérselo al propietario. El coche sería inteligente, sería útil y no tendría nada que ver con los coches actuales.

Esa tecnología tal vez no debería llamarse entonces «Inteligencia Artificial» porque en la práctica sería «Inteligencia Real».

Toda una revolución que, si Hawkins está en lo correcto en el fondo y en los plazos, tendremos la increíble suerte de ver y disfrutar a lo largo de nuestras vidas.