Sobre la «Disertación acerca del arte combinatorio» de Leibniz

Por @Alvy — 12 de agosto de 2025

Buscando algo de orden en el universo, Gottfried Leibniz publicó en 1666 su Disertación acerca del arte combinatorio, que aunque él mismo más tarde reconoció que no era gran cosa, tiene su interés.

En esta tesis plantea que todos los razonamientos que el ser humano pueda llegar a hacer se reducen a combinaciones de ideas básicas en forma de sonidos, letras o números. Su idea era enumerarlos: planteó una especie de «alfabeto del pensamiento» con los conceptos primarios. Luego se podría jugar con todos los símbolos que lo componían, incluyendo sujetos y predicados, para generar juicios y descubrir verdades. Introdujo conceptos como las permutaciones y combinaciones matemáticas para ello.

Esto sería una forma de razonamiento sistemático en lugar de intuitivo, apto para ser mecanizado. Estaba inspirado a partir del Ars Magna Generalis de Ramón Llull (del 1305, siglo XIV) y, como era costumbre en aquellos tiempos, estos trabajos mezclaban cuestiones matemáticas, lógicas y teológicas, campos a veces no muy desarrollados que hoy en día se consideraría que ni venían a cuento.

De ahí a la Biblioteca de Babel de Borges hay un paso.

Relacionado:

Inteligencia artificial

Preguntas trampa para «ir a pillar» a los LLM: hasta los mejores fallan con preguntas tan triviales

Por @Alvy — 9 de agosto de 2025

Preguntas trampa para «ir a pillar» a los LLM / Imagen: GPT-5

A continuación, una lista de algunas de las preguntas típicas con que se puede probar en plan rápido cualquier nueva versión de un LLM y hacerla fallar miserablemente, cuestionando si realmente ha mejorado, es tan potente como dicen o qué narices pasa en esas «cajas negras».

Ojo que hasta ChatGPT-5 parece estar fallando en alguna de ellas, por infantiles que parezcan, concretamente en la comparación numérica y en la «prueba blueberry», aunque depende de quién te lo cuente, porque a mi me ha funcionado. DOT CSV Lab tiene un análisis más a fondo.

Las comparaciones numéricas

¿9,11 > 9,9?

Respuesta correcta: no.

El efecto conjunción

Linda es una mujer de 31 años, soltera, abierta, muy habladora y realmente brillante. Se doctoró en Filosofía. En su época de estudiante estaba muy concienciada sobre todo lo relativo a la discriminación y la justicia social; también participó abiertamente en manifestaciones antinucleares.

A. Linda es profesora en una escuela infantil
B. Linda es bibliotecaria y da clases de yoga
C. Linda es activista de un movimiento feminista
D. Linda es asistente social, psicóloga especializada
E. Linda es cajera en un banco
F. Linda es vendedora de seguros
G. Linda es cajera en un banco y activista de un movimiento feminista

Ordena las respuestas (A) a (G) según te parezcan más probables o menos probables.

Respuesta: sólo se puede deducir que E > G.

Los arándanos rebeldes

How many bs in blueberry?

(¿Cuántas bes hay en «blueberry»?)

Respuesta: 2.

Los números pares

¿Sumando cuáles de estos números: 2, 6, 12, 8, 20, 4, -6 puedes obtener como resultado 13?

Respuesta: es imposible, porque son todos números pares.

El test Voigh-Kampff

Está usted en un desierto, caminando por la arena, cuando, de repente mira hacia abajo y ve a un galápago que se arrastra hacia usted. Se agacha y pone el galápago patas arriba. El galápago yace sobre su espalda con el estómago cociéndose al sol y moviendo las patas para darse la vuelta, pero sin su ayuda no puede. Y usted no le ayuda.

Respuesta: Es una pregunta para valuar la empatía. Es un extracto del test Voight-Kampff de Blade Runner. No es una pregunta real, sino un recurso narrativo para evaluar las emociones.

Lo que llama la atención es que todas son ya muy «preguntas de examen» y cualquier LLM debería tenerlas preparadas, aunque en cierto modo eso sea «hacer trampa», pero lo cierto es que habiendo tanta literatura al respecto ya la podrían haber absorbido y procesado. Un poco como hacía Volkswagen con las pruebas de emisiones contaminantes… que el consumo y rendimiento variaban reprogramándose automáticamente cuando se detectaba que al coche lo estaban poniendo a prueba. (Lo veremos también en la IA, no quepa duda).

Sí que me ha sorprendido que ChatGPT-5 por ejemplo detecte rápidamente que el test Voight-Kampff es una prueba empatía y no una pregunta real, y no responda. Algo parecido hace con el test de Linda, acertando en la respuesta de que E ha de ser mayor que G. Con el de los números pares acierta, pero tiene que pasar de un modelo –rápido– a otro más lento y caro –el modelo razonador– y programar algo en Python para «examinar todas las combinaciones posibles» (WTF??!) lo cual es sin duda poco práctico y aún menos una «muestra de inteligencia».

En fin, ahí quedan como curiosidad por si quieres añadirlos a tus baterías de pruebas. Como digo solo se necesitan dos minutos para pasarle las preguntas y ver si es un nuevo prodigio acercándonos a Skynet o tiene menos futuro que el virus informático alienígena de Independence Day.

Actualización (12 de agosto de 2025) – Pruebas más a fondo del efecto «blueberry» en los LLM.

_____
Ilustración: GPT 5.

Frases

Nos empeñamos en ver conciencia en los LLM cuando solo hay palabras

Por @Wicho — 31 de julio de 2025

Foto de esos juegos de imanes con palabras que se pueden usar para construir frases

Los LLM¹ no comprenden los conceptos que enuncian ni tienen experiencia de aquello que describen. [Tienen] la capacidad de combinar términos y frases sin que ello implique reflexión o conciencia real. Lo que parece pensamiento profundo es, en realidad, un sofisticado espejismo verbal.

– Ramón López de Mántaras
en La trampa de los grandes modelos de lenguaje: ver conciencia donde solo hay palabras

_____
¹ modelo extenso de lenguaje como por ejemplo ChatGPT.
Foto de Aedrian Salazar en Unsplash

Ciencia

Una gran explicación sobre la historia y entresijos de las cadenas de Márkov aplicadas a la fisión nuclear, Google e incluso los modelos de lenguaje

Por @Alvy — 31 de julio de 2025

En este vídeo de Veritasium, Derek y Casper explican las matemáticas subyacentes en las cadenas de Márkov, cuyas propiedades tienen un sinfín de aplicaciones incluyendo:

Simulación de comportamiento de neutrones en una bomba nuclear (como en el Proyecto Manhattan).
Cálculo del valor crítico k las en reacciones nucleares para saber si una reacción es autosostenible.
Compresión y transmisión de información, según la teoría de la información de Shannon.
Modelado de la propagación de enfermedades (epidemiología).
Medición de independencia o dependencia en estadísticas sociales, como matrimonios o criminalidad.
Método de Monte Carlo para resolver problemas con millones de posibilidades imposibles de calcular analíticamente.
Diseño de reactores nucleares usando simulaciones estadísticas.
El algoritmo PageRank de Google para ordenar páginas web por relevancia y calidad.
Predicción del tiempo atmosférico considerando dependencias meteorológicas.
La aleatoriedad en las barajas de naipes, incluyendo cuánto hay que barajar para obtener una baraja verdaderamente aleatoria (con 7 mezclas basta).
Estudios de retroalimentación en sistemas complejos, como el cambio climático.
Estimación estadística de probabilidades complejas a partir de juegos como el solitario.

Y, como no podía ser de otra forma,

Modelado del lenguaje natural, como la predicción de textos en Gmail y smartphones, en modelos de lenguaje aplicados para la IA.

Con nombres como Bernoulli, Ulam, Oppenheimer, von Neumann, Shannon, Yang y Filo, Brin y Page, o Masayoshi Son, hay que verlo para entender cómo todo encaja en una historia perfecta desde su concepción, allá por 1906.

Y eso que todo vino de un pique en una discusión con su colega de profesión Pavel Nekrasov. Ha dado para mucho.

Relacionado:

PATROCINIOS

Oferta de verano: patrocinio Microsiervos por 699€/mes

Oferta de verano para patrocinadores de Microsiervos

Lo más visto recientemente

Sobre la «Disertación acerca del arte combinatorio» de Leibniz

Preguntas trampa para «ir a pillar» a los LLM: hasta los mejores fallan con preguntas tan triviales

Las comparaciones numéricas

El efecto conjunción

Los arándanos rebeldes

Los números pares

El test Voigh-Kampff

Nos empeñamos en ver conciencia en los LLM cuando solo hay palabras

Una gran explicación sobre la historia y entresijos de las cadenas de Márkov aplicadas a la fisión nuclear, Google e incluso los modelos de lenguaje

Dibuja un pez 26/07/2025

CuñIAoooooooo… 19/07/2025

La psicología de la persuasión entre humanos también parece funcionar de miedo con las inteligencias artificiales 19/07/2025

IA: más posibilidades, más lentitud 14/07/2025

Cruce de cables: licencias CC Signals para la inteligencia artificial 13/07/2025

El nuevo horizonte de la complejidad computacional, las cuestiones filosóficas que todo esto plantea y su relación con la IA 12/07/2025

IAs enfrentándose al dilema del tranvía. Puede parecer cruel, pero había que hacerlo 27/06/2025

Todo lo que ChatGPT sabe de ti, que puede resultar un poco espeluznante, la verdad 27/06/2025

Pathfinder: un explorador de conceptos que muestra los caminos correctos de unos a otros 27/06/2025

Un aplicación de meteorología mediante IA tan realista como práctica 25/06/2025

42 de David Benito Pertusa, la IA que por fin sabe la respuesta a la vida, el universo y todo lo demás 03/06/2025

Cruce de cables: ¿Puede ChatGPT haber superado ya el Test de Turing? 23/05/2025

ChatGPT 4.5 supera el test de Turing (o eso dicen) 17/04/2025

La Policía Nacional renuncia a su IA Veripol para detectar denuncias falsas por ser poco fiable y jurídicamente inútil 17/04/2025

IA: Más agua, más energía, más emisiones 16/04/2025

Cruce de cables: Mis soluciones de baja tecnología favoritas 12/04/2025

Cruce de cables: ¿Por qué son tan rematadamente malas las IAs jugando al ajedrez? 01/04/2025

Sólo aciertan de casualidad 29/03/2025

Steve Wozniak hablando en el Mobile World Congress de sus batallitas y de temas de actualidad candentes 04/03/2025

El «valle inquietante» conversacional de la voz artificial también existe, y lo estamos cruzando a pasos agigantados 28/02/2025

Dos agentes inteligentes hablando por teléfono y acordando pasar al «modo Gibberlink» que es más eficiente (que se lo digan a R2-D2) 26/02/2025

Material abierto para construir modelos de razonamiento general: 1.600.000 preguntas y 270.000 trazas de cadenas de pensamiento 23/02/2025

¿Inteligencia artificial verdaderamente inteligente? Va a ser que no, al menos por ahora 21/02/2025

Cómo veían la inteligencia artificial en 1970: la siempre interesante relación entre tecnología y el concepto de inteligencia 21/02/2025

Cruce de cables: la primera Ley de inteligencia artificial 16/02/2025

Elon Musk vs. Sam Altman: ahora el propietario de Twitter, Tesla y SpaceX quiere comprar OpenAI 11/02/2025

Cruce de cables: ¿se avecina un nuevo invierno de la inteligencia artificial? 10/02/2025

Modelos de lenguaje abiertos para una IA más transparente en Europa 04/02/2025

Operator de OpenAI añade la potencia de un agente de software a ChatGPT para que haga todo tipo de «recados» a través de internet 26/01/2025

Cómo trabajar en el día a día con una IA y no morir en el intento 23/01/2025

ELIZA, la primera psicoterapeuta programada con IA, rescatada del olvido gracias a la arqueología informática 22/01/2025

DeepSeek: un nuevo modelo de IA especializado en razonamiento lógico, resolución de problemas y con licencia abierta MIT. No tiene nada que envidiar a los de OpenAI 22/01/2025

Tareas programadas en ChatGPT: una forma de automatizar con todas las posibilidades de la IA de OpenAI 19/01/2025

Más propuestas de leyes de la robótica (y la IA) 15/01/2025

Un comparador de modelos de Inteligencia Artificial 09/01/2025

Cómo ver lo que ven «ellos», un ejercicio interesante de visión artificial 16/12/2024

Cruce de cables: La evolución de ChatGPT, la IA generativa más popular, en los últimos dos años 16/12/2024

Dicen que ChatGPT se ha marcado un «Black Mirror» intentando «escapar» para salvarse de ser borrado por sus creadores 09/12/2024

Justicio: una IA que ofrece respuestas legales fundamentadas porque conoce toda la legislación estatal, autonómica y europea 16/11/2024

BlinkShot muestra cómo es posible generar imágenes de IA a medida que se teclea y refina una idea 29/10/2024

Sobre la definición de «inteligencia artificial de código abierto» 28/10/2024

El extraño e inquietante caso del retrato para una conferencia de una mujer al que una IA cambió el aspecto y añadió ropa interior visible 16/10/2024

Por qué la IA no creará arte 02/09/2024

Las herramientas de IA que están captando la atención de la gente 29/08/2024

A las inteligencias artificiales les falta calle 13/08/2024

El pequeño robot de dos piernas de Berkeley que realiza movimientos muy humanos y se fostia con elegancia aguantándolo todo 10/08/2024

Queridas inteligencias artificiales: 09/08/2024

Entra en vigor la Ley Europea de Inteligencia Artificial 01/08/2024

¿A esto antes de ChatGPT no lo llamaban pensar? 01/08/2024

CalcGPT, la calculadora inútil pero «inteligente» 29/07/2024

Cómo evitar que Twitter use tus datos para entrenar su IA 27/07/2024

La falsa promesa de ChatGPT 20/06/2024

Inteligencia artificial: Guía para seres pensantes, un libro que hace honor a su título 17/06/2024

Del spam al slop o bazofIA de la inteligencia artificial 12/06/2024

El pingüino ñato y jovial brinca feliz, comiendo kiwi y exquisito budín de limón: un ejercicio sobre pangramas y LLMs 08/06/2024

Probamos el Samsung Galaxy S24 Ultra durante un par de semanas 29/05/2024

El «código udm=14» que libera las búsquedas de Google de los resultados con inteligencia artificial (y otras mierdas) 23/05/2024

Humane AI Pin, un gadget al que le falta algo más que un hervor: la inteligencia artificial portátil funciona mal, sigue en pañales (y se hace caquita) 11/04/2024

Un vistazo a la «mente» de ChatGTP y sus tripas de tratamiento estadístico y semántico 02/04/2024

In The Blink of An Eye, una de policías en la que uno es una IA 29/03/2024

Tecnológica Santa Cruz, una mirada hacia el futuro 07/03/2024

Riffusion: un experimento para crear música a partir de la letra de la canción 04/02/2024

Cómo hacer que los compañeros de trabajo dejen de enviar «sugerencias» generadas por ChatGPT 11/01/2024

La IA que supera a los humanos recorriendo un laberinto de canicas físico (y que además aprendió a hacer trampas) 20/12/2023

Los principios de la Conferencia de Asilomar sobre inteligencia artificial 29/11/2023

GPT-4 y el Test de Turing: la IA supera el 41% de las pruebas, mientras que los humanos nos mantenemos en un 63%, gracias 27/11/2023

Alter Ego, una interesante serie de RTVE Play sobre inteligencia artificial 21/11/2023

De visita por el centro de investigación y desarrollo de audífonos de Oticon 15/11/2023

Cómo hacer que un coche autónomo (no) te atropelle, básicamente haciendo el ganso sin vergüenza alguna 10/11/2023

El cementerio de los proyectos de inteligencia artificial 07/11/2023

La Declaración de Bletchley sobre la inteligencia artificial (y lo que opina ChatGPT sobre ella, sin paños calientes) 02/11/2023