Por @Alvy — 4 de Junio de 2011

Cube

Imagina una máquina con un complejo mecanismo interior que a cada rato fabrica un cubo con aristas inferiores a un metro. El problema es que no sabemos cuál es el método que la máquina sigue para decidir el tamaño del siguiente cubo. Si intentamos razonar sobre cómo puede que sea el siguiente cubo podríamos concluir que la probabilidad de que su arista sea menor que medio metro es del 50%, algo aparentemente lógico y correcto.

Pero, si aceptamos lo anterior, también podríamos razonar que dado que el volumen varía entre 0 y 1 metro cúbico la probabilidad de que el siguiente cubo tenga un volumen de menos de medio metro cúbico es del 50%. Pero un cubo cuya arista sea de medio metro tiene como volumen 1/8 metros cúbicos, no medio metro cúbico. Algo paradójico sucede si se utiliza este razonamiento junto con el anterior tal y como está planteado el problema.

Este problema stá planteado por Agustín Rayo en la columna Juegos matemáticos de Investigación y Ciencia desde este mes (junio 2011) dedicada a la definición de la aleatoriedad.

Compartir en Flipboard  Compartir en Facebook  Tuitear

36 comentarios

#1 — Markstor

Esto me recuerda, aunque no tiene mucho que ver, a la ley cuadrado-cubica

#2 — Corbí

Supongo que si el problema está planteado en tres dimensiones hay que resolverlo pensando el volumen y no en el lado, aunque eso sea lo que te den en el problema.

#3 — anonimo

Todo depende sobre qué dimensión o qué parámentro la curva de probabilidad está centrada entre los valores mínimo y máximo, y además es simétrica.

#4 — Emilio Pardo

El problema no está correctamente definido, pues falta conocer la función de la distribución aleatoria. Ambos resultados son posibles, aunque no simultáneamente. La paradoja que aparece es motivo de la incorrecta información sobre la distribución de la variable.

#5 — Juanito Deforme

Que la probabilidad de ser menor que la mitad sea 50% no significa que la función de probabilidad sea uniforme. Si se puede decir así, la longitud es lineal, el volumen no.

#6 — Julio

La cuestión es qué se decide con aleatoriedad, si el lado o el volúmen. Dicho de manera informal, si por ejemplo lo que se decide aleatoriamente el lado (cualquier tamaño tiene igual probabilidad de salir elegido), la distribución de probabilidad de los volúmenes no es uniforme.

Como habéis dicho, 0'5m de lado nos dan un cubo de 0,125m3, así que en el supuesto de que la elección aleatoria fuese el lado, el 50% de los cubos tendrían menos de 0,125m3.

#7 — Agus

No hay ningún problema. Todo se reduce a saber cuál es la distribución de probabilidad que emplea la máquina para calcular el tamaño del cubo.
En alguna parte del algoritmo q realiza la fabricación del cubo, habrá una variable que toma un valor aleatorio entre 0 y 1. Solo necesitamos saber si el programador/constructor estableció que esa variable sea el lado o sea el volumen. Si es el lado el que toma aleatoriamente un valor entre 0 y 1, la interpretación del volumen será contraintuiva, pero correcta.
Saludos!! ;)

#8 — Alvy

Además del lado o el volumen puede que la máquina funcione en base a otros parámetros, o a una combinación de varios de ellos supongo: el tamaño de la diagonal de una cara, o de la diagonal mayor, o de la superficie de las caras (6 m2) o su peso o su atracción gravitatoria (que iría en función de su masa) o cualquier otra cosa. Me pregunto si podría usarse algún parámetro relacionado con cuatro dimensiones o más, o si acaso eso tendría algún sentido. O si pudiera usarse algún factor externo y cómo. Realmente la definición del problema con lo de «no se sabe cómo funciona la máquina» es un auténtico fastidio, pero no creo que anule o invalide el planteamiento del problema.

Al respecto encontré esto por ahí: Bertrand’s Paradox / Bertrand’s Problem / Bertrand’s Paradox que hablan sobre el problema; dicen que es el mismo efecto que se produce en la paradoja de Bertrand del triángulo y las cuerdas:

Supongamos que se elige al azar una cuerda de un círculo. [Una cuerda es una línea que une dos puntos de su circunferencia.] ¿Cuál es la probabilidad de que la longitud de esa cuerda sea mayor que la del lado de un triángulo equilátero inscrito en dicho círculo?

#9 — Alfa

El volumen depende del lado cubicamente. Lo lógico es que el lado sea el que tiene la distribucion aleatoria.

#10 — faki

Si consideramos el lado y el volumen, tenemos dos variables aleatorias totalmente dependientes entre sí, es decir, dada una la otra está totalmente determinada, con lo que en realidad tenemos una única variable aleatoria.

Lo que creo que es falaz en el enunciado es el asumir que la probabilidad de tener un lado menor de 50 cm sea del 50%, esta puede ser la probabilidad inicial no informativa en un proceso secuencial bayesiano para ir mejorando la estimación.

Yo hoy no se la probabilidad de que mañana llueva en Springfield, y puedo asumir que es del 50% como una decisión personal, pero alguien qué esté hoy en Springfield (o alguien que se moleste en ojear weather.com) podría tener una mejor estimación que la mía.

#11 — Luis Mendo

El problema simplemente está mal definido; es decir, no se puede saber la respuesta. Decir que un suceso es "aleatorio" no es suficiente para especificar sus propiedades aleatorias. ¿Cuál es la paradoja?

No he podido leer el artículo original, pero espero que contenga algo más interesante :)

#12 — Alvy

#11 Luis, entonces otros problemas similares como «se lanza una moneda al aire y sale cara o cruz al azar» también podrían estar mal definidos y aunque nos parezca que siguen unas pautas en realidad encerrar otras diferentes y más complejas, ¿no?

#13 — Oriol

#11 Alvy, con una moneda lanzada al aire si que es una suposición razonable, a priori, suponer que tiene la misma probabilidad que salga una de las dos opciones (suponiendo que la moneda no esta trucada y no hay un desvío sistemático). Ninguna de las dos opciones, a priori, tiene una preferencia sobre la otra. Si fuera una moneda trucada de tal manera que una de las dos opciones fuera preferente, entonces ya sería distinto y deberías conocer que desviación existe para saber como se comportaría. A parte de estar trucada la moneda, podría haber muchas variables del entorno que introdujeran una desviación hacia alguno de los dos resultados, dependiendo de cuales fueran, podrían ser difíciles de saber. Solo se podrían conocer sus consequencias (si estas fueran constantes en el tiempo) lanzando muchas monedas y calculando que resultados se obtienen.
En el caso del cubo, en lugar de dos, tienes infinitos possibles resultados. A priori no sabes si hay algunos mas favorables que otros o no. Suponer que los cubos con una arista de medio metro tienen el 50% de probabilidades es una suposicion totalmente gratuita. Porque 0.5 metros y no 0.33? No todas las cosas se comportan de forma lineal. Además, como ya han dicho, el lado del cubo, la diagonal, su volumen o el area de sus caras son todas variables ligadas. Si sabes cualquiera de ellas, las otras quedan determinadas. Además tienen relaciones no lineales entre ellas, asi que si una sigue una distribución uniforme (como una moneda no trucada), otras no podran hacer lo mismo.
Supongamos que yo fabrico la maquina de tal manera que cualquier arista entre 0 y 1 metro es possible y ademas tienen la misma probabilidad de aparecer. Entonces, el volumen inevitablemente no seguirá una distribución plana y en conosequencia, es bastante mas probable que salgan cubos con un volumen inferior a 0.5 m3 de mi maquina. Por lo tanto, si alguien hiciera las suposiciones que se plantean en el problema, simplemente con una acertaría y con la otra, se equivocaría. Pero en realidad, yo he planteado una maquina que sigue una distribución sencilla, pero me podria haber inventado una mucho mas complicada, con lo qual ninguna de las dos suposiciones serían correctas.

#14 — Alvy

#13 Oriol, con la máquina que hace cubos sí que es una suposición razonable, a priori, suponer que tiene la misma probabilidad que salga un cubo de las dos opciones (menor o mayor que 0,5 metros de arista) suponiendo que la máquina no esta trucada y no hay un desvío sistemático.

Ninguna de las dos opciones, a priori, tiene una preferencia sobre la otra. Si fuera una máquina trucada de tal manera que una de las dos opciones fuera preferente, entonces ya sería distinto y deberías conocer que desviación existe para saber como se comportaría. A parte de estar trucada, podría haber muchas variables del entorno que introdujeran una desviación hacia alguno de los dos resultados, dependiendo de cuales fueran, podrían ser difíciles de saber. Solo se podrían conocer sus consequencias (si estas fueran constantes en el tiempo) fabricando muchos cubos y viendo qué resultados se obtienen.

En el caso de las monedas a priori no sabes si hay algún caso (cara o cruz) mas favorable que otros o no. Suponer que las monedas tienen el 50% de probabilidades de mostrar cada cara es una suposicion totalmente gratuita. ¿Por qué 50% y no 33%?

:-)

#15 — Oriol

#14 Alvy, la diferencia entre la máquina y la moneda es que la moneda, gracias a la experiencia sabes que, si no esta trucada, sigue una distribución binomial donde tienes las mismas probabilidades de obtener cada uno de los dos sucesos, mientras que de la máquina, a priori, no sabes nada. La máquina podría funcionar de muchas maneras. Por supuesto, si quieres puedes hacer la suposición que existen la mitad de probabilidades que salga una arista 50% mas grande o pequeña (y te puedes ser incorrecta o no, igual que podria ser incorrecta con la moneda, y esta estuviera trucada), pero si haces esta suposición, ya no puedes hacer una segunda con el volumen, sin generar una contradiccion (pero no una paradoja). En el fondo seria llamar a la misma cosa de dos maneras distintas, y cambiar la suposición en función de como lo llamaras. Las dos variables (arista y volumen en un cubo) estan ligadas y cuando defines una, inequivocamente, defines la otra. Es decir, si supones que en la mitad de los casos la la arista es mas pequeña que el 50%, implicitamente estas suponiendo que en la mitad de los casos el volumen del cubo sera el 12.5% del original. Entonces, no puedes hacer una segunda suposicion distinta sobre el volumen, sin descartar primero la anterior. Si no, te estas contradiciendo.

#16 — Alvy

Lo de la «experiencia» no creo que sea válido; imagina que quien razona es alguien que nunca haya visto una moneda…

#17 — ko

gente...

casos favorables/casos posibles da el 50% de probabilidad en el caso de la moneda.

en el caso del cubo lo que sucede es que implicitamente estáis aplicando la ley de los grandes números.- si el numero de repeticiones tiende a infinito, las probabilidades según distribucuón normal convergen en la esperanza/valor medio (0.5mts) y el resto se distribuye "normalmente" a izquierda y derecha de ese valor...

#18 — Miquel

De acuerdo con Luis (#11) y con los comentarios de Oriol. Leyendo el enunciado, no veo ningún problema bien planteado.

Si lo que hay que hacer (al igual que en la paradoja de Bertrand) es suponer una distribución a priori para algún parámetro del cubo, entonces el problema se convierte en un ejercicio de probabilidad bastante sencillo...

Puede que el problema tenga alguna gracia filosóficamente (no lo sé porque no estoy al día), pero matemáticamente tiene muy poca.

#19 — Oriol

#16 Alvy, con lo de la experiencia no estoy justificando que todo el mundo deberia hacer esta suposición. Solo que es la que yo, en un principio, y gracias a mi experiencia, veria mas razonable. Evidentemente, podria equivocarme.
Como ya he comentado, en el caso del cubo, también se puede hacer la suposición que a uno le parezca mas adecuada en base a la información que se posea. Lo que no tiene sentido és dar como validas dos suposiciones que son contradictorias de por si.
Otra cosa seria si lo que haces en realidad es no darlas como validas, si no que estas testeando las dos distintas hipotesis, entonces no hay ninguna paradoja. Si pruebas la maquina veras que una de las dos es la correcta (o quizas una tercera que no habias supuesto).

#20 — Senseless

La falsa paradoja radica en un mal tratamiento de las propiedades del infinito.

Si la máquina puede crear cuanquier cubo de arista comprendida entre 0 y 1, ambos excluidos, significa que si elegimos el punto central de tamaño de arista (o volumen de cubo) hay la misma cantidad de cubos mayores que menores: infinitos. La misma cantidad de infinito además.

Pero si elegimos cualquier otro punto en el tamaño de arista (o volumen del cubo), ¡también hay exactamente la misma cantidad de cubos más grandes y cubos más pequeños!

Una vez contemos con que la cantidad de cubos posibles es finita, desaparece la paradoja.

#21 — Oriol

#20 Si no lo he entendido mal, lo que dices no es correcto. Supón que tienes una hoja, la partes por el medio y lanzas una piedrecita encima de la hoja en posiciones totalmente al azar de la forma mas uniforme que puedas. El número de posibles posiciones donde puede ir a parar la piedra en cada una de las dos divisiones es infinito. Si lo haces bien y lo repites muchas veces, la piedra tendirá a caer el mismo número de veces en cada una de las dos divisiones iguales.
Ahora supon que divides la hoja de tal manera que tienes un cuadradito con un area del 1% del tamaño total de la hoja. Este cuadradito también tiene infinitos puntos, al igual que el resto de la hoja. Si repites el experimento la piedrecita caerá muchas menos veces dentro del cuadradito que en cualquier otra posición de la hoja, a pesar que ambas divisiones tengan un numero infinito de puntos.
Ahora supon que tienes una maquina A que escoge un numero Real cualquiera entre 0 y 1 (si quieres ambos excluidos) de una manera uniforme. Una vez elegido el número, genera un cubo que tenga de lado este determinado número de metros.
Ahora supon que tienes una máquina B que, al igual que la primera escoge un número entre 0 y 1 de manera uniforme. A continuación, esta maquina coje este numero de Kg de una determinada sustancia que tiene una densidad de 1Kg/m3. A continuación fabrica un cubo con la substancia que ha cogido.
Si supones que las dos maquinas son ideales, cada una de ellas te puede fabricar cubos de infinitos tamaños distintos. Pero mientras la maquina A te fabricara el mismo numero de cubos con un lado superior o inferior que 0.5 m, los cubos de la maquina B tendiran a estar distribuidos a partes iguales en función de si su volumen es superior o inferior de 0.5m3.

#22 — Adrián

Yo también estoy con los que en lugar de ver una paradoja ven que el problema tiene "truco". Como dice #17 ko, la probabilidad son casos favorables/casos posibles, pero ¿Cuales son estas cantidades? Como dice #20 Senseless tanto una como la otra son infinito, y del mismo tipo.

"Si intentamos razonar sobre cómo puede que sea el siguiente cubo podríamos concluir que la probabilidad de que su arista sea menor que medio metro es del 50%, algo aparentemente lógico y correcto"
No sé de qué manera, este enunciado puede ser aparentemente lógico y correcto, y me lo parece menos todavía, teniendo en cuenta que "no sabemos cuál es el método que la máquina sigue para decidir el tamaño del siguiente cubo".

¿Cómo podríamos calcular el número de casos posibles, favorables o la relación existente entre ellos? Mi intuición me dice, que si usamos el volumen, para un volumen 0,5, tenemos la misma cantidad de cubos menores que mayores, pero esto es sólo una intuición infundada. Quizá sepa alguien resolver esta indeterminación matemática.

#23 — Pablo

El tema es que una distribución uniforme (0,1) al cuadrado deja de ser uniforme (0,1). Si lo que sigue una distribución uniforme es el lado, entonces la prob de que el volumen sea mayor o menor a 0.125 es un medio.

#24 — senseless

#20, si repites el experimento infinitas veces, caerá el mismo número de veces en el papel grande que en el pequeño. ¿Qué hay más, números enteros positivos, o números enteros positivos pares?

Si no has trabajado con teorías de los infinitos no le des más vueltas, todos los resultados van en contra del sentido común.

#25 — Oriol

#24 Te equivocas mucho, si repites el experimento infinitas veces caera un 1% en la parte pequeña y un 99% en la parte grande. El limite de x/(100x) cuanto x tiende a infinito es 1/100 y de (99x)/(100x) cuando x tiende a infinito es 99/100. Ademas, existen muchas distribuciones de probabilidad que son continuas (es decir, que existen infinitos puntos posibles para la variable aleatoria), para empezar la gausiana, la chi2, la exponencial, la gamma, la F... Ninguna de ellas es uniforme. No tiene ningun sentido lo que dices. Si fuera cierto, por ejemplo una distribucion gausiana ( que no esta acotada) no podria tener, por ejemplo, media.
Sobre si hay mas enteros o enteros pares, el problema es que no tiene sentido la pregunta utilizando los mismos conceptos que se usan con conjuntos finitos. Por ejemplo, en un conjunto infinito, si es contable (que no tiene porque serlo, como el conjunto de los numeros reales), no tiene porque tener especificado el sistema que vas a utilizar para contar, lo cual es necesario para decidir de "cuales hay mas". Por esto puedes llegar a resultados aparentemente contradictorios como que hay mas enteros pares que enteros.

#26 — Luis Mendo

Oriol lo ha resumido muy bien: puede haber una contradicción, pero no una paradoja.

¿Alguien ha encontrado el artículo original en versión "libre"? Quiero decir sin tener que pagar los 6 euros que pide la revista (y sin saber si el artículo los vale)? Quizá esté publicado en algún repositorio tipo Arxiv...

#27 — Errasti

Si no sabemos qué procedimiento sigue la máquina para fabricar el cubo, es igual de arbitario suponer que la probabilidad de que la arista mida más de medio metro es un medio, que suponer que uno de cada dos cubos tiene una arista de 0.1 metro y el otro, de 0.2.

Si la máquina sigue un "método" para decidir el tamaño del siguiente cubo y dicho método es aleatorio, solamente la observación de una muestra nos ayudará a inferir la ley de probabilidad que gobierna la máquina. Cualquier suposición a priori es absolutamente gratuita.

#24 Repetir el experimento "infinitas veces" es imposible. Pero para cualquier número arbitrariamente alto de repeticiones, el cociente entre los números que cuentan las veces que la piedra cae en cada lado (siendo los lados distintos) tiende a separarse de uno, con más probabilidad cuanto más distintos sean los trozos de papel de #21.

#28 — carlos


X=X^3 (números enteros no negativos?) Pues sólo el 1 y el 0...

#29 — Shake

Yo diria que el "error" del planteamiento esta en el enunciado, que es incorrecto.

Dice "podríamos razonar que dado que el volumen varía entre 0 y 1 metro cúbico la probabilidad de que el siguiente cubo tenga un volumen de menos de medio metro cúbico es del 50%"

Y nos lo creemos... pero nos esta engañando. Concretamente cuando dice "medio metro cubico".... No podriamos razonar eso, que es lo que dice el problema... porque si lo hicieramos estariamos razonando mal.

La "paradoja" es que no podemos decir que si una cosa es de un modo la otra tambien, porque no lo son. Aunque en principio parezca que si. Podemos tener una maquina que haga cubos con un 50% de probabilidades de medir menos de medio metro de arista, pero esta entonces no cumplira con 50% de menos de medio metro cubico. O podemos tener una maquina que haga cubos de menos de medio metro cubico al 50% pero entonces no cumplira con la otra premisa.

Asi que cuando dice "podemos razonar que entonces..." miente, no podemos razonarlo.

Saludos

#30 — Pau

Incorrecto: "La probabilidad de que el siguiente cubo tenga un volumen de menos de medio metro cúbico es del 50%"

#31 — Alvy

Si no es el 50%, ¿cuál crees que es entonces?
¿Por qué eso es incorrecto y no lo es decir «La probabilidad de que el lanzamiento de la siguiente moneada sea cara es del 50%»?

#32 — Shake

#31 Hombre Alvy... una cosa es que haya el 50% de posibilidades de que algo ocurra. Y otra cosa es que dada esa probabilidad, digamos que la probabilidad de todas las cosas que pueden ocurrir sean de un 50%.

Supon que tienes un saco lleno de monedas, todas las monedas tienen una cara y una cruz, y la 1/125 parte de las monedas son doradas, las otras plateadas...

La posibilidad de sacar cara o cruz no es la misma que la de sacar plata o oro...

Hagamoslo ahora al reves, supon que la mitad son plateadas pero 1/125 de las monedas tienen dos caras y el resto dos cruces...

Esa es la situacion de la maquina de los cubos.. Que toma dos referencias distintas e intenta equipararlas.

en el ejemplo de las monedas yo he definido esa diferencia.... en el caso del cubo, la diferencia es intrinseca al propio objeto.

Saludos

#33 — Alvy

Sí, hombre, si eso lo entiendo… Si sigo dándole vueltas es para que se vea que la cuestion es un poco más profunda: que no sabemos por qué procesos se produce la aleatoriedad en el MundoReal™… De ahí que, si te pones estricto, tan poco sabes sobre la máquina de cubos (si solo sabes que salen con volumen entre 0 y 1, y entenderse como 0 o 1) como con una moneda (que puede caer 0 o 1).

Al respecto, véase Randomness vs. unpredictability en Wikipedia.

#34 — Luis Mendo

Alvy, efectivamente, la cuestión es que no sabes la distribución de los diferentes valores producidos por la moneda o por la máquina. Esa distribución no puede saberse a priori: o se deduce a partir de un modelo del "funcionamiento interno" de la moneda/máquina, o se "mide" (se estima) a partir de realizaciones del experimento aleatorio.

Con la moneda se pueden hacer medidas y dan (para monedas razonables) 1/2 para cada uno de los dos posibles valores. Además el funcionamiento de la moneda sugiere ese valor (o uno muy parecido).

Con la máquina de cubos no hay medidas ni pistas sobre el funcionamiento interno, y por tanto no puede aclararse la cuestión. El volumen resultante de la máquina podría tener cualquier distribución. El problema no es paradójico, es incompleto.

#35 — Alvy

Estamos de acuerdo; pero ahora haz el ejercicio de imaginar cómo podría razonar de forma puramente lógica alguien que no tuviera acceso a una moneda ni estimar cómo funciona haciendo lanzamientos…

#36 — Luis Mendo

En el caso de la máquina ¡no podría! Es como intentar razonar de forma lógica el valor de la constante de gravitación universal...

En el de la moneda sí se puede, porque hay una diferencia esencial: está definido qué es lo que se observa (se observa qué lado de la moneda queda arriba). Una vez definido eso, la opción "simétrica" es la más "razonable" o "estética": 1/2 cara, 1/2 cruz.

Eso no ocurre en la máquina, porque simplemente no está definido qué variable observas: ¿lado? ¿volumen (lado elevado a 3)? ¿logaritmo del lado? ...). Por eso decía que el problema está incompleto. Una vez definido qué variable observamos, y suponiendo que esté acotada (lo cual no es cierto en mi tercer ejemplo), ya podríamos asignarle a esa variable una distribución uniforme, que es "simétrica".

Y evidentemente, en función de cuál sea la variable que observemos, la respuesta será distinta. ¿Hay en eso alguna paradoja?