Por @Alvy — 1 de Junio de 2023

World Capitals Voronoi

En esta casa somos muy de Voronois, así que estamos encantados de habernos topado con este Globo terráqueo con las capitales del mundo como diagrama de Voronoi. Es una proyecto de Jason Davies que además de interesante incluye alguna que otra sorpresita.

Tal y como mandan los cánones cada área de color es un polígono equidistante a los diferentes puntos que tiene cerca. Esta idea matemática tan simple como poderosa tiene múltiples aplicaciones en el MundoReal™, desde la meteorología a la física o el control de epidemias.

Moviendo el ratón se puede hacer girar el globo para descubrir algunas curiosidades: en España, por ejemplo, el Voronoi hace que Marruecos engulla Cádiz, mientras que Andorra se asigna una región gigantesca entre Francia y España, como también sucede con el Vaticano, que fragmenta Italia. Los Estados Unidos quedan también reducidos cuando México, Cuba y Bahamas los invaden por el sur. En Sudamérica se produce un curioso reparto casi equivalente de todo el continente entre los diferentes países que lo componen.

Relacionado:

Compartir en Flipboard Tuitear
PUBLICIDAD


Compartir en Flipboard Tuitear
PUBLICIDAD


Por @Alvy — 31 de Mayo de 2023

AI21 Labs concludes largest Turing Test experiment to date

Creo que dentro de 50 años será posible hacer que los ordenadores compitan en el juego de imitación tan bien como para que una persona promedio no tenga más del 70% de posibilidades de acertar tras 5 minutos de interrogatorio.

– Alan Turing (1950)

Si confiamos en la validez del archiconocido Test de Turing, una versión simplificada del juego de imitación original planteado por el pionero de la informática moderna, las máquinas no son a día de hoy tan «inteligentes» como nosotros los humanos y la humanidad sigue a salvo.

Al menos eso se deduce del que puede ser el mayor experimento online planteado sobre este ejercicio por varios expertos de AI21 Labs del que ya hablamos por aquí: ¿Ser humano o no? Los resultados están descritos en este trabajo: Human or Not? A Gamified Approach to the Turing Test [PDF]. Y es que el jueguecito lanzado a mediados de abril supuso que se llevaran a cabo más de 10 millones de tests de este tipo con personas de todo el mundo, online, comprobando si podían identificar correctamente a otros participantes o a inteligencias artificiales basadas en modelos de lenguaje LLM como GPT-4 y Jurassic-2.

El resultado: cuando una persona hablaba con otra persona acertaban correctamente la identidad al otro lado del teclado el 73% de las veces (y fallaban un 27%); en cambio cuando hablaban con un bot sin saberlo acertaban el 60% de las veces y fallaban un 40%.

En el informe completo hay muchos más datos curiosos, como que los franceses, polacos y alemanes son quienes más aciertan (71%), mientras que los habitantes de la India, Rusia y España (!) somos los que menos (66%, ¡oooh!) Además de eso las mujeres aciertan ligerísimamente más veces que los hombres (67,7% frente a 67,4%) y los jóvenes más que las personas mayores (de más de 55 años).

AI21 Labs concludes largest Turing Test experiment to date
Las frases más populares que usó la gente en el experimento / A21Labs

El estudio está aderezado con la descripción de un montón de estrategias que usa la gente y pautas reconocibles, a cual muy curiosa. La gente, por ejemplo, da por hecho que los bots no cometen errores gramaticales ni escriben con erratas, palabrotas o jerga; también creen que los bots no saben mucho de temas actuales, o qué fecha/hora es. Curiosamente también identifican los buenos modales con ser «menos humano» e intentan usar juegos de palabras, trucos y preguntas personales para intentar «liar» a los bots.

Sea como sea, parece que todavía está lejos el momento en que se tornen los papeles y ese 40% de veces que la gente no puede identificar a los bots haciéndose pasar por personas llegue al 70% o más. ¿Un año? ¿Cinco? Quién sabe.

¿Y ChatGPT, qué opina de esto?

Pregunta: ¿Qué opinas de que según el experimento de A21Labs los modelos LLM como GPT-4 no puedan ser considerados todavía inteligentes porque sólo «engañan» al 40% de los seres humanos en el «juego de imitación» del Test de Turing?

ChatGPT-4: Como modelo de lenguaje AI, no tengo una opinión personal, pero puedo proporcionarte información objetiva sobre el tema que mencionas (…) Sin embargo, es importante tener en cuenta que el Test de Turing ha sido objeto de críticas y debate a lo largo de los años. Algunos argumentan que el Test de Turing es insuficiente para medir la inteligencia, ya que se basa principalmente en la capacidad de imitar respuestas humanas en lugar de evaluar un razonamiento verdaderamente inteligente (…) El hecho de que un modelo de lenguaje como GPT-4 no pueda engañar al 40% de los seres humanos en el Test de Turing puede ser una indicación de que aún hay margen de mejora en términos de su capacidad para imitar respuestas humanas de manera convincente. Sin embargo, la inteligencia artificial es un campo en constante evolución, y la evaluación de la inteligencia de los modelos AI debe considerar múltiples aspectos más allá del Test de Turing.

Relacionado:

Compartir en Flipboard Tuitear
PUBLICIDAD


Por @Wicho — 31 de Mayo de 2023


Una imagen histórica: el primer cohete desarrollado por una empresa privada española listo para emprender el vuelo – PLD Space

Parche de la misiónCuando todo estaba listo desde el punto de vista técnico para el primer lanzamiento del Miura 1 la meteorología ha obligado a posponerlo. En concreto han sido los vientos en altura entre los kilómetros 8 y 12, que estaban fuera de rango para poder asegurar de que en caso de un problema los restos del cohete no cayeran fuera de la zona de seguridad reservada.

Es una pena porque hay muchas ganas de ver volar este cohete. Pero es la decisión correcta; no hay que dejar que el ansia por lanzar se anteponga a los criterios de seguridad y éxito de la misión.

En las próximas horas o días sabremos cuando tendrá lugar el próximo intento de lanzamiento: no sólo PLD Space tiene que evaluar cuánto tiempo necesitan para reciclar los sistemas y tenerlos listos para ese segundo intento sino que además hay que ver para cuándo les dan permiso para intentarlo y que todo eso se alinee con las predicciones meteorológicas.

#VamosMiura!!!

Relacionado,

Compartir en Flipboard Tuitear
PUBLICIDAD


PUBLICIDAD


Un libro de @Alvy y @Wicho

Se suponía que esto era el futuro | un libro de Microsiervos, por Alvy y Wicho

Se suponía que esto era el futuro
Ciencia, tecnología y mucho más
www.microsiervos.com/libro