Por @Alvy — 12 de Septiembre de 2023

La colección de audiolibros del Proyecto Gutenberg leídos por las voces de la IA de Microsoft

Me gusta la idea tras los Audiolibros del Proyecto Gutenberg que han desarrollado entre uno de los proyectos más antiguos de internet, Project Gutenberg, y Microsoft. Básicamente han pasado miles de audiolibros con licencia libre y gratuita por la tecnología neuronal de conversión de texto a voz de Microsoft y lo han volcado en las plataformas de podcast más populares.

De este modo se puede acceder a una enorme colección de obras en formato audiolibro en Spotify, Apple Podcast y Google Podcasts, además de Archive.org que guarda una copia en varios formatos a perpetuidad. De momento todo el material está en inglés, pero como el Proyecto Gutenberg almacena 70.000 obras en diversos idiomas es probable que pronto aparezcan otros, tan pronto como las voces tengan una calidad razonable y se pueda procesar todo.

En la colección he contado casi 5.000 obras de la literatura de todos los tiempos, principalmente clásicos y algo antiguos (por aquello de que los copyrights hayan expirado). Así que si quieres alimentar tu alma con un poco de Platón, revivir el viaje De la Tierra a la Luna de Jules Verne o recordar las Aventuras de Alicia en el País de las Maravillas de Lewis Carrol al mismo tiempo que practicas un poco el listening en inglés, qué mejor sitio.

Sobre la calidad en sí del audiolibro yo diría que es mucho más que aceptable: la voz es agradable y está estupendamente conseguida, fruto de la última tecnología. Eso sí: ya avisan de que puede suceder que haya algunas «pronunciaciones raras» en nombres propios y palabras peculiares, o algunos errores al interpretar números o términos mencionados en otros idiomas; lo esperable, vamos. Me imagino que esto se podrá ir mejorando añadiendo pistas sobre la pronunciación a los textos originales; habrá que ver cómo evoluciona.

Curiosamente este formato, tan popular en Estados Unidos, en España nunca me ha parecido que haya tenido mucho éxito, aunque es verdad que puede ser interesante para las personas con problemas para leer, para aprender inglés, para los largos viajes en coche o para los paseos en los que en vez de un podcast o música prefieras ir cultivándote mientras haces ejercicio. Tal vez con una oferta masiva como se puede conseguir con este método la cosa cambie, quién sabe.

Relacionado:

Compartir en Flipboard Publicar / Tuitear
PUBLICIDAD


Por @Alvy — 2 de Septiembre de 2023

La ilusión óptica del excursionista en la nieve que también engaña al reconocimiento de imagen de las IA

Esta imagen que hizo las rondas de internet hace algún tiempo es una ilusión visual de lo más curiosa. Si miras la foto, muestra claramente un excursionista caminando por la nieve hacia unos árboles. Pero si la miras de nuevo, tranquilamente, ves lo que realmente hay en la foto.

Por curiosidad se me ocurrió pasarla por la API de Cloud Vision, el sistema de reconocimiento de objetos en imágenes fotográficas de Google, a ver si le pasaba lo del ¿Pato o conejo? La cosa quedó clara: con un 93% de probabilidad, la imagen muestra una persona.

La ilusión óptica del excursionista en la nieve + Cloud Vision API

La foto me la crucé en la cronología de Massimo, pero no hay una referencia cien por cien fiable de su origen, más allá de que está tomada por «Terri Babers (Jam Press)», algo que figura en más sitios en Google pero sin que en la web de Jam Press aparezca ninguna referencia. Supongo que es una de esas fotos que se hacen virales y de las que luego se encargan las agencias. (?)

También hay que tener en cuenta que muchas veces este tipo de fotos de «naturaleza» están más o menos editadas para dramatizar el efecto que se pretende mostrar: nubes, lunas, formaciones rocosas… En este caso podrían estar editados el el pie/pata, o la cabeza/cola, que «casualmente» están en el lugar exacto y con la postura adecuada para resultar más confusas.

Relacionado:

Compartir en Flipboard Publicar / Tuitear
PUBLICIDAD


Por @Alvy — 31 de Agosto de 2023

«La loca idea de una máquina que sepa pensar» y otros artículos sobre inteligencia artificial / Imagen: Pensamiento, de Patricia Bolinches

Ya se ha publicado en línea La loca idea de una máquina que sepa pensar, un artículo que escribí para la revista en papel de elDiario.es de abril, que llevaba como título de portada Inteligencia Artificial: Riesgos, verdades y mentiras. Lo de publicar artículos «en papel» tiene su encanto especial, y la verdad es que casi ni recordaba cuándo había sido la última vez, pero la sensación fue ciertamente agradable.

Mi artículo en concreto recorre la cronología de la inteligencia artificial desde los más lejanos orígenes hasta nuestros tiempos, más exactamente desde la primera referencia de Ramón Llull (1308) hasta ChatGPT. Es cierto que se puede argumentar sobre referencias más remotas (seguramente a los tiempos de los griegos) pero este hito y luego empezar a concretar por décadas a partir de Alan Turing creo que es razonable.

Releído ahora, me parece un poco increíble cómo ha evolucionado todo en el campo de la IA desde abril a agosto de este año; cuatro meses realmente intensos con GPT-4, Bard, LLaMA, las versiones nuevas de MidJourney, Photoshop y demás… Todo eso habrá que contarlo en otros artículos.

También se han publicado estos otros trabajos que vieron la luz en papel en ese mismo número, a cuál más interesante:

Cada uno de los artículos trata un tema distinto y, apropiadamente, tienen poco solapamiento. Unos tratan temas más técnicos, como el de la fusión cerebro+máquina y otros más sociales, como el dedicado al mercado laboral y las implicaciones de la IA.

Como bonus, dejo de paso este vídeo de la mesa redonda en la que se presentó la revista y en el que participamos Liset Menéndez de la Prida, Mar Abad y un servidor, respondiendo a las preguntas del público asistente y de Gumersindo Lafuente, editor de elDiario.es. Si tienes una horita libre igual te entretiene escucharnos en persona.


Compartir en Flipboard Publicar / Tuitear
PUBLICIDAD


Por @Alvy — 21 de Agosto de 2023

The No-Return Dispatch

Fernando Barbella nos envió un enlace a su galería de un conjunto de imágenes tituladas The No-Return Dispatch, donde muestra su creatividad «ampliada» con Midjourney, uno de los motores de IA visuales más potentes del último año. Dice que casi todo lo está aprendiendo «por puro ensayo y error»; el resultado es cuando menos impresionante.

La versión en vídeo The No-Return Dispatch que nos ha enviado es otro ejemplo del siguiente paso con el que están experimentando muchos creadores: animar y crear películas cortas con este tipo de creaciones.

Sus herramientas son:

  • Midjourney para generar imágenes, en base a un «mundo» que creó hace un par de meses.
  • Photoshop 2023 Beta para expandir y reencuadrar esas imágenes (imagino que con el relleno de contenidos mediante IA).
  • Runway Gen-2 para animar las imágenes.
  • Adobe Express para unir los clips de vídeo.
  • Alguna otra plataforma online para meter los supers y la banda sonora.

Dice que en cierto modo le recuerda un poco a finales de los años 90, cuando había que aprender a «crear la Web» consultando con conocidos y desconocidos, divirtiéndose en el proceso.

Aunque, tal y como reconoce Fernando, el vídeo no es todavía perfecto, resulta impresionante la cantidad de detalles y cosas que se pueden hacer que hace unos años (¡o meses!) eran directamente impensables.

Compartir en Flipboard Publicar / Tuitear
PUBLICIDAD