Por @Alvy — 15 de Junio de 2022

15.AI

15.ai se autodefine como un «sistema de síntesis de texto-a-voz de alta fidelidad, natural y emotivo, con los mínimos datos posibles». Se puede probar tecleando cualquier texto breve (o pulsando el icono Random) y reproduciendo las tres versiones distintas que se generan con cierto grado de confianza.

Lo más interesante de 15.ai (también conocido como DeepThroat = Garganta profunda) es cómo lo hace: «aprendiendo» como es la voz de diversos personajes a partir de unos pocos minutos de muestra e imitándolos en los resultados. Así que puede hacerse pasar con cierta facilidad por HAL9000, por el robot de Portal o por el mismísimo Doctor Who con su característico acento británico.

Entre los algoritmos que utiliza 15.ai están la separación de palabras en fonemas y la «detección de sentimientos» con DeepMoji. De hecho me pareció especialmente simpático que a partir de unas pocas frases extraiga los emoticonos más apropiados, con caritas tristes, enfadadas o divertidas, con el pulgar hacia arriba o el bíceps flexionado de «¡fuerza!» y cosas así.

Esto está bastante por encima de los chismes tipo Voicemaster, y dicen sus creadores que es muy superior a otros sistemas de conversión de texto a voz en lo que respecta a las emociones y el sentimiento. Personalmente encontré interesantes las pausas y el ritmo y que ciertamente se nota que según el contenido del texto se «interpreta» el resultado según lo que se intenta transmitir. Mejor que algunos actores y actrices sí que lo hace. Ojalá entrenarlo con la voz de Don Gregorio y ponerlo a prueba.

Relacionado:

Compartir en Flipboard Tuitear
Por @Alvy — 25 de Mayo de 2022

doodooc

Doodooc es una curiosa herramienta medio musical, medio matemática, medio artística para generar imágenes animadas a partir de la música. Podríamos considerarlo un chisme con el que experimentar y probar con diferentes melodías, plantillas y resoluciones, quizá sólo por probar, quizá con aplicaciones prácticas en videoedición. (Se puede probar gratis con algunas limitaciones y luego hay diferentes suscripciones de pago).

Se puede elegir entre más de 300 plantillas diferentes, que recrean fondos con efectos matemáticos, fractales y de partículas. Se pueden variar los colores para adecuarlos a los proyectos, luego subir la música (o dejar cualquier de las melodías de prueba) y finalmente los vídeos generados pueden tener resoluciones de hasta 8K.

Sus creadores lo denominan un visualizador de música generativo, es decir que las imágenes se generan a partir de la música y además son matemáticamente diferentes para cada proyecto.

Relacionado:

Compartir en Flipboard Tuitear
Por @Alvy — 24 de Mayo de 2022

Para darle una vuelta a su famosa campaña, la gente de Stop Killer Robots ha rodado un documental muy interesante, que además se puede ver con subtítulos en castellano. En él se utilizan dos formatos: los argumentos razonados de expertos y un juego de preguntas de tipo sí/no hechas a gente corriente. Ambos permiten ver cómo se llega –más o menos– a la misma conclusión, aunque lógicamente cada persona tenga su punto de vista y experiencia.

Código inmoral es un documental que contempla el impacto de los «robots asesinos» en un mundo cada vez más automatizado, en el que las máquinas deciden a quién matar o qué destruir.

Las decisiones automatizadas están llegando a todos los ámbitos de la sociedad. Desde los prejuicios preprogramados hasta la protección de datos y los problemas de privacidad, estos algoritmos tienen verdaderas limitaciones, especialmente cuando esa misma autonomía se aplica a los sistemas de armamento.

Las decisiones sobre la vida y la muerte no son blanco o negro, unos y ceros. Son complejas y difíciles. Reducir estas decisiones a procesos automatizados plantea muchos problemas legales, éticos, técnicos y de seguridad.

Aunque la parte argumental es estupenda, me gustó más la parte de las preguntas y respuestas, que me recordó a los dilemas y trilemas de aquellos experimentos filosóficos que ya comentábamos hace una década. ¿Matarías a una persona para salvar a cinco? ¿Y a quinientas? Aquí se utiliza un recurso similar: ir «cociendo a la rana poco a poco», en este caso a la creencias iniciales de la persona, añadiendo matices y variantes. Por ejemplo: aunque nadie mataría a un niño, reconocen que podrían matar en defensa propia, en una guerra por ejemplo, en cuyo caso se les pregunta ¿Y si la persona que te ataca fuera un niño soldado de 12 años? ¿Y si pudiera un algoritmo eliminarlo antes de que te atacara? Ah, ya no son tan fáciles ni binarias las respuestas.

Aunque hoy en día mucha gente confía en los algoritmos y los sistemas de inteligencia artificial («los robots», en este contexto) otras no tienen claro –o no se han preguntado nunca– hasta qué punto están cómodos con una recopilación de datos masiva, con la clasificación automática, con que esos algoritmos pueden discriminar y «juzgar» a la gente. Y esto vale tanto para contratar a alguien para un trabajo como para detectar terroristas o seleccionar objetivos legítimos en un escenario de combate.

Me ha parecido una iniciativa interesante y un buen formato para alimentar la mente con dolorosas píldoras de dudas, tener que razonar sobre ellas y darle una vuelta a la situación actual, que cambia cada día sin que apenas nos demos cuenta.

_____
Traducción de la cita (robotizada) DeepL.

Relacionado:

Compartir en Flipboard Tuitear
Por @Alvy — 19 de Mayo de 2022

A esta visita guiada al Laboratorio de Fabricación Avanzada de los Lawrence Livermore la denominan tour, y permite ver en poco más de cuatro minutos lo que se cuece en sus instalaciones. Es lo que yo llamo, con cariño, una «visita al zoo» guiada, de las cuales todos hemos disfrutado alguna vez y en las que quizá hayamos sido objetos de observación en otras.

A mí esas explicaciones rápidas y mundanas sobre lo que se hace en cada sitio me encantan. El laboratorio son unos 1.300 m² de mesas y armarios, llenos de artilugios con los que se fabrican cosas en muy variados materiales. La guía recalca con insistencia que «todo es muy avanzado», como su propio nombre indica y predominan las impresoras 3D y los chismes para trabajar con diferentes materiales: metales, polímeros y biomateriales. Son, según dice, «formas divertidas de fabricar cosas».

Hay una zona de metrología con reómetros y espectrómetros, además de microscopios y chismes para estudiar las propiedades mecánicas de los materiales. Una de las impresoras 3D cuenta con unas cámaras-escáner que al terminar el proceso miden el objeto resultante y si no tiene la precisión necesaria, lo tira a la basura y repite de nuevo variando parámetros hasta que consigue la perfección.

También hay algo llamado «fabricación mediante cápsulas» (que se utiliza para mediar las maneras de absorber y capturar CO₂) y otros de litografía axial computerizada. También los hay más mundanos y conocidos como la fabricación aditiva mediante capas de metales. Muchos de los instrumentos e impresoras 3D se pueden adquirir en las tiendas; otros son prototipos o fabricados en los propios laboratorios.

Relacionado:

Compartir en Flipboard Tuitear