Por Nacho Palou — 15 de Enero de 2018

Los ModQuad son “estructuras modulares volantes” que se ensamblan en pleno vuelo, en el aire, para realizar tareas cooperativas — como coger objetos o formas estructuras complejas. El sistema ModQuad, según Quartz, está inspirado “en sistemas biológicos como las colonias de hormigas o de abejas, donde el esfuerzo colectivo permite transportar material o construir grandes estructuras. De forma parecida a cómo las hormigas son capaces de construir puentes para superar una corriente de agua.”

Según sus desarrolladores, investigadores de la universidad de Pennsylvania, los ModQuad son “ágiles módulos volantes que pueden moverse fácilmente en un entorno tridimensional. Cada módulo se basa en una plataforma cuadrotor dentro de un marco cuboidal que le permite acoplarse a otros módulos a través de las caras verticales de la estructura. De este modo un enjambre ModQuad es capaz de montar rápidamente estructuras volantes en el aire combinando diversas unidades como si fuera piezas de construcción.”

Compartir en Flipboard  Compartir en Facebook  Tuitear
Por Nacho Palou — 12 de Enero de 2018

Ai determina acento ingles

La aplicación web MyAccent de Cambridge Consultants es capaz, se supone, de descodificar tu acento en inglés y determinar si lo hablas con acento americano o con acento británico, o con un acento intermedio.

Para detectarlo hay que leer un frase en inglés a partir de la cual el sistema determina “a qué inglés” le suena, identificando individualmente la pronunciación del sistema. Luego es colaborar con el aprendizaje de MyAccent indicando si se trata de acento americano, británico o en realidad corresponde a otra parte del mundo — aunque no permite indicar exactamente dónde. No tiene tampoco mucha utilidad pero está simpático y, hey, tienes la ocasión de “enseñar” a una máquina.

Compartir en Flipboard  Compartir en Facebook  Tuitear
Por Nacho Palou — 9 de Enero de 2018

Imaginary Soundscape, de Nao Tokui, es una aplicación web que añade automáticamente sonido “artificial” generado mediante aprendizaje automático para ambientar, según el contenido, las imágenes de Google Street View,

Según Fast Co. Design el resultado es una iteración totalmente funcional de Google Street View, pero con banda sonora. Puedes escribir cualquier dirección del mundo y verla ambientada con uno de los 15.000 sonidos extraídos de una biblioteca de código abierto. O puedes simplemente presionar el botón "random" y listo.

Imaginary Soundscape funciona en PC (con los navegadores Chrome y Firefox) y resulta divertido hasta cuando falla en ambientar las imágenes con sonido.

Compartir en Flipboard  Compartir en Facebook  Tuitear
Por @Alvy — 2 de Enero de 2018

Tacotron 2 vs Human

Haz la prueba y compara la calidad de la síntesis de voz de este sistema llamado Tacotron 2 con el de Siri, Cortana o la entrañable «borracha de Google»: Tacotron 2: audio samples from natural TTS synthesis. La diferencia es tan grande que es difícil distinguir la voz real de los ejemplos sintetizados. (Prueba con los cuatro clips que hay al final, son dignos de Test de Turing, como decía @alexjc.)

Esta creación artificial utiliza una refinada arquitectura de redes neuronales para lograr una voz más humana en la conversión texto-a-voz (TTS). forma parte de un trabajo publicado en ArXiv bajo el enrevesado título de Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions.

Según explican Tacotron aprende a pronunciar según la semántica de las frases, tiene en cuenta la puntuación y pausas, es capaz de pasar por alto pequeñas faltas de ortografía y puede aprender la entonación y acentuación a partir de las muestras con que se entrena. ¡Ah! Y también puede pronunciar términos complicados como «otorrinolaringología» sin pestañear.

Relacionado:

Compartir en Flipboard  Compartir en Facebook  Tuitear