Por @Alvy — 2 de Enero de 2018

Tacotron 2 vs Human

Haz la prueba y compara la calidad de la síntesis de voz de este sistema llamado Tacotron 2 con el de Siri, Cortana o la entrañable «borracha de Google»: Tacotron 2: audio samples from natural TTS synthesis. La diferencia es tan grande que es difícil distinguir la voz real de los ejemplos sintetizados. (Prueba con los cuatro clips que hay al final, son dignos de Test de Turing, como decía @alexjc.)

Esta creación artificial utiliza una refinada arquitectura de redes neuronales para lograr una voz más humana en la conversión texto-a-voz (TTS). forma parte de un trabajo publicado en ArXiv bajo el enrevesado título de Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions.

Según explican Tacotron aprende a pronunciar según la semántica de las frases, tiene en cuenta la puntuación y pausas, es capaz de pasar por alto pequeñas faltas de ortografía y puede aprender la entonación y acentuación a partir de las muestras con que se entrena. ¡Ah! Y también puede pronunciar términos complicados como «otorrinolaringología» sin pestañear.

Relacionado:

Compartir en Flipboard  Compartir en Facebook  Tuitear

Microsiervos Selección


Thinking Machines

EUR 10,75

Comprar


Our Robots, Ourselves

EUR 18,72

Comprar


Amazon Associates

Los productos aquí enlazados están a la venta en Amazon. Incluyen un código de Afiliado Amazon Associates que nos cede un pequeño porcentaje de las ventas. Los productos están seleccionados por los autores del blog, pero ni Amazon ni los editores de los libros o fabricantes de los productos participan en dicha selección.

Más libros y productos en:

Microsiervos Selección