Por @Alvy — 23 de Febrero de 2023

Utilizando el servicio de síntesis de voz Prime Voice de ElevenLabs, Joseph Cox de Motherboard consiguió entrar en su banco con una muestra de su voz sintetizada que había creado anteriormente. Lo cual quiere decir que si alguien consigue hacerse con una muestra suficientemente buena de la voz de otra persona puede no tener problemas en crear un fake suficientemente realista como para pasar por alto algunos sistemas de autenticación. Ya lo habíamos visto venir. Y parece que funciona, a menos que tenga acento escocés, claro.

Para hacerlo simplemente tuvo que llamar al banco (el Lloyd’s Bank) y seguir las instrucciones que sistema contestador automático le iba dando: «indique su cuenta, fecha de nacimiento, frase de contraseña…» En vez de hablar, él iba tecleando los textos de respuesta en el sintetizador. Su voz clonada y depurada mediante inteligencia artificial resultó ser un fake de suficiente calidad como para que el reconocimiento biométrico no lo detectara y le dejara entrar hasta la cocina.

El mejor detalle de todo el proceso es que la frase para autenticar era «mi voz es mi pasaporte», que es exactamente la misma que utilizaban en la película Sneakers, una favorita de esta casa. Allí Mary McDonell graba en una cinta a un despreocupado directivo haciéndole pronunciar todas las palabras clave de la frase; luego el equipo de hackers corta y pega los trozos de audio para crear una rudimentaria pista de audio precisamente con «mi-voz-es-mi-pasaporte», que aunque suena a lata acaba funcionando.

He estado cotilleando un poco el servicio de ElevenLabs y la verdad es que la calidad de síntesis es bastante buena e incluye opciones gratuitas y de pago para crear nuevas voces, de momento sólo en inglés, pensando en generadores de voz de calidad para audiolibros, anuncios, narraciones, vídeos y similares, pagando por caracteres/palabras/horas según se necesite.

(Vía @minipetite + @JosephFCox + Motherboard.)

Relacionado:

Compartir en Flipboard Publicar / Tuitear