Por @Alvy — 24 de Marzo de 2023

AI Transcriptions

En AI Transcriptions se puede encontrar una herramienta realmente sencilla para obtener transcripciones de audio a texto, por ejemplo de una grabación de una reunión, una nota de voz de esas de media hora que te hayan enviado por teléfono o una conferencia que esté disponible como audio o vídeo.

Lo único que hay que hacer es:

  1. Arrastrar el fichero de audio (MP3, WAV, MP4 o MOV) sobre el navegador.
  2. Indicar el idioma (inglés, castellano, catalán, gallego u otros).
  3. Indicar si la voz es humana o artificial.

Lo del idioma supongo que es por darle una pista a la AI que procesa el audio –aunque sin duda podría adivinarlo por sí misma– y lo de la diferencia entre voz humana y artificial debe ser porque si la voz es artificial es mucho más fácil (por monótona) y tal vez se puedan emplear otros algoritmos optimizados al respecto.

En cualquier caso con los audios que ha probado he obtenido resultados muy satisfactorios, no sólo en inglés sino también en castellano. El inglés, naturalmente, funciona mejor que en castellano, pero en cualquier caso se las apaña bien.

Me ha sorprendido que funcione sin problemas con audios de entrevistas de audio con varias personas (ej. un programa de radio) porque las separa correctamente. Obviamente no es perfecto, sobre todo si se usan demasiados extranjerismos, voces dubitativas o cosas así, pero todo es cuestión de probar.

Lo mejor de todo es que esta web de Riverside, que se dedica al procesamiento de vídeos y podcasts, dice ofrecer transcripciones ilimitadas, gratuitas y que no hace falta ni registrarse, lo cual está muy bien para poder hacer pruebas y sacarle partido.

Relacionado:

Compartir en Flipboard Publicar / Tuitear