TECNOLOGÍA

Dos estudiantes ponen fin al eterno drama de transcribir audios

Happy Scribe es un proyecto tecnológico creado por un catalán y un francés capaz de convertir en texto audios en 80 idiomas

Paula Solanas
3 min
Dos estudiantes ponen fin al eterno drama de transcribir audios

Una de las lamentaciones que unen a los periodistas de cualquier redacción del mundo es el tiempo dedicado a lo largo de la carrera profesional a transcribir horas y horas del audio de entrevistas. Ahora en Marc Assens y elAndré Bastié, un catalán y un francés que no llegan al cuarto de siglo, han encontrado una solución. El primero, estudiante de máster en la Dublin City University, debía transcribir una docena de entrevistas para un trabajo de la facultad. Harto de esta tarea eterna, decidió crear un algoritmo que automatizara el proceso junto a su compañero de piso, estudiante de Erasmus del grado de ingeniería de telecomunicaciones especializado en inteligencia artificial.

En un primer momento, la aplicación era un puro código sin interfaz, pero rápidamente se esparció por la facultad. Entonces, Assens y Bastié decidieron darle forma y ofrecer este servicio de forma gratuita a través de una página web. Happy Scribe -así han bautizado la idea- es una plataforma capaz de reconocer el audio de 80 idiomas y dialectos diferentes y convertirlo en texto. Así pues, el usuario sólo tiene que adjuntar un archivo de audio de un máximo de 80 minutos -actualmente sólo admite MP3, pero están a punto de añadir más formatos- y la página envía un enlace con la transcripción cuando está lista (tarda entre diez minutos y un cuarto de hora).

Una vez transcrito, la aplicación abre un editor para retocar aquellas partes que no se han interpretado de manera correcta. ¿Cómo de cuidado es el resultado? Assens explica que la plataforma funciona con machine learning, es decir, que aprende continuamente a medida que se vierten más y más transcripciones.. Por eso espera que en los próximos meses el funcionamiento mejore visiblemente. "La creamos en tres o cuatro días mientras estábamos de exámenes", explica el estudiante por Skype desde su piso dublinés.

El proyecto también llegó a oído de la publicación estadounidense Poynter. Esto provocó una lluvia de solicitudes que saturó la página y fue entonces cuando los creadores decidieron poner un pequeño precio en el servicio para financiar el mantenimiento de un servidor más potente. “Aún un 70% de los clientes que recibimos son de Estados Unidos”, bromea el estudiante. Actualmente, la plataforma cobra nueve céntimos por cada minuto de transcripción, es decir, convertir un audio de 30 minutos cuesta menos de tres euros.

El negocio de Scribe está claro: en el mercado hay pocas soluciones que permitan automatizar este proceso y las que lo hacen lo ofrecen a un precio elevado que les aleja del público masivo, explica Assens. "Hay servicios que requieren incorporar personal humano y pueden llegar a cobrar entre 40 y 60 euros por una transcripción", añade. En los últimos dos meses, la plataforma ha tenido 4.000 clientes y la arquitectura de la web permite que miles de personas puedan utilizarla a la vez sin que se colapse. Ahora quieren incorporar mejoras en el editor, tales como una herramienta que permita saber en qué punto del audio se ha pronunciado cada palabra transcrita.

El éxito de Happy Scribe ha cogido por sorpresa -y en plenos trabajos finales- a sus fundadores, pero Assens asegura que el proyecto tendrá continuidad. De momento, ambos volverán a Barcelona para continuar trabajando, ya que Assens empezará en septiembre el máster en visión por ordenador de la UAB y la UPC. De hecho, este estudiante de Cerdanyola del Vallès ya había intentado crear una start-up en el laboratorio de innovación del Canódromo de Barcelona que no terminó de emprender el vuelo. Según Assens, Happy Scribe es sostenible actualmente, lo que permitirá a los fundadores buscar inversores para hacer crecer el proyecto "sin correr demasiado".

stats