La IA, ¿salvavidas para las lenguas minoritarias?

Conversación con la directiva de Google y experta en lenguaje computacional Pilar Manchón

Pilar Manchón en el Talento Arena
4 min

Pilar Manchón (Sevilla, 1972) es filóloga e informática, y actualmente es la directora de estrategia de investigación en inteligencia artificial de Google desde el 2019. Aterrizó en Silicon Valley hace doce años y, desde entonces, su carrera en el mundo de la lingüística computacional no ha hecho más que créixer. como conferenciante en el Talent Arena, el congreso paralelo al Mobile que se celebró en Montjuïc. La carrera de Manchón no ha sido lineal y en una conversaciónEmpresas explica cómo llegó hasta dónde está ahora y qué puede aportar el mundo de la IA en el lenguaje.

"Cuando entré en la universidad, entré a físicas, pero tuve un accidente deportivo y me quedé fuera de órbita", relata. Para Manchón, este accidente supuso un antes y un después y decidió irse a Inglaterra a estudiar inglés. "Siempre me habían gustado los idiomas, y entonces decidí que no haría física, haría filología". Cuando llegó al último curso, se fue a Gante (Bélgica) con una beca a realizar traducción e interpretación. "Allí empecé a ver tecnologías del lenguaje que me parecieron muy interesantes, y empecé a descubrir una herramienta muy rudimentaria que existía en esa época con la que los traductores e intérpretes podían trabajar parcialmente con tecnología", explica.

"Empecé a tirar del hilo, a informarme, y me puse a estudiar lingüística computacional y, al final, acabé pidiendo una beca para realizar un máster en ciencia cognitiva y lenguaje natural en la Universidad de Edimburgo, donde aprendí a programar", relata Manchón. "Mi tesis de máster fue sobre las tecnologías del lenguaje, básicamente sobre cómo hacer que la síntesis de voz fuera mucho más natural. Y después me metí en un doctorado europeo, donde mi tesis doctoral fue sobre la inteligencia en sistemas de diálogo multimodales", detalla la experta. Luego, a través de una beca Fulbright fue a la Universidad de Stanford. Cuando terminó, volvió a Sevilla a terminar el doctorado, y se dio cuenta de que la tecnología en la que estaban trabajando en su grupo de investigación de la tesis doctoral era "muy superior" a las que había utilizado en América.

Ante esto, Manchón y su profesor de tesis acabaron sacando adelante una empresa con esta tecnología. "Diez años después conseguimos llevarla a escala internacional, y competir con otras empresas del sector. Todo culminó cuando conocimos a Intel; les gustamos mucho, tanto que quisieron invertir en nosotros. En ese momento hacía pocos años que había salido Siri (el asistente de voz de Apple). Entonces, Intel estaba a punto de lanzar su propio teléfono, Intel estaba a punto de lanzar su propio teléfono, empresa con el objetivo de convertirla en la Siri de Intel", explica. Finalmente, Intel no lanzó su teléfono, pero ésta es la historia de cómo los adquirieron, y de cómo Manchón acabó en Silicon Valley. De eso hace 12 años. "Trabajé varios años para Intel, después para Amazon. Más tarde estuve un año y pico con Roku, una empresa de estríming y de dispositivos de televisión. Y hace ya cinco años y medio que estoy con Google".

Confianza en la máquina

En Google, Manchón se dedica principalmente a la investigación aplicada en el campo del lenguaje computacional, que sirve sobre todo para generar confianza en la máquina. "Yo soy experta en comunicación con una máquina, y siempre he estado muy interesada en todos los temas que tienen que ver con la confianza. ¿Cómo desarrollamos confianza? Desde un punto de vista cognitivo, con entidades inteligentes que nos pueden hablar. Yo me he dedicado a desarrollar proyectos en los que hemos visto cómo evoluciona la confianza entre una persona humana y una entidad inteligente y cuáles. Esto se traslada a construir interfaces de voz, interfaces más naturales, con distintas áreas de producto dentro de Google. "También hemos entrado en temas de optimización en los procesos de incidencia en los grandes modelos. En traducción, por ejemplo, se están haciendo cosas con inteligencia artificial generativa. Y, en los últimos tiempos, más temas de factualidad, que es asegurarte de que los modelos digan la verdad, o también alineamiento con valores humanos", apunta.

La IA para las lenguas minoritarias

Como experta en lingüística computacional, Manchón defiende que la IA puede ser un gran salvavidas para las lenguas minoritarias. "Una de las grandes ventajas de estas tecnologías es que una vez tienes un modelo preentrenado para traducir, por ejemplo, de un idioma a otro, tienes una base muy fuerte para que con muy pocos datos el modelo aprenda otro idioma", explica. "Hay algunos idiomas de los que tenemos muchos recursos, como el inglés, el español o el chino. Pero hay muchos otros idiomas en el mundo, unos 7.000, y muchos de ellos tienen muy pocos recursos si los comparas con los idiomas mayoritarios. La ventaja que te ofrece este tipo de tecnología es que con pocos recursos puedes conseguir más de los que existen en ese idioma. Y ahora, precisamente con estas técnicas, con un modelo preentrenado, puedes utilizar estos pocos recursos para tener un grado de rendimiento muy alto.

El catalán ha sido uno de los idiomas más reivindicados por los usuarios en agentes de voz, como Alexa de Amazon, y todavía no hay fecha para que Alexa hable catalán. Según Manchón, esto es un tema de necesidades del mercado: "Desde el punto de vista de Google, lo que hacemos es hacer todos los idiomas que podemos lo más rápido posible, pero también de acuerdo con unas prioridades de mercado y producto. Yo entiendo que Alex debe hacer algo parecido", dice. "Cuando te toca de cerca porque es tu idioma o tu lengua, para ti es prioritario, pero desde el punto de vista de un mercado global, quizás no", apunta. "Hay muchas soluciones para este tipo de cosas. Hay muchos recursos gratuitos. Hay muchos modelos de libre distribución. Si hay mucho interés en un idioma, cualquiera, en el mundo académico, cualquier universidad, cualquier investigador, cualquier entidad pública, puede desarrollar su propio modelo y generar el idioma que sea, si quiere", rebate.

stats