La IA europea no hablará catalán si no es lengua oficial

La incorporación del catalán a las herramientas de traducción oficiales de la UE no es un problema de carencia de datos, sino de reconocimiento institucional

Campus de la UAB en Bellaterra.
22/03/2026
4 min

Que se pueda hablar en catalán en el hemiciclo y que los ciudadanos puedan realizar consultas y recibir respuestas en esta lengua es una de las consecuencias más vistosas y comentadas que se derivarían de la oficialidad del catalán en la Unión Europea. Pero a pesar de su importancia, práctica y simbólica, ese reconocimiento también tendría ventajas en el desarrollo tecnológico. De hecho, es un elemento vital para potenciar ese desarrollo.

"La oficialidad traería más demanda y más inversión sostenida en herramientas lingüísticas para el catalán, como traducción e interpretación automática", afirma Maite Melero, que dirige el grupo de investigación de Traducción Automática del AI Institute en el Barcelona Supercomputing Center (BSC-CNS) y es una de las responsables del proyecto AINA, que tiene como objetivo garantizar la presencia del catalán en la era digital.

Una de las herramientas que incorporaría el catalán sería el traductor neuronal de última generación eTranslation, el sistema de traducción automática oficial de la Comisión Europea. Actualmente, este sistema traduce hacia y desde las 24 lenguas oficiales de la UE, así como hacia el árabe, el chino, el islandés, el japonés, el noruego, el ruso, el turco y el ucraniano.

Una de las piezas esenciales de este sistema de traducción es la base de datos IATE (Interactive Terminology for Europe), que recoge toda la terminología utilizada en las instituciones europeas. Fue creado en 1999 y en su web da una respuesta explícita y clara sobre por qué ciertas lenguas no están incluidas: "La versión pública del IATE contiene las 24 lenguas oficiales de la Unión Europea".

Un obstáculo político, no tecnológico

La integración del catalán en eTranslation no supone un problema tecnológico. "Al principio nos decían que para incorporar el catalán necesitaban grandes corpus de datos paralelos entre catalán e inglés. Cuando en el contexto de AINA compilamos estos datos, la respuesta fue que ahora el obstáculo no era técnico sino político", explica Melero. El TERMCAT, en colaboración con la UOC, ha traducido los términos del IATE al catalán.

La presencia de nuestra lengua en eTranslation es primordial, porque este traductor no está sólo a disposición de las instituciones de la UE, sino que también se ofrece de forma gratuita a las administraciones públicas nacionales, entes locales y regionales, pequeñas y medianas empresas, el mundo académico y las organizaciones no gubernamentales. Imaginemos, pues, la repercusión que tendría.

Actualmente, el catalán dispone de una base sólida de recursos lingüísticos digitales. El proyecto AINA ha generado corpus –gran conjunto de textos en formato digital que permite entrenar herramientas lingüísticas– más que suficientes para poder incorporarlo a eTranslate ya otras herramientas de inteligencia artificial. Como ejemplo, AINA ha creado CATalog, un corpus textual masivo compuesto por más de 17.400 millones de palabras repartidas en más de 34 millones de documentos procedentes de fuentes muy diversas.

"El volumen y la diversidad que hay en los corpus en catalán es muy superior a los de otros idiomas", explica Albert Cuesta, periodista especializado en tecnología que ha elaborado el estudio La IA en el futuro de las lenguas europeas no hegemónicas, publicado recientemente por las fundaciones Irla, Coppietters y Accent Obert. "Los corpus del irlandés, el maltés, las lenguas bálticas, el esloveno, el eslovaco, el croata y el húngaro –añade– están bastante sesgados hacia el contenido jurídico, como fruto de su carácter oficial dentro de la UE, que obliga a traducir las normativas comunitarias".

Cuesta remarca que la UE ha sido pionera en la regulación de la IA con la ley de inteligencia artificial de junio de 2024. Y considera que "aunque la ley no menciona directamente las lenguas, puede favorecer la inclusión de las no hegemónicas. La Directiva de Servicios Digitales, que complementa la términos y condiciones en todas las lenguas oficiales de la UE, soporte al cliente multilingüe e interfaces localizadas".

Este experto en tecnología, firma habitual del ARA, considera que la oficialidad, aparte del prestigio que aportaría, haría más fácil uno de los objetivos de la Fundación Accent Obert, que trabaja entre otras cosas para promover la presencia del catalán en el ámbito digital, como aplicaciones o productos. El año pasado, por ejemplo, logró que la china BYD y Seat Cupra la incorporaran a sus automóviles. Pero remarca que "también juega a favor la demanda implícita de catalán por parte de los ciudadanos catalanohablantes, configurando sus ordenadores y móviles con el catalán como idioma preferido. Por eso tenemos en marcha la campañaconfigura.cat".

Todos estos avances necesitan investigación previa. Para Melero, la oficialidad permitiría obtener "muchos más datos paralelos y terminología institucional de calidad y daría un impulso a la investigación, porque el catalán estaría presente siempre en estándares de evaluación, en recursos abiertos y en proyectos europeos" investigación y la innovación con soluciones tecnológicas que incluyan nuestra lengua. Obviamente, respetar los derechos digitales de los catalanohablantes

stats