En Cataluña, hace unos meses, con un modelo anterior de ALIA y en colaboración con la Generalitat e instituciones como Eurecat/CIDAI, el BSC colaboró precisamente en un hackatón (Aina Hack) para encontrar soluciones a retos de la administración. Y ya está previsto que, en colaboración también con Eurecat y otros organismos para la transferencia tecnológica, se celebren reuniones con empresas para presentar el modelo y las oportunidades que les puede suponer. "Lo que se presenta hoy es la punta de lanza. A partir de ahí también tenemos modelos más pequeños y usables, desde modelos de voz a modelos para hacer traducciones, un abanico de modelos para que cada uno pueda adaptarlos a sus necesidades" , explica Cañigueral.
El ChatGPT más ambicioso de Europa entrenará en Barcelona y pensará en catalán
Sánchez anuncia un modelo de IA con las cuatro lenguas cooficiales y 150 millones de euros para potenciar su uso


BarcelonaHagan la prueba: entren en DALL-E, una suerte de ChatGPT de imágenes, y pidan a la aplicación que les haga un gigante de Messi. Seguramente, lo que les va a generar no tendrá nada que ver con lo que piensan. Esto es así porque no basta con que la inteligencia artificial (IA) sea capaz de entender una lengua, sino que también necesita su contexto, tanto cultural como social, para generar un contenido de valor. Aquí es donde entra en acción Alia 40B, un nuevo modelo de procesamiento de lenguaje natural que trabaja en catalán y las lenguas cooficiales del Estado (castellano, gallego y vasco) y que ha presentado este lunes el presidente español, Pedro Sánchez, junto con una movilización de 150 millones de euros para potenciar la integración y uso de la IA en las empresas españolas.
Aunque ya está disponible una versión muy avanzada, se espera que Alia esté terminada en marzo. El modelo se integra en un ambicioso proyecto también llamado ALIA que se enmarca en la Estrategia de Inteligencia Artificial 2024, aprobada en abril del pasado año por el gobierno de Pedro Sánchez. Barcelona Supercomputing Center (BSC-CNS) será el encargado de coordinar este plan. "Es el mayor modelo financiado públicamente en Europa que se ha hecho nunca", valora Marta Villegas, al frente de la unidad de tecnologías del lenguaje del BSC.
Sánchez ha destacado la apuesta de su ejecutivo por la supercomputación, los semiconductores y la IA, porque se ve una "oportunidad inalcanzable", y ha destacado las potencialidades de la IA si se hace un uso responsable. De hecho, de acuerdo con la apuesta europea por una IA transparente, responsable y al servicio de la ciudadanía, Alia se presenta como una infraestructura pública y abierta que persigue reforzar la soberanía tecnológica europea.
Entre los objetivos de Alia está crear y expandir una familia de modelos de procesamiento de lenguaje natural, que son la base de la mayoría de aplicaciones de IA generativa, como el popular ChatGPT, en las lenguas cooficiales de el Estado. En este sentido, ALIA 40B está especialmente enriquecido en catalán, con miles de millones de datos procedentes de centros de investigación, medios de comunicación públicos, artículos científicos, boletín de la Generalitat y repositorios de tesis doctorales, entre más. Esto le convierte en el mejor modelo de IA público disponible en nuestra lengua y se podrá aplicar en sectores clave de la economía catalana, desde la biomedicina hasta la industria.
El mayor modelo europeo público
"Es un hito muy importante, aunque no sea la versión final", destaca Villegas, quien añade que, además, en los próximos meses irán sacando modelos adaptados a distintos ámbitos especializados, como el jurídico y el tecnológico. "De la misma manera que en la época industrial fue fundamental que se construyeran carreteras y vías de ferrocarril para favorecer la actividad económica, en la era digital parece que buena parte de la actividad girará en torno a la IA", pone como metáfora a Albert Cañigueral, responsable de coordinación y desarrollo de tecnologías del lenguaje e inteligencia artificial del BSC. En este sentido, añade: "Tanto el gobierno español como el BSC han considerado que era necesaria una infraestructura pública de IA".
El modelo, uno de los primeros que ha pasado por el proceso de certificación de una agencia de certificación de IA estatal, se ha entrenado con 35 lenguas europeas y 92 lenguajes de programación. Las lenguas cooficiales del Estado suponen un 20% del total de los datos con los que se ha entrenado, aunque el catalán "sólo constituye un 1,97% de los datos de entrenamiento", puntualiza Ariadna Font i Llitjós, cofundadora y directora de Alinia.AI, aunque matiza: "En otros modelos [el porcentaje] es aún menos".
Para esta experta en IA ética, que no participa en ALIA, es crucial disponer de un modelo hecho "en casa" y entrenado con datos de "nuestra cultura". "Depender de modelos que vienen de EEUU o China es peligroso porque no tendrán ni nuestra cultura ni valores como eje central, ni mucho menos la lengua". Por eso, considera Font i Llitjós, es importante que tanto la administración como el BSC aporten el reto: "Hay que pensar que sobre este modelo otras empresas harán sus productos secundarios y, por tanto, es crucial tener una base de calidad, alineada con los valores de nuestra cultura".
Un chatbot para Hacienda y una app de atención primaria
La publicación del nuevo modelo permitirá ya varias aplicaciones. Por un lado, un chatbot interno para garantizar el trabajo de la Agencia Tributaria y su atención a la ciudadanía. Por otra parte, una aplicación para la atención primaria que, a partir del análisis avanzado de datos, permitirá un diagnóstico precoz y más preciso de las insuficiencias cardíacas. "Es necesario que impulsemos la integración de la IA en nuestros sistemas públicos para conseguir lo antes posible las ganancias en eficiencia y sostenibilidad", ha dicho Sánchez.
En este sentido, el presidente español ha anunciado que invertirán 150 millones de euros para potenciar la integración y el uso de la IA en las empresas españolas. "Pronto destinaremos 20 millones a 500 casos de uso en pequeñas y medianas empresas", con el objetivo de realizar un ecosistema más innovador y competitivo.