Carles Sierra: "DeepSeek abre un camino en el que Europa se podrá enganchar para generar modelos a un precio más razonable"
Director del Instituto de Investigación en Inteligencia Artificial
Carles Sierra (Barcelona, 1963) es un investigador y científico catalán y uno de los grandes expertos en inteligencia artificial (IA) de nuestro país. Es director del Instituto de Investigación en Inteligencia Artificial y profesor del CSIC y también profesor adjunto de la Universidad de Tecnología de Sydney (UTS). Sierra, que ya firmó una carta con cientos de expertos en IA que pedía frenar la carrera por la IA generativa de aplicaciones como ChatGPT, considera que "se está corriendo demasiado" y que hay que calmar las aguas, pero ve la irrupción de la china DeepSeek como una oportunidad para democratizar la IA. Sin embargo, lo tiene claro: "Estamos en una burbuja".
¿Cuál diría que es la situación de la IA ahora mismo?
— Estamos en época convulsa porque durante décadas los progresos han ido siendo progresivos, algunos han sorprendido mucho, pero ahora ha habido una sorpresa generalizada, sobre todo por los buenos resultados que estos sistemas de IA generativa han logrado. Son buenos resultados, pero llevan implícitos muchos interrogantes.
¿Cómo ahora?
— A estos modelos se les han atribuido una serie de propiedades que carecen. La gente ha creído que estos sistemas decían la verdad y no es cierto. Intentan producir contenido que sea creíble, pero no necesariamente cierto. Esta confusión ha creado falsas expectativas sobre estos modelos. Por otra parte, ha puesto en evidencia la debilidad de la protección que nos ofrecen los gobiernos, los estados, la debilidad de proteger al ciudadano del mal uso de estas tecnologías. No estamos suficientemente protegidos.
Usted fue uno de los firmantes, hace dos años, con cientos de expertos de todo el mundo, de una carta que pedía detener la carrera de la IA generativa. ¿Cree que se está corriendo demasiado?
— Sí. Ha ocurrido que hay una serie de empresas estadounidenses que se lanzaron a esta carrera porque hay mucho dinero implicado. El primero es quien se lleva el pedazo grande de la tarta. OpenAI lanzó el ChatGPT sin tener las salvaguardias necesarias a nivel de protección, sin estar seguros de que lo funcionaría de manera correcta. Por tanto, se ha abierto una caja de pandora con el uso de estos sistemas. Lo que se pedía en aquella carta era simple: "Escuche antes de empezar una carrera desenfrenada, reflexionamos un poco y vemos qué límites ponemos a esta tecnología". Las empresas, evidentemente, no se inmutaron y la cosa continuó.
¿Estamos en una burbuja?
— Sí, por supuesto. Las empresas norteamericanas han hecho unas inversiones tan enormes que ahora, el retorno de ese dinero por parte de los inversores, se ve muy difícil, porque estamos hablando de mucho dinero; se están invirtiendo unos 100.000 millones de dólares al año en IA. Por tanto, es una apuesta muy fuerte de los inversores y que ha hecho que estas empresas tengan un valor en bolsa absolutamente desorbitado. Considero que esto es una burbuja. Basta con ver qué pasó en bolsa hace pocos días. Las cosas se han calmado un poco en la bolsa ahora, el dinero tiene mucho miedo siempre. Debemos poner algo de tranquilidad.
¿Se está trabajando la ética en la IA?
— No ha terminado de funcionar, pero en Europa se ha trabajado la creación de una ley sobre la inteligencia artificial que pone límites en el uso que se le da en según qué áreas. Por tanto, les dicen, mira, en sanidad esto se puede hacer o esto no se puede hacer, y si se hace esto debe ser con ciertas garantías, etcétera. En educación, lo mismo. Ésta es la aproximación europea. La aproximación norteamericana es la de no regular, la idea de que el mercado se regula solo. Es una visión distinta.
— En China, en cambio, siempre se ha hablado de que es un régimen de control del ciudadano y de no permitir libertad. Sí es cierto que en este sistema [el DeepSeek] hay algunos elementos de censura, porque si le preguntas qué pasó en la plaza Tiananmen te dice que no responde porque es política, pero si le pides que se hable de China, te dice que es un sitio maravilloso. Los ciudadanos debemos estar informados.
Por tanto, ¿la gestión de regulación que se está haciendo desde Europa es buena?
— La gestión que está haciendo Europa es intentar proteger a los ciudadanos a base de regulaciones, que han sido criticadas por unos y agradecidas por muchos, y esto se hace en contraposición en Estados Unidos, donde lo que se intenta conseguir es la desregulación de la tecnología para que las empresas ganen aún más dinero y que no establezcan ningún tipo de salvaguarda a los usuarios de la tecnología. Necesitamos que las aguas se calmen un poco para ver claramente cuáles son los beneficios que nos puede dar la IA generativa, y cuáles son los riesgos y los peligros, y ponerle un poco de orden.
¿Qué consecuencias puede tener DeepSeek en el avance de la IA?
— En China ha habido una serie de ingenieros que, utilizando una programación inteligente y muy creativa en estos sistemas, han logrado obtener resultados muy similares a los de las grandes empresas estadounidenses con muchos menos recursos. También a la hora de crear el modelo, porque existe la parte llamada de entrenamiento del modelo, que es cuando das una serie de datos y el modelo se construye a base de muchísimas horas de procesamiento de ordenador. Pues han logrado estabilidad numérica pese a utilizar técnicas u operaciones aritméticas más pequeñas que las que se utilizan en estos modelos estadounidenses competitivos. Y esto les ha permitido, de forma mucho más eficiente, mucho más rápida, conseguir modelos tan o más cuidadosos que los modelos estadounidenses que han costado, diría yo, veinte veces menos en cuanto a dinero y horas de procesamiento o de energía. Básicamente, lo que han utilizado es el ingenio para que los sistemas sean más eficientes.
¿Qué implica que sea un modelo abierto?
— El chino es un modelo open source, un modelo abierto, pero no es el único. Hay muchos modelos abiertos estadounidenses: por ejemplo, hay uno conocido llamado Llama. Pero el chino es un modelo abierto que funciona igual de bien que los modelos comerciales. Éste es el punto clave. Un ChatGPT me pide 20 dólares al mes para que pueda realizar una serie de consultas, pero éste me lo dan gratis y además lo puedo descargar en mi ordenador y asegurarme de que nadie tendrá acceso a mis datos. Esto ChatGPT no te lo ofrece. Esto también es un elemento muy interesante porque la gente teme ser controlada.
¿La tecnología que ha utilizado DeepSeek, al ser un modelo abierto, la pueden adoptar otras?
— Sí, ocurre que ellos lo que han hecho open source es el modelo. Han entrenado un modelo. Pero el programa que genera el modelo no está abierto, es su secreto industrial. Esto ninguna empresa lo está dando. Pero hará la tecnología más barata porque generar un nuevo modelo les cuesta veinte veces menos que la que teníamos hasta ahora.
¿Qué posición ocupa Europa en todo esto?
— Lo cierto es que Europa no genera modelos de lenguaje del nivel de los estadounidenses ni los chinos. Aquí las cosas son más lentas, siempre hay que pasar por muchos procesos de decisión y nunca hay dinero suficiente para hacer cosas más especulativas. Quizás no han tenido las ideas que han tenido estas empresas chinas. No hemos sabido enfocarnos en ver qué podíamos hacer con un hardware más malo, con menos recursos... La cuestión es que aquí vayamos un poco atrasados con el tema de la generación de estos sistemas. Pero creo que los chinos con DeepSeek abren un camino en el que Europa podrá engancharse para generar modelos a un precio más razonable. Pienso que es una buena noticia en el sentido de que habrá más competencia entre las empresas y podremos tener, también los académicos, acceso a estos modelos para realizar otros tipos de aplicaciones.
¿Cuáles son las aplicaciones que cree que van a avanzar más?
— La robótica. La interacción robot-hombre en el futuro estará clarísimamente intermediada por modelos de lenguaje como éstos que vemos. Es un cambio radical que estos modelos llevarán a ese área. Es la idea de que una persona mayor interactúe con un robot que le ayuda, que pueda tener una conversación. Esto está mucho más cerca gracias a estos modelos. También en las tecnologías de la lengua será otra importante aplicación. La traducción, prácticamente en tiempo real, la conseguiremos gracias a estas herramientas. También en educación, en medicina, en todas las áreas que hagan falta resúmenes de documentos... Hay muchísimas aplicaciones que se pueden hacer.