Dígitos y trastos

Google, Amazon y Microsoft intensifican la guerra por la IA

La empresa de Satya Nadella presenta una serie de portátiles con una tecla específica para la inteligencia artificial

5 min
Satya Nadella, en el escenario de la conferencia de desarrolladores de Build, Microsoft.

BarcelonaCon el gancho de la modalidad generativa, capaz de inventarse textos, imágenes y vídeos, la inteligencia artificial (IA) ha monopolizado la actualidad tecnológica. En menos de dos semanas hemos asistido a anuncios globales por parte de Google, OpenAI y Microsoft; a la llegada a Europa de dos servicios que hasta ahora no estaban; a la aprobación de una directiva europea pionera sobre la materia; al cuestionamiento de los métodos de entrenamiento indiscriminado de algoritmos, incluso con la intervención de una estrella de Hollywood; a una guerra de precios en el mercado chino de la IA; ya la renuncia a aplicar criterios éticos en alguna de las plataformas más populares. Al fondo de todo ello existe una batalla comercial entre las tres grandes empresas occidentales de servicios en la nube y las dudas sobre la verdadera utilidad de las aplicaciones de IA generativa en la vida cotidiana.

Por orden cronológico, OpenAI abrió el fuego el lunes 13 presentando GPT-4o, una nueva versión del modelo de lenguaje extenso (LLM, en sus siglas inglesas) que impulsa, entre otros, el popular ChatGPT y el Copiloto que Microsoft ha incorporado a sus aplicaciones de navegación web y de ofimática. El nuevo GPT-4o es mucho más rápido que las versiones anteriores, y en los vídeos de demostración –de los que hay que dudar, porque todavía no sabemos en qué condiciones se rodaron– muestra una naturalidad y expresividad excepcionales en el diálogo verbal –también en catalán– con el usuario.

Con la breve presentación de GPT-4o, OpenAI pretendía –y consiguió– tomarle protagonismo en el acto del lunes 14 en el que Google centraba en la IA todo su congreso I/O para desarrolladores de aplicaciones y servicios, esforzándose en hacer visible su liderazgo tecnológico ante recién llegados menos prudentes como la mencionada OpenAI. De la crónica destaco la nueva versión del LLM privativo Gemini y el derivado de código abierto Gemma.

Esta misma semana, Microsoft ha ido en su congreso Build aún más allá. La empresa ha integrado tanto la IA generativa en el sistema operativo Windows 11 que ha presentado una nueva categoría de ordenadores portátiles, los Copilot+ PC, que incluso incluyen una tecla física para invocar las funciones de IA en las aplicaciones que en tengan. Además de los modelos Surface propios de la casa, ahora con procesadores Qualcomm que aseguran superar en rendimiento y autonomía a los MacBook de Apple con chip M3, otras marcas como Acer, Asus, Dell, HP, Lenovo y Samsung preparan también sus PC Copilot+ . De los aparatos hablaremos en unas semanas, cuando se presenten en la feria Computex de Taiwán, donde llegarán también los PC Copilot+ equipados con chips de Intel y de AMD. De los anuncios de Microsoft en el Build relacionados con la IA nos quedamos con la función Cocreator para generar y editar imágenes sintéticas directamente en el dispositivo; las Live Captions para traducir audio en tiempo real de más de 40 idiomas –el catalán no– al inglés; y la opción Recall, una especie de memoria de todas las operaciones que el usuario realiza con su Copilot PC, incluido todo el contenido que visualiza, y que amenaza con ser una pesadilla para la privacidad y un enorme agujero potencial de ciberseguridad .

En paralelo, estos días han llegado a Europa dos chatbots que todavía no podían utilizarse aquí: el Claude de la empresa Anthropic –que cuenta con el apoyo financiero de Google y Amazon, y que acaba de fichar Mike Krieger, cofundador de Instagram, como responsable de producto– y Grok AI de X, disponible para los usuarios de pago de la red de microblogs que antes conocíamos como Twitter.

También esta semana el Parlamento Europeo y el Consejo Europeo han acordado la versión definitiva del AI Act, la directiva comunitaria sobre IA, que es pionera en el mundo en la regulación de los usos de esta tecnología pero aún tardará dos años en desplegarse en el ámbito estatal. Veremos qué son capaces de hacer en este tiempo los promotores de la IA comercial, algunos de los cuales –es el caso de Sam Altman, de OpenAI– están demostrando en forma de hechos consumados una irresponsabilidad social que supera a la de Elon Musk, que en su momento ya nos había hecho pasar por buenos individuos como Mark Zuckerberg (que, por otra parte, promueve también un modelo propio de IA, Llama, que es de código abierto e incluye el catalán).

Dos ejemplos relacionados con Altman, también de estos días: Ilya Sutskever, uno de los cofundadores de OpenAI, ha dejado definitivamente a la empresa. Probablemente, la marcha está relacionada con el papel de Sutskever en la crisis interna de finales del año pasado, pero no ha pasado desapercibido que al mismo tiempo OpenAI ha aprovechado para desmantelar al equipo que investigaba sobre los riesgos de la IA a largo plazo. En este marco, la queja de la actriz Scarlett Johansson por el supuesto uso de su voz para entrenar la de GPT-4o no pasa de ser una anécdota, aunque el propio Altman presumiera de la novedad refiriéndose a Her, la película donde Johansson ponía la voz a la IA de quien el protagonista se enamoraba. En la práctica, OpenAI se está viendo obligada a negociar compensaciones con los principales grupos mundiales de prensa para entrenar a los GPT con su contenido.

Con toda probabilidad, la guinda de este pastel de IA la pondrá a mediados de junio el otro gigante tecnológico occidental: Apple negocia a dos bandas con Google y OpenAI para poner al día con la tecnología de una de ellas su ama de llaves digital Siri. A los catalanohablantes nos conviene que se decida por la segunda de las citadas empresas: GPT entiende y habla catalán, mientras que Gemini todavía no.

Infraestructura y negocio

Más allá de este alud de plataformas, servicios y opciones de IA, conviene recordar que por debajo hay un negocio para alimentar. Algunas funciones generativas se ejecutan directamente en los dispositivos –los móviles Galaxy de Samsung, los Pixel de Google, los iPads de Apple, los futuros PC Copilot+–, pero el grosor de la computación tiene lugar en los servidores de la nube, y más específicamente en los centros de datos de los tres gigantes del segmento: Amazon Web Services, Microsoft Azure y Google Cloud. También esta semana hemos tenido un recordatorio: el miércoles cayeron durante unas horas los servidores de Microsoft que impulsan el buscador Bing, los servicios de IA de la misma empresa y también el ChatGPT de OpenAI. De hecho, buena parte de la inversión nominal de Microsoft en OpenAI consiste en créditos de uso de la nube Azure.

Google, Amazon y Microsoft son los verdaderos protagonistas de la actual explosión de la IA, sea o no generativa. En sus servidores, que cada vez utilizan más procesadores de creación propia –pero también, previo pago de un suplemento, chips de Nvidia–, alojan tanto modelos de IA propios como de terceros: Microsoft apuesta fuerte por los de OpenAI, pero también ofrece el europeo Mistral, el Lama de Meta Platforms y el Falcon de Abu Dhabi. En la nube de Amazon se pueden consumir modelos de la casa, además del Claude de Anthropic. Y Google, además de Gemini, también invierte en el proyecto de investigación DeepMind. De esta forma, las empresas e instituciones que quieran explorar cómo aplicar la IA a su actividad tienen al alcance una gran variedad de combinaciones tecnológicas.

Un panorama competitivo que en China ya ha provocado una guerra de tarifas entre ByteDance, Alibaba, Baidu e iFlytek, que están aplicando descuentos de más del 95% en el precio de sus respectivas IA: Doubao, Qwen, Ernie y Spark.

stats