DEEPSEEK: LA APLICACIÓN CHINA QUE PUEDE EMULAR EL RENDIMIENTO DE CHATGPT, POR MUCHO MENOS COSTO

16

OpenAI acusa a sus rivales chinos de usar su trabajo para desarrollar productos de IA. El estatus de las empresas estadounidenses líderes mundiales en IA se han visto socavadas drásticamente esta semana por la aparición de DeepSeek, una aplicación china que puede emular el rendimiento de ChatGPT, aparentemente a una fracción del costo.

Desde la aparición de Tiktok, China ha demostrado que viene a ganar la guerra tecnológica con el rival que se le cruce, aunque sea americano y aunque sus centros de mandos estén ubicados en la capital mundial digital: Silicon Valley. Y ahora están sacudiendo el mercado mundial con otro golpe atronador, la aparición de una inteligencia artificial “barata” que esta igual de entrenada que las de ChatGPT y en menos tiempo por la mitad de precio. Incluso menos.

Hace dos años OpenAI revolucionó el mundo con la aparición de su bot conversacional y consiguió el efecto Coca-Cola con su producto estrella, ChatGPT. Pero era obvio que los chinos no se iban a aquedar mirando pasar el desfile y el nuevo bombazo definido como “efecto Bruce Lee” ironiza una nota del profesor Eduardo Garrido Merchán, de la Universidad Pontificia Comillas, lo han dado DeepSeek-R1 y Qwen 2.5, increíblemente baratos en su desarrollo y de código abierto. Ambos, made in China.

Lo que hace atractivo a DeepSeek-R1 es que cuenta con una interfaz gráfica muy similar a ChatGPT, y se puede utilizar libremente desde su página web. Ahora serán los usuarios quienes decidan si se quedan o no, pero su atractivo parece irresistible: es gratis, y seguirá siendo gratis. ChatGPT no lo es si se usa con todas sus prestaciones, y Gemini dejará de serlo en cuanto pase su periodo de fidelización.

Pero si con eso no era suficiente todavía faltaba lo más abrumador de la llegada de DeepSeek y es que ha tumbado a un gigante. La salida a la calle del modelo chino ha provocado un desplome del precio del todopoderoso fabricante de chips Nvidia de más del 16 % en el momento de la publicación de la nota del profesor Merchán (cae en picado por minutos). Nvidia ha perdido U$S 700.000 millones de dólares en menos de 24 horas. Estamos ante la mayor pérdida de capitalización bursátil de la historia.

¿Por qué es tan barato DeepSeek?

En primer lugar, sus desarrolladores han reducido enormemente el coste de entrenamiento del modelo en relación con su rendimiento. Según la propia DeepSeek, han empleado U$S 5,57 millones de dólares. Para que se entiendan estas cifras, este gasto supone menos de una décima parte del gasto del modelo de pago de la empresa irónicamente llamada OpenAI.

El entrenamiento, siempre según DeepSeek, ha durado 55 días, utilizando un conjunto de 2.048 unidades de procesadores gráficos H800 del fabricante de chips estadounidense Nvidia, con 671 billones de parámetros. También hay versiones destiladas más pequeñas. De hecho se está replicando el entrenamiento completo de DeepSeek-R1 en Github, una plataforma de desarrollo colaborativo, lo que confirma que estamos ante una IA abierta y libre.

Además, este modelo también es 10 veces más pequeño que los de OpenIA, lo que le hace mucho más rápido respondiendo a prompts (instrucciones). Pero la cosa no termina aquí.

La empresa responsable de DeepSeek ha publicado su modelo con licencia MIT, es decir, abierto, y un artículo técnico detallando el completo funcionamiento del modelo para que pueda ser replicado. Todo un regalo para la comunidad científica y una bomba en la línea de flotación de las grandes corporaciones o Big Tech estadounidenses y de los fabricantes de chips, que con excepción del modelo Llama de Meta, se quedan un paso atrás.

Han visto como una startup china es capaz de publicar un modelo libre cuyo rendimiento está a la altura de sus más sofisticados modelos de licencia propietaria.

Dolor de cabeza para el recién asumido Trump

La reacción del público ante el nuevo modelo largo de lenguaje de DeepSeek no se hizo esperar. En la primera semana de mandato de Donald Trump, justo cuando Sam Altman, CEO de OpenAI, subía un video a la red social X diciendo que la sociedad debía repensar el contrato social actual para un futuro desarrollo de las inteligencias artificiales, China se asoma colapsando el mercado con una sola muestra del gran desarrollo tecnológico que muchas veces occidente se obstina en ignorar.

Trump también había anunciado el proyecto de IA Stargate, incorporando a las Big Tech en una alianza sin precedentes, con una inversión de capital estatal de U$S 500.000 millones de dólares. Y entonces, una startup china es capaz de elaborar, y liberar, un modelo con una fabulosa implementación y con una idea técnica feliz, extremadamente eficiente.

Incluso Yann LeCun, jefe de IA de Meta, felicitó al equipo chino por un logro que ha supuesto un auténtico terremoto para la comunidad mundial experta en inteligencia artificial.

Estamos ante una muestra de que las Big Tech y, en general, la industria tecnológica estadounidense quizá han subestimado al gigante asiático.

Las caídas en bolsa pueden en parte ser explicadas por la fabulosa recepción del pueblo norteamericano ante el nuevo modelo largo de lenguaje. DeepSeek se ha convertido en la aplicación más descargada en la App Store de Apple este fin de semana en Estados Unidos, ¡por delante de ChatGPT!

La innovación tecnológica desplegada por el gigante asiático en multitud de campos está verdaderamente a la altura de Estados Unidos. Como ejemplo de ello se puede citar el prototipo EAST, que ha logrado mantener un sol artificial de plasma de alto confinamiento en estado estable durante 1.066 segundos, lo que supone un hito clave para conseguir energía de fusión, limpia e inagotable.

En lo que a mí respecta, como investigador, aseguro que ya sigo con mucha atención a las empresas chinas, puesto que su potencial innovador es indiscutible.