DeepSeek vuelve a hacer temblar los cimientos de la IA con V4

A comienzos del pasado año, Deepseek sacudió a la industria de la inteligencia artificial con un modelo de lenguaje comparable a los de OpenAI y Google pero creado con una fracción del presupuesto y distribuido libremente. Ahora acaba de presentar dos versiones preliminares de V4, la evolución del modelo que hizo temblar a medio Silicon Valley y provocó una caída histórica en la cotización de Nvidia y que podría, una vez más, alterar toda la estructura de negocio sobre el que se asientan los grandes modelos de lenguaje detrás de Claude o ChatGPT.

La startup china presenta dos versiones de su nuevo sistema con un rendimiento que ya rivaliza con GPT-5.4 y Gemini 3.1 Pro en programación y a un precio notablemente inferior al de sus competidores estadounidenses.

La versión Pro cuenta con 1,6 billones de parámetros de los que sólo 49.000 millones se activan en cada consulta gracias a una arquitectura de «mezcla de expertos», que reparte la carga de cálculo entre distintas piezas del modelo. Es, por un margen considerable, el mayor modelo de IA con pesos abiertos disponible hoy en día, por encima del Kimi K 2.6 de Moonshot AI y más del doble de su predecesor directo.

Junto a Pro, DeepSeek también ha lanzado V4 Flash, una variante más ligera con 284.000 millones de parámetros pensada para escenarios donde el coste y la velocidad importan más que la capacidad bruta.

Ambos modelos pueden procesar hasta un millón de tokens de contexto por consulta (un token equivale más o menos a una palabra), suficiente para leer de una sola vez el código completo de una aplicación de cierta envergadura o un libro entero. Trabajan, eso sí, sólo con texto, una limitación relevante frente a sus rivales cerrados, que ya entienden y generan audio, vídeo e imágenes.

Aún así, el salto frente a la versión anterior es sustancial. DeepSeek asegura que V4-Pro-Max supera a GPT-5.2 y a Gemini 3.0 Pro en algunas pruebas de razonamiento y que en competiciones de programación su rendimiento es comparable al de GPT-5.4, el mejor modelo de OpenAI hasta la semana pasada. La propia compañía reconoce, sin embargo, que en pruebas de conocimiento general sus modelos aún están por detrás de los líderes del sector. Acumulan entre tres y seis meses de retraso frente a los más avanzados.

Pero esos seis meses son un sacrificio que muchos estarán dispuestos a hacer porque el golpe real de V4 está en su precio. Los modelos son abiertos, así que cualquiera puede desplegarlos en su infraestructura pero DeepSeek también los ofrece como servicio. V4 Flash cuesta 0,14 dólares por millón de tokens de entrada y 0,28 por millón de salida, cifras que vienen a ser una sexta parte de lo que cuestan GPT-5.4 Nano, Gemini 3.1 Flash o Claude Haiku 4.5. Lo mismo puede decirse de V4 Pro, que se sitúa en 0,145 y 3,48 dólares respectivamente, también muy por debajo de Gemini 3.1 Pro, GPT-5.5 y Claude Opus 4.7.

Esa combinación de rendimiento y precio ha vuelto a colocar a los laboratorios chinos en el centro de la conversación en el sector de la IA. El lanzamiento llega apenas un día después de que el gobierno de Estados Unidos acusara a China de robar propiedad intelectual a laboratorios estadounidenses a escala industrial, utilizando miles de cuentas intermediarias para acceder a modelos propietarios. La propia DeepSeek ha sido señalada por Anthropic y OpenAI por «destilar» sus sistemas, una técnica que consiste en entrenar un modelo nuevo a partir de las respuestas generadas por otro ya existente, algo que las dos empresas estadounidenses prohíben expresamente en sus términos de uso.

Tecnología – Píxel