Una empresa china de inteligencia artificial, DeepSeek, ha creado una familia de modelos de lenguaje LLM de gran tamaño. Fue fundada y financiada por el fondo chino de capital riesgo High Flyer. Con 671.000 millones de parámetros, la última versión de sus modelos de lenguaje, DeepSeek-V3, está a la altura de otros lanzados el año pasado por las empresas occidentales, como el de Qwen y OpenAI.
A diferencia de ellos, DeepSeek publica los suyos en código abierto. Lo ha liberado bajo una licencia MIT, lo que significa que no se vende sino que se regala. Cualquier investigador o empresa puede usar, modificar y distribuir su modelo sin restricciones.
Además, la empresa china ha sido capaz de fabricar su modelo a un coste cien veces más reducido que los occidentales. El V3 se entrenó en 55 días con un conjunto de datos de 14,8 billones de tokens.
High Flyer utilizó el aprendizaje automático para especular en bolsa con la cotización de las acciones y en 2019 se pasó a la inteligencia artificial. En 2021 todas las estrategias de High Flyer se basaban en la inteligencia artificial.
De momento DeepSeek se centra únicamente en la investigación y no tiene planes de comercializar sus modelos, por lo que la competencia aún puede respirar aliviada. Pero el mercado de la inteligencia artificial se puede hundir. Miles de millones en inversiones de las empresas tecnológicas occidentales pueden acabar en el cubo de la basura, especialmente Meta/Facebook, Google y Microsoft. La propia DeepSeek se ha puesto a la altura de los más grandes con una inversión mínima.
Las primeras empresas que han empezado a tener problemas son las chinas. Alibaba ha reducido los precios de sus modelos de lenguaje hasta en un 85 por cien. ByteDance, Tencent y Baidu tuvieron que hacer lo mismo.
El Proyecto Stargate de Trump también puede acabar en la basura, junto con sus 500.00 millones de dólares de presupuesto. Empresas más pequeñas van a poder competir con los grandes monopolios tecnológicos.
Se puede hacer más con menos
Se puede hacer más con menos. La tecnología china ha demostrado que no son necesarios chips de alta gama porque los antiguos pueden seguir rindiendo de forma muy eficaz, mientras los nuevos no acaban de funcionar. En Asia se quejan de que los chips Blackwell de última generación de Nvidia, presentan problemas.
Eso ha llevado a importantes clientes, incluidos Microsoft, Amazon, Google y Meta, a recortar pedidos, lo que afecta no solo a las ventas y los ingresos de Nvidia, sino también a sus proveedores.
A pesar del bloqueo económico y las sanciones, China está a punto de ganar la batalla de la inteligencia artificial, poniendo a la industria occidental en serios apuros. La tecnología china va a introducirse en los mercados occidentales y no va a ser posible frenar su llegada con castigos ni medidas represivas.
“Si las mejores tecnologías abiertas provienen de China, es probable que muchos desarrolladores en todo el mundo construyan sus sistemas sobre estas bases. Esto podría posicionar a China como un líder en investigación y desarrollo de IA, desafiando la hegemonía de Estados Unidos en este campo”, reconoce un periódico económico (*).
ChatGPT Pro cuesta alrededor de 200 dólares al mes, lo que reduce el mercado de usuarios de la inteligencia artificial a un segmento reducido de la población. Por el contrario, China devuelve la informática a su punto de partida: el modelo Linux. La propiedad industrial y las patentes son una rémora para el progreso. La ciencia y la ingeniería deben ser gratuitas y abiertas porque es lo que favore un desarrollo más rápido. La inteligencia artificial pronto será casi gratuita para todos en China.
La accesibilidad de DeepSeek no se limita al código. La empresa ha reducido el tamaño del modelo a configuraciones que pueden ejecutarse incluso en ordenadores de sobremesa, lo que abre la puerta a que pequeños desarrolladores y empresas emergentes utilicen inteligencia artificial avanzada sin necesidad de invertir en grandes equipos informáticos.
La inteligencia artificial tampoco nace: se hace
Los modelos de inteligencia artificial son como los deportistas: se tienen que entrenar. Es la parte invisible del producto, porque el espectador sólo a acude a los estadios durante las competiciones oficiales.
Lo mismo ocurre con la inteligencia artificial. El entrenamiento es su alimento. Es imprescindible para mejorar el producto, y el coste no es pequeño. Se necesitan recursos informáticos, energía, tiempo y, sobre todo, un trabajo especializado. Los ingenieros son los entrenadores de la inteligencia artificial. Ajustan los modelos, mejoran su precisión y minimizan los errores.
Las empresas occidentales suelen utilizar superordenadores con más de 16.000 chips para entrenar sus modelos. DeepSeek-V3 lo ha logrado utilizando solo 2.000 chips de Nvidia.
Hasta la llegada de DeepSeek los altos costos del entrenamiento eran preocupantes, ya que solo unas pocas empresas con grandes recursos financieros podían desarrollar y mantener los sistemas.
Los modelos de inteligencia artificial con cada vez más complejos y requieren más tiempo y más recursos. El costo de entrenarlos también ha ido aumentado drásticamente. El entrenamiento de Gemini (Google) costó entre 30 y 191 millones de dólares, sin contar los salarios, que pueden representar hasta la mitad del coste total.
Por su parte, Sam Altman, el director de ChatGPT, confirmó que la versión 4 superó los 100 millones de dólares. En comparación, el entrenamiento de modelos anteriores fue mucho más barato. ChatGPT-3 costó entre 2 y 4 millones en 2020, y el precursor de Gemini, PaLM, entre 3 y 12 millones en 2022.
El modelo V3 de DeepSeek ha tenido un coste inferior a 6 millones de dólares.
(*) https://www.eleconomista.es/tecnologia/noticias/13187410/01/25/asi-puedes-usar-deepseek-la-inteligencia-artificial-china-que-supera-a-chatgpt-y-es-gratuita.html
Qué más se puede decir? La noticia se comenta por sí sola 🇨🇳👏♥️