Hablando en la feria comercial anual, Huang dijo que los modelos de DeepSeek, lanzados a principios del año pasado, habían acelerado el crecimiento del ecosistema de código descubierto, incluso luego de que el maniquí R1 de la compañía, que requería menos capital informáticos para entrenarse, ayudara a desencadenar una saldo masiva de corta duración en las acciones de Nvidia.
“Vimos el avance de DeepSeek R1, el primer maniquí descubierto que es un sistema de razonamiento”, dijo Huang, resumiendo los desarrollos esencia en IA en 2025. El maniquí chino, dijo, había “tomado al mundo por sorpresa” y estaba ayudando a revolucionar la IA y catalizar la innovación entero.
“Un trabajo positivamente emocionante; estamos muy contentos con él”, añadió.
Huang dijo que los modelos de código descubierto estaban cerrando rápidamente la brecha de desempeño con los principales modelos “de frontera” del mundo. Una diapositiva de su presentación, que rastreaba las cada vez más estrechas diferencias en capacidad, enumeraba tres modelos desarrollados en China: DeepSeek-V3.2, Kimi K2 y Qwen.
Kimi K2 fue desarrollado por la startup Moonshot, con sede en Beijing, mientras que Qwen es la comunidad de modelos de código descubierto desarrollada por Alibaba Group Holding, el propietario del Post.
A pesar del impulso detrás de los modelos abiertos, Nvidia ha defendido su posición como proveedor de hardware crucial para el auge de la IA, incluso cuando los desarrolladores chinos han demostrado que pueden entrenar modelos de parada rendimiento con ataque restringido a chips.
