DeepSeek finalmente lanzó su tan esperado maniquí de inteligencia químico fundamental de próxima coexistentes, el V4 de código despejado, que, según dijo, era competitivo con los principales modelos de código cerrado de EE. UU., como OpenAI y Google DeepMind.
La startup de IA con sede en Hangzhou lanzó dos versiones del maniquí el viernes: el maniquí V4-pro cuenta con 1,6 billones de parámetros, lo que lo convierte en el maniquí más sobresaliente de la compañía según esa métrica, mientras que el maniquí V4-flash más pequeño tiene 284 mil millones de parámetros. Un viejo número de parámetros generalmente se correlaciona con mayores capacidades para un maniquí, al tiempo que aumenta las demandas computacionales de entrenarlo y atenderlo.
Entreambos modelos tienen una ventana de contexto de 1 millón de tokens, una característica crítica que determina la cantidad de información que un sistema de IA es capaz de procesar, lo que, según DeepSeek, se logró con una rentabilidad “líder mundial”. El maniquí insignia antecedente de DeepSeek tenía una ventana contextual de 128.000 tokens.
Poco posteriormente del dispersión de DeepSeek, Huawei anunció el “soporte total” de su abanico de chips Ascend, unido con sus sistemas de supernodo, para servir modelos V4 para inferencia de modelos. El cíclope tecnológico con sede en Shenzhen revelará más detalles sobre la colaboración en una transmisión en vivo el viernes por la tarde. El fabricante de chips de IA Cambricon Technologies todavía se apresuró a anunciar la compatibilidad con los nuevos modelos de DeepSeek.
“El dispersión de V4 menciona explícitamente la compatibilidad con chips nacionales”, dijeron los analistas de Huatai Securities en una nota a los clientes. “Podemos esperar una perfeccionamiento significativa en las capacidades de las tarjetas gráficas nacionales y su acogida generalizada este año”.
Si perfectamente el tamaño de los parámetros de V4-pro lo hace prohibitivamente sobresaliente para ejecutarlo localmente en hardware de consumo, el referencia técnico ampliado que describe la construcción del maniquí y las técnicas de capacitación de V4 probablemente sea caritativo para los desarrolladores de IA a nivel mundial.
El maniquí V4-flash es todavía uno de los modelos de vanguardia más baratos disponibles en el mercado, con un precio simbólico idéntico al maniquí V2 de DeepSeek emprendedor en junio de 2024.
