Cerca de destacar que, según Poste matutino del sur de China, Cúmulo de Alibabael buque insignia Qwen La clan de modelos había superado los 700 millones de descargas en enero de 2026 en la plataforma de desarrolladores. abrazando la caralo que lo convierte en el sistema de inteligencia fabricado de código amplio más utilizado del mundo. El crónica añade que el impulso de Qwen surge de la logística de Alibaba Cloud de inaugurar una amplia matiz de modelos, desde versiones ligeras con 600 millones de parámetros hasta modelos grandes con decenas de miles de millones de parámetros.
Mientras tanto, es posible que DeepSeek esté preparando un nuevo maniquí. Como Horarios comercialesseñala, cerca de del primer aniversario del emanación de su maniquí de razonamiento R1 por parte de la startup china de IA, apareció silenciosamente un nuevo tesina llamado “MODEL1” en la comunidad de código amplio.
Las “Calificaciones de modelos de IA” de Nikkei, que evalúan el desempeño de los modelos líderes en japonés, muestran que el maniquí de DeepSeek emprendedor en diciembre ocupó el noveno circunstancia entre 92 modelos. El crónica señala que DeepSeek ocupó el primer circunstancia entre los modelos de código amplio, seguido por Alibaba Group, y superó a los modelos de código amplio de Google y OpenAI en términos de rendimiento.
Estos modelos chinos de IA han ido ganando circunscripción en el extranjero. Nikkei señala que seis de los 10 principales modelos desarrollados por empresas japonesas, incluidos los del actor emergente ABEJA, se basan en DeepSeek y Qwen (Tongyi Qianwen). El crónica agrega que el Instituto Doméstico de Informática (NII) de Japón incluso adoptó Qwen para organizar datos de entrenamiento para su iniciativa doméstico de ampliación de IA, LLM-jp.
