Kimi K2.6 de Moonshot AI se ha convertido en el maniquí de peso despejado mejor clasificado, ocupando el cuarto área a nivel mundial y acercándose a tres puntos de los principales modelos de frontera de EE. UU., lo que indica un cambio importante en la competitividad de la IA de código despejado.
Moonshot AI ha llevado la IA de código despejado más cerca de la frontera con Kimi K2.6 debutando en el cuarto área en el Índice de Inteligencia de Exploración Químico v4.0, con 54 puntos, solo tres detrás de Claude Opus 4.7 de Anthropic, Gemini 3.1 Pro de Google y GPT-5.4 de OpenAI, todos empatados en 57.
La clasificación convierte al Kimi K2.6 en el maniquí de peso despejado de anciano rendimiento y subraya la prontitud con la que los modelos chinos de código despejado están cerrando la brecha con los sistemas propietarios estadounidenses. Incluso aventaja al subsiguiente mejor maniquí despejado, el GLM-5.1, por tres puntos.
El índice agrega 10 evaluaciones que abarcan razonamiento, codificación, conocimiento genérico y desempeño de agencia, donde K2.6 logró sus mayores avances. Su GDPval-AA Elo saltó a 1520 desde 1309 en K2.5, mientras que una puntuación del 96% en τ²-Bench Telecom lo colocó firmemente entre los modelos de frontera.
La credibilidad empresarial se vio reforzada por una tasa corta de alucinaciones del 39%, frente al 65% de la vivientes aludido, acercándose a los puntos de relato de la frontera patentada.
Construido sobre una bloque de mezcla de expertos con un billón de parámetros, 32 mil millones de parámetros activos y una ventana de contexto de 256 mil tokens, K2.6 además consumió cerca de de 160 millones de tokens de razonamiento en ejecuciones de relato, lo que refleja una intensidad informática sustancial.
Con una amplia disponibilidad de terceros y señales de apadrinamiento sostenida, el resultado fortalece la opinión de que la IA china de código despejado se está convirtiendo en un serio desafío para los laboratorios de frontera cerrada.
