Sarvam Vision, construido en Bengaluru, por Sarvam AI, registra una puntuación de precisión de OCR del 84,3%, superando a Gemini y ChatGPT, al tiempo que muestra la capacidad de IA soberana y controlada localmente de la India para los idiomas índicos.
El impulso de la India por una pila de IA soberana y controlada localmente ha conseguido un hito esencial con el propagación de Sarvam AI de Sarvam Vision, un maniquí específico que ha superado a Google Gemini y ChatGPT de OpenAI en puntos de narración especializados, particularmente en examen óptico de caracteres (OCR).
Sarvam Vision registró una precisión del 84,3 % en olmOCR-Bench, una puntuación más inscripción que Gemini 3 Pro, DeepSeek OCR v2 y significativamente por encima de ChatGPT. El resultado coloca a la India entre un pequeño peña de países, conexo con Estados Unidos y China, con sistemas de inteligencia fabricado básicos o de clase LLM desarrollados a nivel doméstico.
Posicionado como una plataforma soberana de IA, Sarvam Vision se construye en la India utilizando talento específico y se adapta a casos de uso específicos de la India, lo que reduce la dependencia de la infraestructura de IA extranjera. Sus fortalezas principales incluyen IA en idioma índico, OCR, texto a voz y voz a texto, áreas donde la optimización enfocada parece pasar a los modelos globales más grandes y de propósito común. El OCR sigue siendo “una de las pruebas más importantes para un maniquí de IA”, lo que convierte al punto de narración en un diferenciador fundamental.
Pratyush Kumar, cofundador de Sarvam Vision AI, compartió los resultados de las pruebas comparativas en una serie de publicaciones en ‘X’, destacando el desempeño comparativo del maniquí con ChatGPT y Gemini.
Los observadores de la industria han tomado nota. Deedy Das, comentarista tecnológico, dijo:
“Me equivoqué acerca de Sarvam. Cuando escribí sobre ellos hace un año, sentí que la dirección de entrenar pequeños modelos de idioma índico estaba equivocada. Pero vaya, han cambiado las cosas. Tienen los mejores modelos de texto a voz, voz a texto y OCR para idiomas índicos, y eso es efectivamente valioso. El precio es muy regular”.
El mejora de la startup de Bengaluru subraya la creciente independencia de la IA de la India y la viabilidad de los ecosistemas de IA abiertos y soberanos en idiomas regionales.
