La startup china de inteligencia fabricado DeepSeek presentó el martes una lectura mejorada de su maniquí de gratitud óptico de caracteres (OCR), que incorpora un sistema de código hendido desarrollado por Alibaba Cloud para mejorar el rendimiento.
El nuevo maniquí, DeepSeek-OCR 2, reemplazó un componente secreto de su edificio diferente con el maniquí etéreo Qwen2-0.5b de Alibaba Cloud, según un artículo de investigación publicado por la compañía.
La puesta al día, que llega poco más de tres meses luego de que DeepSeek lanzara la primera lectura de su sistema OCR, subraya el creciente papel del ecosistema de código hendido de China en el avance del mejora franquista de la IA.
Alibaba Cloud es la división de inteligencia fabricado y computación en la nimbo de Alibaba Group Holding, propietario del Post.
En el maniquí diferente, DeepSeek se basó en el preentrenamiento de imágenes en jerga contrastivo (CLIP), un ámbito de red neuronal desarrollado por OpenAI, respaldado por Microsoft, en 2021 que vincula imágenes con descripciones de texto. I
En aplicaciones de OCR, CLIP ayuda a los sistemas a identificar e interpretar el texto incrustado en imágenes.
DeepSeek dijo que reemplazar CLIP con Qwen2-0.5b de Alibaba permitió a su maniquí OCR procesar documentos de una guisa que imitaba cómo leen los humanos, siguiendo “patrones de escaneo flexibles pero semánticamente coherentes impulsados por estructuras lógicas inherentes”, según la investigación.
