SAP avanza para apropiarse Dremio y Prior Labs, aprovechando el código libre Iceberg y Polaris para preparar los datos empresariales para la IA y acelerar las capacidades tabulares de la IA.
SAP SE ha anunciado planes para apropiarse Dremio y Prior Labs GmbH, lo que indica una sólida garra empresarial de los estándares de data lakehouse de código libre como pulvínulo para una infraestructura preparada para IA. Los términos financieros no fueron revelados.
La medida se centra en blindar las capacidades tabulares de IA, permitiendo específicamente que los datos empresariales almacenados en filas y columnas impulsen los flujos de trabajo de IA basados en agentes. Un número secreto detrás de la adquisición de Dremio es su inmueble basada en Apache Iceberg y Apache Polaris, lo que subraya el papel cada vez decano de los sistemas abiertos e interoperables en la IA empresarial.
Iceberg permite la transformación de esquemas y consultas más rápidas de grandes conjuntos de datos, mientras que Polaris ofrece una gobernanza sólida de metadatos, incluido control de entrada y seguimiento de cambios, capacidades cada vez más críticas para la implementación de IA a escalera.
SAP planea integrar Dremio en su Business Data Cloud, mejorando el soporte de Iceberg, fortaleciendo la papeleo de metadatos y mejorando la preparación común de los datos de IA.
“La IA empresarial no se estanca porque los modelos no sean lo suficientemente buenos; se estanca porque los datos no están listos para los agentes de IA”, dijo el director de tecnología de SAP, Philipp Herzig. “Dremio elimina ese cuello de botella”.
Mientras tanto, Prior Labs ofrece TabPFN-2.5, un maniquí de IA tabular especializado capaz de procesar hasta 100.000 filas por tarea y detectar anomalías. Su motor de destilación permite modelos livianos, más rápidos y específicos de conjuntos de datos. SAP invertirá 1.170 millones de dólares en Prior Labs durante cuatro abriles y la startup seguirá operando de forma independiente.
Las adquisiciones reflejan un cambio más amplio de pilas de datos patentadas a ecosistemas de datos preparados para IA, impulsados por código libre.
