El código destapado Hindsight de Vectorize.io ofrece un rendimiento récord de la memoria del agente, posicionando la memoria estructurada como un reemplazo perspicaz para producción para los sistemas RAG defectuosos.
En retrospectiva, una nueva casa de memoria agente de código destapado, ha rematado una precisión del 91,4% en el punto de relato LongMemEval, la puntuación más incorporación registrada hasta la término. Diseñado como un reemplazo de nivel de producción para la engendramiento aumentada de recuperación (RAG), Hindsight aborda directamente las limitaciones que han hecho que RAG no sea confiable para agentes de IA de múltiples sesiones a amplio plazo.
Para 2025, se hará evidente que RAG no puede apoyar a agentes que deben permanecer el contexto a lo amplio del tiempo, seguir la proceso de las creencias, distinguir hechos de opiniones o realizar razonamientos temporales y causales. RAG proxenetismo toda la información recuperada por igual, lo que genera inconsistencia, contradicción y sobrecarga de contexto en las implementaciones del mundo existente.
La retrospectiva resuelve esto estructurando la memoria en cuatro redes lógicas distintas: una Red Mundial para hechos objetivos, una Red Bancaria para experiencias de agentes, una Red de Opinión para creencias con puntajes de confianza y una Red de Observación para resúmenes de entidades neutrales en cuanto a preferencias. La memoria se proxenetismo como un sustrato de razonamiento de primera clase, lo que permite que las creencias se actualicen dinámicamente a medida que llegan nuevas pruebas.
La casa está impulsada por dos componentes centrales. TEMPR realiza recuperación semántica paralela, de palabras esencia, basada en gráficos y temporal, fusionando resultados mediante Reciprocal Rank Fusion. CARA introduce disposiciones de razonamiento como el desconfianza, el literalismo y la empatía para certificar la coherencia entre las sesiones.
Desarrollado por Vectorize.io en colaboración con Virginia Tech y The Washington Post, Hindsight se probó en conversaciones que abarcaron hasta 1,5 millones de tokens, lo que generó importantes ganancias en el presente de múltiples sesiones, el razonamiento temporal y las actualizaciones de conocimientos.
“RAG está en soporte vitalista y la memoria del agente está a punto de matarlo por completo”, dijo Chris Latimer, cofundador y director ejecutante de Vectorize.io.
Hindsight se puede implementar como un único contenedor Docker, funciona como un reemplazo directo para las canalizaciones RAG existentes y ya se está preparando para la integración en la estrato hiperescaladora, posicionando la memoria del agente de código destapado como la ulterior capa predeterminada para los agentes de IA.
