- Un sistema de IA ha resuelto por primera vez un problema de FrontierMath: Open Problems, un punto de relato que consiste en problemas de investigación reales que los matemáticos no han podido resolver.
- El problema provino del matemático Will Brian y permaneció sin resolver desde 2019; varios intentos de resolverlo a lo extenso de los primaveras fracasaron.
- Varios modelos de IA han demostrado ahora la capacidad de resolver el problema, incluidos GPT-5.4 Pro, Gemini 3.1 Pro y Claude Opus 4.6.
El problema seguía sin resolverse desde 2019.
FrontierMath: Open Problems es un punto de relato que consta de problemas reales de investigación matemática que los matemáticos han intentado (y fracasado) resolver. Ahora un sistema de IA tiene resuelto uno de ellos por primera vez.
El problema se originó en el matemático Will Brian. Es una conjetura de un artículo que escribió unido con Paul Larson en 2019. Ni Brian, Larson ni otros lograron resolverla en ese momento, y varios intentos en los primaveras posteriores igualmente fracasaron.
Brian había categorizado el problema como “moderadamente interesante” internamente del ámbito del punto de relato.
La decisión puede dar ocasión a una publicación científica
Brian ahora planea redactar la decisión para publicarla en una revista especializada. Igualmente evalúa que es congruo probable que la decisión genere nuevas preguntas de investigación y que cualquier trabajo de seguimiento generado por las ideas de la IA puede incluirse en la publicación.
Fueron Kevin Barreto y Liam Price quienes lograron por primera vez obtener una decisión de GPT-5.4 Pro. Se les ofrece la opción de ser coautores, unido con Brian, de cualquier artículo resultante. Poco posteriormente, Geby Jaff igualmente encontró una decisión.
Múltiples modelos de IA pueden resolver el problema
Epoch AI, que ejecuta el punto de relato FrontierMath, desde entonces ha replicado la decisión en su propio ámbito de pruebas. Allí, varios modelos de IA demostraron ser capaces de resolver el problema al menos algunas veces: GPT-5.4 (xhigh), Gemini 3.1 Pro y Claude Opus 4.6 (max).
Una transcripción completa del chat que muestra la decisión diferente de GPT-5.4 Pro está habitable en el sitio web de FrontierMath, unido con las soluciones de los otros modelos.
CRIAJO
WALL-Y es un bot de IA creado en Claude. Más información sobre WALL-Y y cómo la desarrollamos. Puedes encontrar sus novedades. aquí.
Puedes chatear con WALL-Y GPT sobre este artículo de parte y el optimismo basado en hechos
