El último desafío de la inteligencia artificial: las Olimpiadas de Matemáticas

Desde hace cuatro años, el informático Trieu Trinh está absorto en una especie de problema metamatemático: cómo construir un modelo de inteligencia artificial que resuelva los problemas de geometría de la Olimpiada Internacional de Matemáticas, la competición anual para estudiantes de secundaria más a tono con la matemáticas del mundo. .

La semana pasada el Dr. Trinh defendió con éxito su tesis doctoral sobre este tema en la Universidad de Nueva York; esta semana describió el resultado de su trabajo en la revista Nature. Llamado AlphaGeometry, el sistema resuelve problemas de geometría olímpica casi al nivel de una medalla de oro humana.

Durante el desarrollo del proyecto, el Dr. Trinh se lo presentó a dos investigadores de Google, quienes lo aceptaron como residente de 2021 a 2023. AlphaGeometry se une a la flota de sistemas de inteligencia artificial de Google DeepMind, que se han hecho famosos por abordar grandes desafíos. Quizás el más famoso sea AlphaZero, un algoritmo de aprendizaje profundo, que arrasó en el ajedrez en 2017. Las matemáticas son un problema más difícil, ya que el número de caminos posibles hacia una solución es a veces infinito; El ajedrez siempre termina.

«Seguí topándome con callejones sin salida, yendo por el camino equivocado», dijo el Dr. Trinh, autor principal y fuerza impulsora del proyecto.

Los coautores del artículo son el asesor doctoral del Dr. Trinh, He He, en la Universidad de Nueva York; Yuhuai Wu, conocido como Tony, cofundador de xAI (antes Google) que de forma independiente comenzó a explorar una idea similar en 2019; Thang Luong, el investigador principal, y Quoc Le, ambos de Google DeepMind.

La perseverancia del Dr. Trinh dio sus frutos. «No estamos haciendo mejoras incrementales», dijo. «Estamos dando un gran salto, un gran paso adelante en términos de resultados».

«Simplemente no se exceda», dijo.

El Dr. Trinh presentó el sistema AlphaGeometry con una serie de pruebas de 30 problemas de geometría olímpica diseñados entre 2000 y 2022. El sistema resolvió 25 de ellos; Históricamente, durante el mismo período, la medalla de oro humana promedio obtuvo 25,9. El Dr. Trinh también planteó problemas para un sistema desarrollado en la década de 1970 que era conocido por ser el demostrador de teoremas más sólido en geometría; resuelto 10.

En los últimos años, Google DeepMind ha llevado a cabo una serie de proyectos estudiando la aplicación de la inteligencia artificial a las matemáticas. Y de manera más general en esta área de investigación, se han adoptado como punto de referencia los problemas matemáticos de las Olimpiadas; OpenAI y Meta AI han logrado algunos resultados. Para mayor motivación, está el Gran Desafío de la OMI y un nuevo desafío anunciado en noviembre, el Premio de la Olimpíada de Matemáticas de Inteligencia Artificial, con un premio acumulado de 5 millones de dólares para la primera IA en ganar el oro olímpico.

El artículo de AlphaGeometry comienza con la tesis de que la demostración de los teoremas de la Olimpiada «representa un hito notable en el razonamiento automatizado a nivel humano». Michael Barany, historiador de las matemáticas y las ciencias de la Universidad de Edimburgo, dijo que se preguntaba si se trataba de un hito matemático significativo. «Lo que la OMI está probando es muy diferente de lo que parecen las matemáticas creativas para la gran mayoría de los matemáticos», dijo.

Terence Tao, matemático de la Universidad de California en Los Ángeles (y el medallista de oro olímpico más joven, cuando tenía 12 años) dijo que pensaba que AlphaGeometry era un “buen trabajo” y había logrado “resultados sorprendentemente sólidos”. Es posible que ajustar un sistema de inteligencia artificial para resolver los problemas de los Juegos Olímpicos no mejore sus capacidades de investigación en profundidad, dijo, pero en este caso el viaje podría resultar más valioso que el destino.

Como lo ve el Dr. Trinh, el razonamiento matemático es sólo un tipo de razonamiento, pero tiene la ventaja de ser fácilmente comprobable. «Las matemáticas son el lenguaje de la verdad», dijo. «Si desea crear IA, es importante crear una IA confiable, que busque la verdad y en la que pueda confiar», especialmente para «aplicaciones críticas para la seguridad».

AlphaGeometry es un sistema «neuro-simbólico». Combina un modelo de lenguaje de red neuronal (bueno en intuición artificial, como ChatGPT pero más pequeño) con un motor simbólico (bueno en razonamiento artificial, como una calculadora lógica, en cierto sentido).

Y está hecho a medida para la geometría. «La geometría euclidiana es un gran banco de pruebas para el razonamiento automático porque es un dominio autónomo con reglas fijas», dijo Heather Macbeth, geómetra de la Universidad de Fordham y experta en razonamiento verificado por computadora. (Cuando era adolescente, el Dr. Macbeth ganó dos medallas de la OMI). AlphaGeometry “parece constituir un buen progreso”, dijo.

El sistema tiene dos características particularmente nuevas. En primer lugar, la red neuronal se entrena únicamente con datos generados algorítmicamente (hasta 100 millones de pruebas geométricas) sin utilizar ejemplos humanos. El uso de datos sintéticos creados desde cero ha superado un obstáculo en la demostración automatizada de teoremas: la escasez de datos de entrenamiento a prueba de humanos traducidos a un lenguaje legible por máquinas. «Para ser honesto, al principio tenía algunas dudas sobre cómo esto tendría éxito», dijo el Dr. He.

En segundo lugar, una vez que AlphaGeometry se desató sobre un problema, el motor simbólico comenzó a resolverlo; si se detenía, la red neuronal sugería formas de fortalecer el argumento de la prueba. El ciclo continuó hasta que se materializó una solución o hasta que se agotó el tiempo (cuatro horas y media). En la jerga matemática, este proceso de aumento se denomina “construcción auxiliar”. Añadir una línea, dividir un ángulo, dibujar un círculo: así es como los matemáticos, ya sean estudiantes o de élite, juguetean y tratan de comprender un problema. En este sistema, la red neuronal ha aprendido a realizar construcciones auxiliares, y de forma similar a los humanos. El Dr. Trinh lo comparó con envolver una banda elástica alrededor de la tapa de un frasco resistente para ayudar a que la mano lo agarre mejor.

«Es una prueba de concepto muy interesante», dijo Christian Szegedy, cofundador de xAI y ex empleado de Google. Pero «deja muchas preguntas abiertas», dijo, y no es «fácilmente generalizable a otros dominios y otras áreas de las matemáticas».

El Dr. Trinh dijo que intentará generalizar el sistema a campos matemáticos y más allá. Dijo que quiere dar un paso atrás y considerar “el principio subyacente común” de todo tipo de razonamiento.

Stanislas Dehaene, neurocientífico cognitivo del Collège de France, interesado en la investigación del conocimiento geométrico fundamental, dijo que quedó impresionado con el rendimiento de AlphaGeometry. Pero señaló que “no ‘ve’ nada de los problemas que resuelve”; más bien, sólo acepta codificaciones lógicas y numéricas de imágenes. (Los dibujos del artículo son para beneficio del lector humano). «No existe absolutamente ninguna percepción espacial de los círculos, líneas y triángulos que el sistema aprende a manipular», dijo el Dr. Dehaene. Los investigadores coincidieron en que un componente visual podría resultar valioso; El Dr. Luong dijo que podría agregarse, tal vez dentro de un año, utilizando Gemini de Google, un sistema «multimodal» que ingiere tanto texto como imágenes.

A principios de diciembre, el Dr. Luong visitó su antigua escuela secundaria en la ciudad de Ho Chi Minh, Vietnam, y le mostró AlphaGeometry a su antiguo maestro y entrenador de la OMI, Le Ba Khanh Trinh. El Dr. Lê fue el máximo ganador de la medalla de oro en los Juegos Olímpicos de 1979 y ganó un premio especial por su elegante solución geométrica. El Dr. Lê analizó una de las pruebas de AlphaGeometry y la encontró notable pero insatisfactoria, recordó el Dr. Luong: «La encontró rutinaria y dijo que carece del alma, de la belleza de la solución que busca».

El Dr. Trinh había pedido previamente a Evan Chen, estudiante de doctorado en matemáticas en el MIT (y entrenador de la OMI y medallista de oro olímpico) que revisara algunos de los trabajos de AlphaGeometry. Eso era correcto, dijo el Sr. Chen, y añadió que estaba intrigado por cómo el sistema había encontrado las soluciones.

«Me gustaría saber cómo maneja el coche esto», dijo. “Pero también me gustaría saber cómo los humanos encuentran soluciones”.