AlphaProof resolvió cuatro de seis problemas planteados en la competencia, incluyendo tres de álgebra y teoría de números. Adicionalmente, otro agente de DeepMind, AlphaGeometry, solucionó un desafío geométrico, complementando el rendimiento de la IA.
La diferencia clave respecto a sistemas previos radica en el método innovador denominado TTRL (aprendizaje por refuerzo en tiempo de prueba), que permite generar variantes de los problemas para adaptar el aprendizaje a cada caso y verificar formalmente cada paso en el proceso de resolución.
Pese a estos avances, los investigadores reconocen que AlphaProof aún posee limitaciones importantes. El entrenamiento requiere una enorme potencia computacional y varios días por problema, a diferencia del tiempo más restringido de los competidores humanos.
Además, la IA actualmente no puede abordar problemas de matemáticas abiertas que demandan creatividad y formulación de nuevos conceptos, competencias propias de la mente humana.
El profesor Ramón López de Mántaras, pionero en IA en España, valora el resultado como “excelente” y destaca que la tecnología abre herramientas para asistir a matemáticos humanos, más que sustituirlos.
Marta Macho-Stadler, matemática de la Universidad del País Vasco, complementa que es probable que en poco tiempo mejoren las capacidades de estos sistemas, en velocidad y complejidad de problemas resueltos.
Este logro no solo evidencia la evolución de la IA en el ámbito del razonamiento lógico-formal, sino que también plantea nuevos debates sobre el rol complementario que estas tecnologías tendrán en la investigación matemática y científica.