본문 바로가기
잡식(잡다한지식)

DeepMind의 AlphaProof와 AlphaGeometry 2: 수학 올림피아드에서 은메달 획득

by 차차파파라바 2024. 7. 27.
DeepMind의 AlphaProof와 AlphaGeometry 2: 수학 올림피아드에서 은메달 획득


인공지능(AI)이 수학 문제를 해결하는 능력에서 놀라운 진전을 이루었습니다. Google DeepMind의 AI 시스템인 AlphaProof와 AlphaGeometry 2가 2024년 국제 수학 올림피아드(IMO)에서 은메달 수준의 성과를 거두며 그 가능성을 입증했습니다. 이번 블로그에서는 이 두 AI 시스템의 성과, 그 의미, 미래의 가능성, 그리고 훈련 방법론에 대해 자세히 살펴보겠습니다.

AlphaProof와 AlphaGeometry 2


AlphaProof와 AlphaGeometry 2는 Google DeepMind에서 개발한 두 가지 AI 시스템입니다. AlphaProof는 사전 훈련된 언어 모델과 AlphaZero 강화 학습 알고리즘을 결합하여 대수학 및 수론 문제를 해결하고 증명하는 능력을 갖추고 있습니다. 반면 AlphaGeometry 2는 기하학 문제를 해결하는 데 중점을 둔 시스템으로, 1억 개의 합성 예제로 구성된 방대한 데이터셋을 통해 훈련되었습니다. 이러한 혁신적인 데이터 생성 접근 방식은 인간이 작성한 훈련 데이터의 부족이라는 일반적인 병목 현상을 극복하는 데 도움을 주었습니다.

DeepMind의 AlphaProof와 AlphaGeometry 2: 수학 올림피아드에서 은메달 획득


IMO 2024에서의 성과


2024년 국제 수학 올림피아드에서 AlphaProof는 대수학 문제 두 개와 수론 문제 하나를 성공적으로 해결했으며, AlphaGeometry 2는 기하학 문제 하나를 해결했습니다. 이 두 시스템의 결합된 솔루션은 총 42점 만점 중 28점을 획득하여 은메달을 획득했으며, 금메달 기준에서 단 1점 차이로 아쉽게 놓쳤습니다. 특히 AlphaGeometry 2는 문제를 단 19초 만에 해결하여 놀라운 효율성을 보여주었습니다. 문제는 AI 시스템이 이해할 수 있도록 수동으로 형식적 수학 언어로 번역되었으며, 솔루션은 몇 분에서 최대 3일이 걸렸습니다.

DeepMind의 AlphaProof와 AlphaGeometry 2: 수학 올림피아드에서 은메달 획득


성과의 의미


이번 성과는 AI가 복잡한 수학적 추론 작업을 처리할 수 있는 능력에서 중요한 도약을 의미합니다. AlphaProof와 AlphaGeometry 2의 성공은 AI가 이제 IMO 문제를 해결하는 데 필요한 고급 논리적 추론, 추상화 및 계층적 계획을 수행할 수 있음을 보여줍니다. 특히 이 AI 시스템들은 인간 참가자와 유사하게 고전 기하학 규칙을 사용하여 인간이 읽을 수 있는 증명을 생성했습니다. 이 성과는 필즈상 수상자인 팀 가워스(Tim Gowers)를 포함한 전문가들에 의해 검증되었으며, 가워스는 AI가 복잡한 문제를 해결하는 "마법의 열쇠"를 찾는 능력에 놀랐다고 표현했습니다. AlphaGeometry 2는 지난 25년 동안의 모든 역사적인 IMO 기하학 문제 중 83%를 해결했으며, 이는 이전 버전의 53% 성공률에 비해 상당한 향상입니다.

DeepMind의 AlphaProof와 AlphaGeometry 2: 수학 올림피아드에서 은메달 획득


AI의 미래 가능성


AlphaProof와 AlphaGeometry 2의 성공은 AI가 수학 연구 및 문제 해결에서 새로운 가능성을 열어줍니다. 이러한 시스템은 수학자들이 새로운 통찰을 발견하고, 열린 문제를 해결하며, 과학적 발견을 가속화하는 데 도움을 줄 수 있는 잠재력을 가지고 있습니다. 그러나 DeepMind 연구자들은 AI가 아직 인간 수학자들의 창의성과 문제 제기 능력을 갖추지 못했다는 점을 인정하고 있습니다. 이러한 시스템들이 계속 발전함에 따라, 이들은 인간이 수학적 증명을 공식화하고 복잡한 가설을 탐구하는 데 도움을 줄 수 있는 강력한 계산 도구가 될 수 있습니다.

훈련 방법론


AlphaProof와 AlphaGeometry 2는 인상적인 수학적 추론 능력을 달성하기 위해 혁신적인 훈련 방법론을 사용합니다. AlphaProof는 여러 주에 걸쳐 다양한 난이도와 수학적 주제에 걸쳐 수백만 개의 문제를 해결하는 자체 훈련 접근 방식을 사용합니다. 이 시스템은 솔루션 후보를 생성하고 형식 언어 Lean에서 증명 단계를 검색하며, 각 검증된 증명은 언어 모델을 강화합니다. AlphaGeometry 2는 더 큰 합성 데이터셋인 1억 개의 예제로 훈련된 Gemini 언어 모델을 통합하여 이를 기반으로 합니다. 연구자들은 자연 언어 문제 진술을 형식 수학 언어로 번역하기 위해 Gemini 모델을 미세 조정하여 방대한 형식화된 문제 라이브러리를 생성했습니다. 이러한 접근 방식은 형식 언어로 작성된 인간 데이터의 부족이라는 한계를 극복하여 시스템이 다양한 수학적 도전을 해결할 수 있게 합니다.


결론


Google DeepMind의 AlphaProof와 AlphaGeometry 2는 2024년 국제 수학 올림피아드에서 은메달 수준의 성과를 거두며 AI의 수학적 추론 능력에서 중요한 진전을 이루었습니다. 이 성과는 AI가 복잡한 수학 문제를 해결하는 데 필요한 고급 논리적 추론, 추상화 및 계층적 계획을 수행할 수 있음을 보여줍니다. 앞으로 AI는 수학 연구 및 문제 해결에서 중요한 도구가 될 수 있으며, 인간 수학자들과 협력하여 새로운 통찰을 발견하고 과학적 발견을 가속화하는 데 기여할 수 있을 것입니다.

댓글