체스 용어
알파제로(AlphaZero)

알파제로(AlphaZero)

2017년 체스계는 가장 강력한 체스 엔진인 스톡피시(Stockfish)가 일방적으로 패배하는 장면에 크게 놀랐습니다. 스톡피시의 상대는 사람이 아닌 처음 모습을 드러낸 체스 인공지능, 알파제로(AlphaZero)였습니다.

이 강력한 체스 인공지능에 관한 모든 내용이 여기에 있습니다.


알파제로(AlphaZero)가 무엇인가요?

알파제로는 구글의 딥마인드(DeepMind)가 개발한 체스 인공지능입니다. 알파제로는 강화 학습과 스스로 하는 경기를 통해 신경망을 강화하여 믿을 수 없는 체스 수준에 이르렀습니다. 바꿔 말하면, 알파제로는 체스의 기본 규칙만 배운 상태로 스스로 수 억 경기를 해 실력을 키운 것입니다.(딥마인드에 따르면 9시간 동안 4천4백만 경기를 했다고 합니다.)

알파제로는 자체 신경망을 이용하여 매우 복잡한 포지션을 평가하므로 스톡피시처럼 매 초마다 7천만 개의 포지션을 살펴볼 필요가 없습니다. 딥마인드에 따르면, 알파제로가 스톡피시와 비슷한 수준에 도달하기 위해선 단지 4시간이면 충분하다고 합니다.

AlphaZero chess
딥마인드 로고. 이미지 출처: deepmind.com.

알파제로는 "구글 슈퍼컴퓨터"라고 불리는 기계에서 실행됩니다. 딥마인드는 스톡피시와의 대결에서 알파제로가 4개의 TPU(Tensor Processing Units)을 이용했다고 밝혔습니다.

2017년 12월 딥마인드는 보고서를 통해 알파제로가 스톡피시와의 100경기 대결을 가볍게 승리했다고 밝혔습니다. 알파제로는 이후 1000경기로 구성된 스톡피시와의 두 번째 대결에서도 승리를 거두었습니다. 해당 결과는 2018년 공개되었습니다.

AlphaZero stockfish chess
알파제로-스톡피시의 대결은 체스계를 변화시켰습니다.

아쉽게도, 알파제로는 대중들에게 공개되지 않았습니다. 하지만 알파제로와 스톡피시의 놀라운 대결을 통해 많은 오픈 소스 형식의 체스 인공지능이 개발되었습니다. Leela Chess Zero, Leelenstein, Alliestein 등은 알파제로의 작동 방식을 모방한 체스 인공지능입니다. 기존의 최강자였던 스톡피시도 신경망 기능을 탑재했습니다.

2020년 딥마인드와 알파제로는 변형 체스를 통해 다시 한번 체스 발전에 기여했습니다. 딥마인드와 알파제로가 움직일 때는 항상 뉴스가 만들어집니다!

등장한 순간부터 알파제로는 놀라운 체스 경기와 새로운 변형 체스 등으로 인공지능을 활용한 새로운 체스 시대를 열었습니다.

알파제로의 업적

앞서 언급한 것처럼, 알파제로는 2017년 가장 강한 체스 엔진인 스톡피시와의 100경기 대결에서 압도적인(28승 72무 0패) 승리를 거뒀습니다. 대중에게 공개된 경기는 그중 10경기였는데, 대중들의 반응은 놀라움 이상이었습니다. GM Peter Heine Nielsen은 알파제로의 경기는 마치 우월한 외계 생명체가 지구에 와서 사람에게 체스를 두는 법을 알려주는 것과 같다고 표현했습니다.

다른 그랜드 마스터들도 Nielsen의 주장에 동의했습니다. 전설적인 GM Garry Kasparov도 체스닷컴과의 인터뷰에서 "정말이지 놀라운 업적이다. 모든 경우의 수를 고려하는 방법이 아닌 정말 사람처럼 경기하는 것은 Claude Shannon과 Alan Turing이 꿈꿔왔던 그것"이라고 말했습니다.

한편, 일부 사람들은 첫 대결에서 사용된 장비를 이유로 결과에 의문을 제기했습니다. 일부는 스톡피시가 대결에서 오프닝과 엔드게임 테이블베이스를 사용하지 못한 것을 찾아내 대결 자체가 불공평했다고 지적했습니다. 

GM Hikaru Nakamura는 다음과 같이 말했습니다. "알파제로는 구글의 슈퍼컴퓨터를 사용했고, 스톡피시는 최상의 환경에서 경기하지 못했기 때문에, 결과에 큰 의미를 둘 필요는 없다고 생각합니다. 스톡피시는 마치 제 노트북에서 작동한 것 같았어요."

AlphaZero chess
나카무라 선수는 알파제로와 스톡피시의 첫 대결에 의문을 제기했습니다. 사진: Maria Emelianova/Chess.com.

첫 대결이 있은지 1년 후, 딥마인드는 알파제로가 스톡피시와의 1000경기 대결에서 다시 한번 승리했는 새로운 보고서를 발표했습니다. 이번 대결에서는 최신 버전(당시 버전 9)의 스톡피시가 사용되었고, 스톡피시는 오프닝북을 사용할 수 있었습니다. 그리고 시간제한도 스톡피시가 유리하도록 설계하고, 스톡피시는 톱 체스 엔진 챔피언십(Top Chess Engine Championship,TCEC)에 사용된 장비에서 작동되었습니다.

하지만 결과는 크게 변하지 않았습니다. 알파제로는 스톡피시를 155승 839무 6패로 꺾었습니다.

알파제로와 변형 체스

2019년과 2020년 GM Vladimir Kramnik은 알파제로와 딥마인드 팀과 새로운 변형 체스를 연구하고 보고서를 함께 작성했습니다. 새로운 변형 체스에는 옆으로 이동할 수 있는 폰, 캐슬링 없는 체스, 어뢰 체스(폰이 항상 한 칸 또는 두 칸 이동할 수 있는 규칙이 추가) 등이 포함됐습니다.

2020년 9월 체스닷컴은 Kramnik과 딥마인드 팀을 초대해서 새로운 변형 체스와 다른 주제에 관해 논의했습니다. 전체 영상(영문)은 아래에서 볼 수 있습니다.

많은 변형 체스는 체스닷컴 기능에 추가되었습니다. 새로운 변형 체스를 즐기고 싶은 사람은 누구나 직접 해볼 수 있습니다. 주소창에 Chess.com/variants를 입력하거나 체스닷컴 '플레이'에서 '변형 체스(Variants)'를 클릭하면 됩니다.

AlphaZero chess variants
체스닷컴에서 다양한 변형 체스를 경험해볼 수 있습니다.

변형 체스 페이지에서는 다양한 경기를 직접 경험해볼 수 있습니다.

AlphaZero chess
체스닷컴 변형 체스 페이지

알파제로 경기

아래 경기에서 알파제로가 어떻게 세계를 놀라게 만들었는지 확인할 수 있습니다. 알파제로는 오프닝에서 폰을 희생한 후 곧장 공격에 나섰습니다. 19...Kxh6로 스톡피시는 기물을 하나 앞섰지만 흑의 킹은 노출되었고, 흑의 퀸사이드 기물들은 전혀 전개가 되지 않았습니다.

AlphaZero chess engine
스톡피시(흑)은 기물을 하나 잡아냈지만 매우 위험한 상황입니다.

알파제로는 압박을 유지했지만 기물을 희생한 충분한 보상을 가지고 있는지는 명확하지 않았습니다. 확실히 말할 수 있는 것은 흑의 퀸사이드 룩과 나이트가 경기에 전혀 참가하지 못하고 있다는 것뿐이었습니다. 하지만 36.Qe6 이후에는 확실히 알파제로가 이기고 있는 것이 명확해졌습니다.

아래는 알파제로와 스톡피시의 두 번째 대결에서 나온 경기입니다. 알파제로는 포지션의 이점을 바탕으로 비숍쌍을 활용해서 스톡피시를 끝까지 괴롭혔습니다.

아래 영상에서 GM Rober Hess는 알파제로의 놀라운 경기를 분석했습니다.

결론

이제 우리는 알파제로라는 체스 인공지능이 무엇이고, 어떤 업적을 이루었는지 알아봤습니다. 알파제로의 경기가 더 보고 싶다면 IM Danny Rensch가 만든 다음 동영상 레슨을 참고해 주세요.