АльфаЗеро, новый проект Google, громит Стокфиш в матче из 100 партий
Вчера шахматы изменились навсегда. Возможно, не только шахматы, но и весь мир.
Год назад программа АльфаГо сенсационно обыграла сильнейшего в мире игрока в го, а теперь искусственный интеллект АльфаЗеро разгромил сильнейший по рейтингу шахматный движок.
Стокфиш, который используют для домашней подготовки большинство игроков, победитель Чемпионата TCEC 2016 года и Чемпионата Chess.com среди компьютерных программ 2017 года, оказался явно слабее. В матче из 100 партий AlphaZero одержал 28 побед при 72 ничьих и ни разу не проиграл.
Кстати, AlphaZero потратил всего четыре часа на "изучение" шахмат. Простите, человеки, но вам за ним не угнаться.
Все верно - программисты АльфаЗеро, разрабатываемого DeepMind, подразделением Google, создали его на основе механизма "машинного обучения", точнее, "обучения с подкреплением". Проще говоря, АльфаЗеро не изучал шахматы в традиционном понимании. У него нет ни дебютной книги, ни эндшпильных таблиц, ни сложных алгоритмов для оценки силы центральных и фланговых пешек.
Штаб-квартира Google в Лондоне изнутри, подразделение DeepMind расположено на восьмом этаже. | Фотография Марии Емельяновой/Chess.com.
Его работу можно сравнить с роботом, который может использовать тысячи запчастей, но не знает принципа работы двигателя внутреннего сгорания, - он перебирает возможные комбинации, пока не построит Феррари, и для этого ему нужно меньше времени, чем занимает просмотр трилогии "Властелин колец". За четыре часа программа сыграла сама с собой множество партий, став своим собственным учителем.
Пока что команда программистов хранит молчание. Они не дали Chess.com комментариев, ссылаясь на то, что доклад "пока находится на рассмотрении", но здесь вы можете прочесть его полный текст. В исследовательскую группу входит Демис Хассабис, кандидат в мастера из Англии и соучредитель DeepMind (приобретен Google в 2014). Хассабис, принимавший участие в турнире тандемов ProBiz на открытии London Chess Classic, в настоящий момент находится на конференции Neural Information Processing Systems (Нейронные системы обработки информации) в Калифорнии, в качестве соавтора доклада на другую тему.
Демис Хассабис играет в паре с Майклом Адамсом на турнире в штаб-квартире Google в Лондоне несколько дней назад. | Фотография Марии Емельяновой/Chess.com.
Зато с Chess.com охотно поделился своими суждениями шахматист, обладающий большим личным опытом игры против шахматных компьютеров. Гарри Каспаров не удивлен, что компания DeepMind перешла от го к шахматам.
"Это заметное достижение, хотя оно и было ожидаемо после АльфаГо", - заявил он Chess.com. "Оно приближается к 'типу-Б', человекоподобному подходу к шахматам, которым Клод Шеннон и Алан Тьюринг мечтали заменить сплошной перебор".
Одна из 10 избранных партий, которые приводятся в статье.
Подобно человеку, АльфаЗеро рассматривает меньше позиций, чем обычные движки. В отчете заявлено, что она оценивает "всего" 80 тысяч позиций в секунду в сравнении с 70 миллионами в секунду у Стокфиш.
Петер-Хайне Нильсен, многолетний секундант чемпиона мира Магнуса Карлсена, открыл свое увлечение, сближающее его с президентом ФИДЕ: инопланетян. Он заявил Chess.com: "Прочитав доклад и, в особенности, просмотрев партии, я подумал: "Мне всегда было любопытно, что было бы, если бы более разумный вид высадился на нашей планете и показал нам свое искусство шахматной игры. Кажется, теперь я знаю, каково это".
Интервью Chess.com с Нильсеном о новостях про АльфаЗеро.
Мы также узнали, о значимости преимущества выступки, по крайней мере, для искусственного интеллекта. 25 из 28 побед АльфаЗеро одержал белыми (хотя результат +3=47-0 черными против Stockfish, чей рейтинг превышает 3400, также неплох).
В отчете показано и насколько часто движок выбирал те или иные дебюты по мере обучения. Простите, любители староиндийской защиты, но вы не в фаворе. Интерес к французской защите также угас со временем, а вот стремление играть ферзевый гамбит и, особенно, английское начало только возрастало.
Частота дебютов, применяемых АльфаЗеро в фазе "обучения". Иллюстрация из научного доклада AlphaZero.
Что бы вы сделали на месте не ведающего усталости существа, только что освоившего игру с 1400-летней историей? Взялись бы за другую. После матча со Стокфиш программа потратила на "обучение" всего два часа и победила "Elmo", сильнейшего из компьютерных движков для игры в сёги.
Применение этой инновационной самообучающейся программы, разумеется, не ограничено играми.
"Всегда считалось, что в шахматах от машины требуется слишком много эмпирических знаний, чтобы те могли играть сильно 'с нуля', вообще не используя человеческие знания", - сказал Каспаров. "Конечно, мне будет интересно посмотреть, что мы сможем узнать о шахматах с помощью АльфаЗеро, который открывает огромные перспективы машинного обучения в целом—машины могут находить закономерности, недоступные для людей. Очевидно, что последствия простираются далеко за пределы шахмат и других игр. Способность машины открывать и превосходить знания сложных закрытых систем, накопленные человечеством за века, - это инструмент, меняющий мир".
Гарри Каспаров и Демис Хассабис на турнире ProBiz в Лондоне. | Фотография Марии Емельяновой/Chess.com.
Журналисты Chess.com опросили восемь из десяти участников турнира в Лондоне об их отношении к матчу программ. Видео с интервью будет размещено на сайте позже.
Наиболее резко критиковал условия матча Хикару Накамура. Сейчас идет горячая дискуссия о вычислительной мощности противников, но Накамура считает, что важнее было другое.
Американский гроссмейстер назвал матч "нечестным", указав, что для оптимальной работы движок Стокфиш должен использовать дебютную книгу. Накамура не думает, что с ее помощью Стокфиш выиграл бы матч, но разрыв в счете был бы намного меньше.
"Я уверен, что сам Господь бог не набрал бы против Стокфиш 75 процентов очков белыми без какой-либо форы", - прокомментировал он результат АльфаЗеро белыми: 25 побед и 25 ничьих.
МГ Ларри Кауфман, ведущий шахматный консультант движка Komodo, надеется увидеть, насколько хорошо работает новая программа на персональных компьютерах, не пользуясь вычислительными мощностями Google. Он также повторил высказанные Накамурой возражения по поводу того, что Stockfish играл без своих обычных дебютных знаний.
"Конечно, это почти невероятно", сказал он, - "да, я слышал о достижениях АльфаГо Зеро в игре го и ожидал, что произойдет что-то подобное, учитывая, что в команде разработчиков есть шахматист Демис Хассабис. Однако, непонятно, сможет ли программа АльфаЗеро играть в шахматы на обычном компьютере, и насколько хорошо у нее это получится. Возможно, современное преобладание шахматных движков, использующих минимаксную функцию, близится к концу, но пока провозглашать это слишком рано. Стоит указать, что за время обучения АльфаЗро де-факто создал собственную дебютную книгу, поэтому было бы справедливее использовать его против движка с хорошей дебютной книгой".
Не касаясь условий матча, Нильсен задумывается, в каких еще областях может применяться данный тип обучения.
"[Это] современный искусственный интеллект", - сказал гроссмейстер. "Он идет от чего-то вроде шахмат к проблемам, достойным нобелевских премий и даже большего. Думаю, нам повезло, что они решили потратить четыре часа на шахматы, но последствия этого открытия куда более значительны".