Google'ın AlphaZero'su 100 Oyunluk Maçta Stockfish'i Yendi
Bugün itibari ile satranç sonsuza kadar değişti. Ve belki de düyanın geri kalanı da değişmiş olabilir.
AlphaGo'nun bir yıldan biraz daha uzun bir süre önce dünyanın en iyi Go oyuncusunu şaşırtıcı bir şekilde yenmesinden sonra, yapay zeka programı AlphaZero en yüksek reytingli satranç motorunu yendi.
Birçok yüksek seviyedeki oyuncu için hayat kurtarıcı bir hazırlık aracı olan ve 2016 TCEC Şampiyonası ile 2017 Chess.com Bilgisayar Satranç Şampiyonası'nın galibi Stockfish'in hiç şansı yoktu. AlphaZero, kapalı kapılar ardında gerçekleştirilen 100 oyunluk maçı 28 galibiyet, 72 berabere ve sıfır mağlubiyet ile kazandı.
Ah, ve AlphaZero'nun satranç "öğrenmesi" sadece dört saatini aldı. Üzgünüz insanlar!
Bu doğru-- Google'ın DeepMind bölümünde yer alan AlphaZero'nun programcıları, öğrenmeyi özel olarak güçlendirmek için bir nevi "makine öğrenimi" kullandılar. Daha basit bir şekilde açıklamak gerekirse, AlphaZero'ya oyun geleneksel anlamda "öğretilmedi". Bu herhangi bir açılış kitabı, oyunsonu çizelgesi ve açıkçası merkez piyonlar ve kenar piyonlar arasındaki dakika farklarını inceden inceye inceleyen karmaşık algoritmalar kullanılmadığı anlamına geliyor.
Londra'daki Google genel merkezinin içeriden görünümü, DeepMind bölümü sekizinci katta yer alıyor. | Fotoğraf: Maria Emelianova/Chess.com.
Bu tıpkı yanmalı motor hakkında hiçbir bilgisi olmayan bir robota binlerce metal parça verilmesi, ve ardından robotun bir Ferrari yapana kadar mümkün olan tüm kombinasyonu birkaç kez denemesi gibi. Bunun hepsi "Yüzüklerin Efendisi" üçlemesini izlemek için gerekli olan süreden daha kısa zamanda gerçekleşiyor. Programın kendi kendine karşı tekrar tekrar oynaması ve böylece kendi öğretmeni olması için dört saati vardı.
Şimdilik, programcı ekip sessiz. Makalenin "şu an değerlendirme aşamasında" olduğunu belirtip Chess.com'a bir yorumda bulmamayı tercih ettiler, ama tam makaleyi buradan okuyabilirsiniz. Araştırma grubunun bir kısmı Demis Hassabis, İngiltere'den bir usta adayı, ve (2014 yılında Google tarafından satın alınan) DeepMind'ın kurucu ortağından oluşuyor. Londra Satranç Klasiği ProBiz turnuvası oynayan Hassabis, şu an Kaliforniya'daki Nöral Bilgi İşleme Sistemleri konferasında başka konuda bir makalenin eş yazarlığını yapıyor.
Demis Hassabis birkaç gün önce Londra'daki Google Genel Merkezi'ndeki ProBiz turnuvasında Michael Adams ile oynadı. | Fotoğraf: Maria Emelianova/Chess.com.
Chess.com'a yorumda bulunan bir kişinin satranç bilgisayarlarına karşı oynama konusunda doğrudan tecrübesi bulunuyor. GM Garry Kasparov DeepMind'ın Go'dan satranca uzanmasına şaşırmadı.
Chess.com'a "AlphaGo'dan sonra bunu bekliyor olmamız gerekse bile bu son derece önemli bir başarı," dedi. "Makine satrancına, kaba kuvvet yerine, Claude Shannon ve Alan Turing'ın hayal ettiği gibi 'B Tipi' insansı bir yaklaşımla yaklaşıyor. "
Makalede yer alan seçilmiş 10 oyundan birisi.
Gerçekten de, tıpkı insanlar gibi, AlphaZero kendinden öncekilerin aksine daha a pozisyon arıyor. Makale, Stockfish'in saniyede 70 milyon pozisyonuna karşın, onun saniyede "sadece" 80,000 poziyona baktığını iddia ediyor.
Dünya Şampiyonu GM Magnus Carlsen'in uzun zamandır yardımcılığını yapan GM Peter Heine Nielsen, FIDE Başkanı ile bir konuda hem fikir: uzaylılar. Chess.com'a söylediği gibi, "makaleyi okuduktan ve özellikle oyunları gördükten sonra, her zaman eğer üstün canlı türlerinin dünyaya ayak basıp bize satrancı nasıl oynadıklarını gösterseydi ne olacağını merak ettiğimi düşündüm. Sanırım şu an biliyorum."
Chess.com'un Nielsen ile AlphaZero haberleri üzerine söyleşisi.
Ayrıca, şaşırtıcı olmayan bir şekilde, cansız varlıkların arasında bile Beyaz'ı popüler olduğunu öğrendik. AlphaZero'nun 28 galibiyetinden 25'i beyaz taraftan geldi (yine de 3400'lük Stockfish karşısında Siyah olarak +3=47-0 da pek fena değil).
Makine ayrıca tercih ettiği açılışların sıklığını da arttırdı. Şah-Hint Savunması oyuncuları, üzgünüz, bebeğiniz seçilen taraf olmadı. Ayrıca programın Fransız Savunması'na karşı olan hevesi de zamanda azaldı, Vezir Gambiti ve özellikle İngiliz Açılışı ise özellikle tercih edilenler arasındaydı.
AlphaZero'nun "öğrenme" aşamasında zamanla tercih ettiği açılışların sıklığı. İmge AlphaZero araştırma makalesinden alınmıştır.
Eğer hiç yorulmayan bir şey olsaydın ve 1400 yıllık bir oyunda uzmanlaşmış olsaydın ne yapardın? Bir başkasını fethetederdin. Stockfish maçından sonra, AlphaZero sadece iki saat boyunca "antrenman yaptı" ve ardından Shogi oynayan en iyi bilgisayar programı "Elmo"yu yendi.
Bu kadar yaratıcı bir şekilde öğrenmenin sonuçları tabii ki oyunlarla kısıtlı değil.
"Her zaman satrancın bir makinenin sıfırdan, hiç bir insan bilgisi olmaksızın, çok iyi derecede oynaması çok fazla ampirik bilgi gerektirdiğini düşünürdük," dedi Kasparov. "Tabii ki AlphaZero'dan satranç konusunda öğrenebileceklerimizi görmek benim çok ilgimi çekiyor, çünkü bu genel anlamda makine öğrenimi konusunda bizlere çok fazla şey vadediyor — makinelerin insanların farkına varamayacağı kuralları hesaplamaları. Ama açıkçası bunun etkileri satranç ve diğer oyunların çok daha ötesinde ve müthiş. Bir makinenin komplex kapalı sistemlerdeki yüzlerce yıllık insan bilgi birikminin benzerini yapması ve bunu geçmesi dünyayı değiştiren bir araç."
Garry Kasparov ve Demis Hassabis Londra'daki ProBiz etkinliğinde beraberler. | Fotoğraf: Maria Emelianova/Chess.com.
Chess.com Londra Satranç Klasiği'ne katılan 10 oyuncudan sekizinin maç hakkında görüşlerini aldı. Onların düşüncelerinin derlendiği bir video çok yakında websitesinde yayınlanacak.
Maçın şartlarına karşı en güçlü itirazı gösteren oyuncu GM Hikaru Nakamura'ydı. İnternet üzere her iki tarafın işlemci gücü hakkında hararetli bir tartışma dönse de, Nakamura bunun ikincil bir problem olduğunu düşünüyordu.
Amerikalı oyuncu maçı "aldatıcı" olarak adlandırdı ve Stockfish'in yönteminin en iyi performans için bir açılış kitabını gerektirdiğini söyledi. Sonunda kazanan tarafın değişmeyecek olduğunu düşünse de, Nakamura kazanç skorunun azalabileceğini düşünüyordu.
AlphaZero'nun Beyaz taşlarla elde ettiği 25 galibiyet ve 25 berabere skoru hakkında "Beyaz taşlarla, bazı engeller olmaksızın Tanrının bile Stockfish'i yüzde 75 ihtimalle yenemeyeceğine oldukça eminim eminim" yorumunda bulundu.
GM Larry Kaufman, Komodo programında önde gelen bir satranç danışmanı, yeni programın performansının Google'ın kendi bilgisayarlarına fayda etmeden ev makinalarında olmasını umuyor.Ayrıca Nakamura'yla benzer bir şekilde Stockfish'in standard açılış bilgisinin olmamasına karşı itirazlarını dile getirdi.
"Aslında bu tabii ki inanılmaz," dedi. "AlphaGo Zero'nun Go'daki başarılarını duyduktan sonra özellikle takımda bir satranç ustası, Demis Hassabis'in, olması nedeniyle, böyle bir şeyi bekliyordum. Net olamayan şey AlphaZero'nun normal PC'lerde satranç oynayıp oynayamayacağı ve eğer oynayabilecekse bunun ne kadar güçlü olacağı. Bu belki de minimax satranç motorlarının şu anki hakimiyetinin sonunu getirecek,ama bunu söylemek için biraz erken. AlphaZero'nun etkileyici bir şekilde kendi açılış kitabını inşaa ettiğine dikkatleri çekmeli, bu nedenle en adil yarış en iyi satranç motorunun iyi bir açılış kitabı kullanması olurdu."
Maç şartlarının etkisi ne olursa olsun, Nielsen başka hangi disiplinlerin bu tip bir öğrenim ile inceleneceği veya ustalaşılacağını görmek konusunda istekli.
"[Bu] gerçek yapay zeka," dedi. "Bu, satrançla alakalı birşeye sahip olmaktan Nobel Ödülleri ya da Nobel Ödüllerinden daha da büyüğünü kazanacak birşeye doğru gidiyor. Aslında bizim için satranç üzerinde dört saat harcamaya karar vermiş olmaları bizim için çok iyi çünkü çok fazla sayıda bilgi ediniyoruz. Bu satranç için çok büyük bir gün ama tabii ki bu çok daha öteye gidiyor."