AlphaZero - od zera do Stockfisha w 4 godziny

Moderator: redjok

AlphaZero - od zera do Stockfisha w 4 godziny

Postprzez biniek » 06 gru 2017, 21:33

Deepmind pokazało nową wersję rewolucyjnej sieci neuronowej, która zasłynęła z pokonania najlepszych graczy w GO.
Początkowo AlphaGo uczyło się "studiując" bazy partii gier rozgrywanych przez ludzi. To podejście umożliwiło całkowite zdominowanie białkowych przeciwników.

Kolejna wersja AlphaGo Zero uczyła się sama, grając wyłącznie przeciwko sobie. W ciągu 40 dni takiego szkolenia osiągnęła poziom AlphaGo a potem wspięła się na poziom nieosiągalny dla poprzedniej wersji.

Teraz DeepMind zaprezentował kolejną wersję programu - Alphazero. Ta wersja jest z kolei uniwersalna, tj. nie jest dostosowana do Go czy do jakiejkolwiek gry. Po nauczeniu programu podstawowych zasad, może się doskonalić w dowolnej grze. DeepMind zaprezentował wyniki tego podejścia na przykładzie Szogi, Go oraz szachów.

W przypadku szachów, okazało się, że Alphazero osiągnęło poziom Stockfisha 8 w ciągu 4 godzin samodzielnego treningu od zera!
Nawet jeśli weźmiemy pod uwagę, że różnice w zastosowanym sprzęcie i konfiguracji mogły faworyzować Alphazero, to osiągnięcie takiego postępu w tak krótkim czasie pokazuje, jak ogromny potencjał tkwi w zastosowanych technikach uczenia maszynowego.

Publikacja DeepMind: https://arxiv.org/pdf/1712.01815.pdf
Przykładowe partie: https://lichess.org/study/EOddRjJ8
Avatar użytkownika
biniek
 
Posty: 160
Dołączył(a): 10 lut 2012, 20:06
Podziękował : 112 razy
Otrzymał podziękowań: 105 razy
Ranking: 0
kurnik.pl: biniek
FICS: biniek

Powrót do Programy i komputery szachowe

Kto przegląda forum

Użytkownicy przeglądający ten dział: Brak zidentyfikowanych użytkowników i 1 gość



REKLAMA

Gdy masz problemy z matma czasami najlepszym rozwiazaniem sa Korepetycje z Matematyki
Zadania Szachowe