Program sztucznej inteligencji DeepMind AlphaZero wykazuje teraz oznaki ludzkiej intuicji i kreatywności, co deweloperzy nazywali „punktem zwrotnym” w historii.
System komputerowy zadziwił świat w zeszłym roku kiedy opanował grę w szachy od zera w ciągu zaledwie czterech godzin, mimo że nie został zaprogramowany, jak wygrać.
Ale teraz, po roku testów i analiz przeprowadzonych przez arcymistrzów szachowych, maszyna opracowała nowy styl gry, niespotykany dotąd, sugerując, że program improwizuje jak człowiek.
W przeciwieństwie do najlepszej maszyny szachowej na świecie - Stockfisha - która oblicza miliony możliwych wyników podczas gry, AlphaZero uczy się na swoich przeszłych sukcesach i porażkach, opierając swoje ruchy na mglistym poczuciu, że wszystko się uda na dłuższą metę , ”według ekspertów w DeepMind.
Kiedy AlphaZero zmierzyło się ze Sztokfiszem w grach 1,000, straciło zaledwie sześć, wygrywając w przekonujący sposób 155 i wylosując pozostałe walki.
Jednak sposób, w jaki grał, zadziwił programistów. Podczas gdy komputery szachowe przeważnie lubią trzymać się swoich pionków, AlphaZero chętnie poświęcił swoich żołnierzy, aby uzyskać lepszą pozycję w potyczce.
W rozmowie z „The Telegraph” prof. David Silver, który kieruje grupą badawczą zajmującą się badaniami nad wzmocnieniami w DeepMind, powiedział: „Ma bardzo subtelne poczucie intuicji, które pomaga zrównoważyć wszystkie różne czynniki.
„Ma sieć neuronową z milionami różnych parametrów, które można dostrajać, z których każdy uczy się swoich własnych reguł dotyczących tego, co jest dobre w szachach, a kiedy połączysz je wszystkie razem, otrzymujesz coś, co w dość mózgowy sposób wyraża naszą ludzką zdolność do Rzuć okiem na pozycję i powiedz „ah ha, to jest właściwa rzecz”.
„Moim osobistym przekonaniem jest to, że widzieliśmy coś w punkcie zwrotnym, w którym zaczynamy rozumieć, że wiele umiejętności, takich jak intuicja i kreatywność, o których wcześniej myśleliśmy, że należą do dziedziny ludzkiego umysłu, jest w rzeczywistości dostępnych dla inteligencji maszynowej także. Myślę, że to naprawdę ekscytujący moment w historii. ”
AlphaZero zaczynał jako „tabula rasa” lub system pustych tablic, zaprogramowany tylko z podstawowymi zasadami szachów i nauczył się wygrywać, grając przeciwko sobie w milionach gier w procesie prób i błędów zwanych uczeniem się przez wzmocnienie.
Jest to ten sam sposób, w jaki uczy się ludzki mózg, dostosowując taktykę na podstawie poprzedniej wygranej lub przegranej, co pozwala mu wyszukiwać zaledwie 60 tysięcy pozycji na sekundę, w porównaniu do około 60 miliona Sztokfisz.
W ciągu zaledwie kilku godzin program samodzielnie odkrył i zagrał typowe ludzkie otwarcia i strategie, zanim zaczął rozwijać własne pomysły, takie jak szybkie rój wokół króla przeciwnika i przypisywanie znacznie mniejszej wartości poszczególnym elementom.
Nowy styl gry został przeanalizowany Chess Grandmaster Matthew Sadler i Women's International Master Natasha Regan, którzy twierdzą, że w przeciwieństwie do tradycyjnego silnika szachowego.
„To jak odkrywanie sekretnych notatników jakiegoś świetnego gracza z przeszłości” - powiedział Sadler.
Regan dodał: „Fascynujące było zobaczyć, jak analiza AlphaZero różniła się od analizy najlepszych silników szachowych, a nawet najlepszych gier arcymistrzowskich. AlphaZero może być potężnym narzędziem nauczania dla całej społeczności ”.
Garry Kasparow, były mistrz świata w szachach, który w 1997 przegrał z maszyną do gry Deep Blue, powiedział: „Zamiast przetwarzać ludzkie instrukcje i wiedzę z ogromną prędkością, tak jak wszystkie poprzednie maszyny do gry w szachy, AlphaZero gromadzi własną wiedzę.
„Gra w bardzo dynamicznym stylu, podobnie jak mój. Implikacje wykraczają daleko poza moją ukochaną szachownicę”.