Historyczny? AlphaZero AI DeepMind pokazuje ludzką intuicję

Zespół AlphaZero w pracy Źródło: DeepMind
Udostępnij tę historię!
Tym razem jest to tylko gra w szachy, ale w prawdziwym życiu naprawdę chcemy, aby sztuczna inteligencja „chętnie poświęciła swoich żołnierzy dla lepszej pozycji w potyczce… przywiązując znacznie mniejszą wagę do pojedynczych figur”? Intuicja jest cechą ludzkiej duszy, której bezwładna sztuczna inteligencja nigdy nie może się powielić. ⁃ Edytor TN

Program sztucznej inteligencji DeepMind AlphaZero wykazuje teraz oznaki ludzkiej intuicji i kreatywności, co deweloperzy nazywali „punktem zwrotnym” w historii.

System komputerowy zadziwił świat w zeszłym roku kiedy opanował grę w szachy od zera w ciągu zaledwie czterech godzin, mimo że nie został zaprogramowany, jak wygrać.

Ale teraz, po roku testów i analiz przeprowadzonych przez arcymistrzów szachowych, maszyna opracowała nowy styl gry, niespotykany dotąd, sugerując, że program improwizuje jak człowiek.

W przeciwieństwie do najlepszej maszyny szachowej na świecie - Stockfisha - która oblicza miliony możliwych wyników podczas gry, AlphaZero uczy się na swoich przeszłych sukcesach i porażkach, opierając swoje ruchy na mglistym poczuciu, że wszystko się uda na dłuższą metę , ”według ekspertów w DeepMind.

Kiedy AlphaZero zmierzyło się ze Sztokfiszem w grach 1,000, straciło zaledwie sześć, wygrywając w przekonujący sposób 155 i wylosując pozostałe walki.

Jednak sposób, w jaki grał, zadziwił programistów. Podczas gdy komputery szachowe przeważnie lubią trzymać się swoich pionków, AlphaZero chętnie poświęcił swoich żołnierzy, aby uzyskać lepszą pozycję w potyczce.

W rozmowie z „The Telegraph” prof. David Silver, który kieruje grupą badawczą zajmującą się badaniami nad wzmocnieniami w DeepMind, powiedział: „Ma bardzo subtelne poczucie intuicji, które pomaga zrównoważyć wszystkie różne czynniki.

„Ma sieć neuronową z milionami różnych parametrów, które można dostrajać, z których każdy uczy się swoich własnych reguł dotyczących tego, co jest dobre w szachach, a kiedy połączysz je wszystkie razem, otrzymujesz coś, co w dość mózgowy sposób wyraża naszą ludzką zdolność do Rzuć okiem na pozycję i powiedz „ah ha, to jest właściwa rzecz”.

„Moim osobistym przekonaniem jest to, że widzieliśmy coś w punkcie zwrotnym, w którym zaczynamy rozumieć, że wiele umiejętności, takich jak intuicja i kreatywność, o których wcześniej myśleliśmy, że należą do dziedziny ludzkiego umysłu, jest w rzeczywistości dostępnych dla inteligencji maszynowej także. Myślę, że to naprawdę ekscytujący moment w historii. ”

AlphaZero zaczynał jako „tabula rasa” lub system pustych tablic, zaprogramowany tylko z podstawowymi zasadami szachów i nauczył się wygrywać, grając przeciwko sobie w milionach gier w procesie prób i błędów zwanych uczeniem się przez wzmocnienie.

Jest to ten sam sposób, w jaki uczy się ludzki mózg, dostosowując taktykę na podstawie poprzedniej wygranej lub przegranej, co pozwala mu wyszukiwać zaledwie 60 tysięcy pozycji na sekundę, w porównaniu do około 60 miliona Sztokfisz.

W ciągu zaledwie kilku godzin program samodzielnie odkrył i zagrał typowe ludzkie otwarcia i strategie, zanim zaczął rozwijać własne pomysły, takie jak szybkie rój wokół króla przeciwnika i przypisywanie znacznie mniejszej wartości poszczególnym elementom.

Nowy styl gry został przeanalizowany Chess Grandmaster Matthew Sadler i Women's International Master Natasha Regan, którzy twierdzą, że w przeciwieństwie do tradycyjnego silnika szachowego.

„To jak odkrywanie sekretnych notatników jakiegoś świetnego gracza z przeszłości” - powiedział Sadler.

Regan dodał: „Fascynujące było zobaczyć, jak analiza AlphaZero różniła się od analizy najlepszych silników szachowych, a nawet najlepszych gier arcymistrzowskich. AlphaZero może być potężnym narzędziem nauczania dla całej społeczności ”.

Garry Kasparow, były mistrz świata w szachach, który w 1997 przegrał z maszyną do gry Deep Blue, powiedział: „Zamiast przetwarzać ludzkie instrukcje i wiedzę z ogromną prędkością, tak jak wszystkie poprzednie maszyny do gry w szachy, AlphaZero gromadzi własną wiedzę.

„Gra w bardzo dynamicznym stylu, podobnie jak mój. Implikacje wykraczają daleko poza moją ukochaną szachownicę”.

Przeczytaj całą historię tutaj…

Zapisz się!
Powiadamiaj o
gość

0 Komentarze
Informacje zwrotne w linii
Wyświetl wszystkie komentarze