Przełom Google AI: głęboki umysł może uczyć się bez udziału człowieka

Udostępnij tę historię!

Google znajduje się w czołówce firm poszukujących globalnej technokracji, a ich dążenie do autonomicznej sztucznej inteligencji zagraża samemu rdzeniu światowego społeczeństwa. Zagrożenie jest realne, ale niewielu obywateli rozumie złożoność tej technologii.  Edytor TN

Nie tak dawno opanowanie starożytnej chińskiej gry Go było poza zasięgiem sztuczna inteligencja. Ale wtedy AlphaGo, odtwarzacz AI Google DeepMind, zaczął wychodzić nawet najlepsi przeciwnicy w pyle. Jednak nawet ta pokonująca świat sztuczna inteligencja potrzebowała ludzi do nauki. Następnie, w środę, nowa wersja DeepMind całkowicie porzuciła ludzi.

AlphaGo Zero przekroczył zdolności swojego poprzednika, omijając tradycyjną metodę uczenia się gier AI, która polega na oglądaniu tysięcy godzin ludzkiej zabawy. Zamiast tego po prostu zaczyna grać losowo, doskonaląc swoje umiejętności, wielokrotnie grając przeciwko sobie. Trzy dni, a 4.9 milionów takich gier później, wynikiem jest najlepsza na świecie sztuczna inteligencja.

„Jest potężniejszy niż poprzednie podejścia, ponieważ usunęliśmy ograniczenia ludzkiej wiedzy” - mówi David Silver, główny badacz AlphaGo.

„Ludzkość zgromadziła wiedzę na temat Go z milionów gier rozgrywanych przez tysiące lat” - piszą autorzy. „W ciągu kilku dni… AlphaGo Zero było w stanie odkryć wiele z tej wiedzy na temat Go, a także nowatorskie strategie, które zapewniają nowy wgląd w najstarsze gry.”

Alternatywne podejście AlphaGo Zero pozwoliło odkryć strategie, których ludzie nigdy nie znaleźli. Na przykład nauczył się wielu różnych josekis - sekwencji ruchów, które nie powodują żadnej straty netto dla żadnej ze stron. Wiele josekis zostało spisanych w ciągu tysięcy lat grania w Go, a początkowo AlphaGo Zero nauczył się wielu znanych. Ale w miarę kontynuowania samokształcenia zaczął faworyzować nieznane wcześniej sekwencje.

Aby przetestować te nowe ruchy, DeepMind zmierzył AlphaGo Zero z wersją, która pokonała mistrza świata 18, Lee Sedola. W grze 100 uraza, wygrał 100-0. Dzieje się tak pomimo treningu przez trzy dni, w porównaniu do kilku miesięcy w przypadku jego poprzednika. Po dniach treningu 40 wygrał także 89-11 przeciwko lepszej wersji AlphaGo, która pokonała światowego lidera Ke Jie (NaturaDOI: 10.1038 / nature24270).

Przeczytaj całą historię tutaj…

Zapisz się!
Powiadamiaj o
gość

0 Komentarze
Informacje zwrotne w linii
Wyświetl wszystkie komentarze