Kiedy James Shinn pracował dla CIA jako starszy ekspert z Azji Wschodniej ponad dziesięć lat temu, tęsknił za narzędziami pogodowca. Chciał być w stanie przewidzieć, że szansa na wystrzelenie w Korei Północnej pocisku w ciągu miesiąca wyniesie, powiedzmy, procent 60. Do tej pory pozostało fantazją.
Shinn i jego zespół 14 w Predata opracowali oprogramowanie, które liczbowo opisuje zmienność polityczną i ryzyko. Odsysa ogromne ilości danych z rozmów i komentarzy online, porównuje je z wcześniejszymi wzorcami i wypluwa prawdopodobieństwo. (Wersja usługi Predata jest dostępna na Bloomberg Profesjonalna obsługa.) Shinn porównuje swój produkt do sabermetrii, opartej na statystykach strategii baseballowej spopularyzowanej przez Michaela Lewisa Moneyball. „Starannie gromadząc wiele statystyk dotyczących ich wyników w przeszłości ze wszystkich zakątków Internetu, przewidujemy, jak duża liczba graczy w drużynie uderzy lub rzuci się w przyszłość” - mówi Shinn na zasadzie analogii.
Predata nie zastępuje ludzkich analityków tak bardzo, jak oferuje im nowe narzędzie. Bez ludzi wybierających to, co należy śledzić, skrobanie metadanych ma ograniczone zastosowanie. Co więcej, twierdzi Shinn, podczas gdy firmy zajmujące się analizą ryzyka coraz częściej oferują klientom odsetki liczbowe, dane często są pobierane z powietrza. „To napędzany maszyną, starannie obliczony wskaźnik ryzyka”, mówi Shinn, założyciel i dyrektor generalny firmy. „Ludzki analityk nie ma arbitralnej oceny”.
Każdego dnia Predata monitoruje kanały 1,000 na Twitterze, strony Wikipedii 10,000, filmy z YouTube 50,000 oraz kilkadziesiąt gazet i czasopism w niektórych krajach 200. Obejmuje tematy związane z 300, w tym wiadomości o poszczególnych firmach, debatę na temat wyjścia Wielkiej Brytanii z Unii Europejskiej oraz decyzje banków centralnych dotyczące stóp procentowych.
Dane historyczne są najważniejsze. Na przykład Predata nie opracowała statystycznie użytecznej prognozy dla marcowego 22 ataki w Brukseliczęściowo dlatego, że Belgia doświadczyła niewielu takich incydentów. Według Shinna oprogramowanie potrzebuje co najmniej pięciu poprzednich zdarzeń, aby znaleźć korelację między cyfrowymi rozmowami a aktem terroryzmu. Z drugiej strony Francja była świadkiem incydentów 13 przed atakami paryskimi na 13; firma twierdzi, że jej model wskazał prawdopodobieństwo wystąpienia zdarzenia z co najmniej procentem 61 miesięcznie z góry. Podobnie, w grudniu 27, Predata mówi, że obliczył 68 procentową szansę, że Korea Północna zaangażuje się w pewne działania dotyczące broni masowego rażenia w ciągu dni 45. Prawie dwa tygodnie później, w styczniu 6, reżim Kim Jong Un przeprowadził naród czwarty test nuklearny.
Shinn, który był asystentem sekretarza ds. Azji Wschodniej w Departamencie Obrony USA po zakończeniu pracy w CIA, zaczął rozwijać technologię w 2014, nauczając w swojej macierzystej uczelni, Princeton, i zasiadając w radzie doradczej Kensho Technologies, oprogramowania analitycznego programista do zarządzania inwestycjami. Dyrektor generalny Kensho, Daniel Nadler i Shinn eksperymentowali w wolnym czasie z prymitywnym prototypem, który monitorował rozmowy online między związkami zawodowymi w Południowej Afryce, sądząc, że dane te mają wpływ na zmienność kraju. Znaleźli tę argumentację w języku angielskim i afrikaans na stronach tak publicznych, jak strony związków zawodowych w Wikipedii gwałtownie wzrosły przed strajkami górniczymi, po których ceny złota i platyny wzrosły.
Przeczytaj całą historię tutaj…