Trzy źle skonfigurowane wiadra AWS S3 zostały szeroko otwarte w publicznym Internecie, zawierające „dziesiątki terabajtów” postów w mediach społecznościowych i podobnych stron - wszystkie zeskrobane z całego świata przez wojsko amerykańskie w celu identyfikacji i profilowania osób będących przedmiotem zainteresowania.
Archiwa zostały znalezione by weteran łowca naruszeń bezpieczeństwa Chris Vickery z UpGuard podczas rutynowego skanowania otwartych silosów danych hostowanych przez Amazon, a te nie zostały dokładnie ukryte. Zasobniki zostały nazwane centcom-backup, centcom-archive i pacom-archive.
CENTCOM to wspólny skrót amerykańskiego dowództwa centralnego, które kontroluje operacje wojskowe na Bliskim Wschodzie, w Afryce Północnej i Azji Środkowej. PACOM to nazwa US Pacific Command, obejmująca resztę południowej Azji, Chin i Australii.
Vickery powiedziała Rejestr dzisiaj natknął się na nich przypadkowo, wyszukując słowo „COM” w publicznie dostępnych zasobnikach S3. Po doprecyzowaniu poszukiwań pojawiło się archiwum CENTCOM i początkowo myślał, że jest to związane z chińskim międzynarodowym Tencentem, ale szybko zdał sobie sprawę, że jest to archiwum wojskowe Stanów Zjednoczonych o zdumiewającej wielkości.
„Do badań pobrałem 400 GB próbek, ale było tam wiele terabajtów danych” - powiedział. „Są to głównie skompresowane pliki tekstowe, które mogą się rozszerzyć dziesięciokrotnie, więc są tam dziesiątki terabajtów i to ostrożne oszacowanie”.
Tylko jeden z wiader zawierał 1.8 miliardów postów w mediach społecznościowych automatycznie pobieranych w ciągu ostatnich ośmiu lat do dziś. Zawiera głównie posty zamieszczone w Azji Środkowej, jednak Vickery zauważyła, że część materiału pochodzi z komentarzy obywateli amerykańskich.
Bazy danych ujawniają również kilka interesujących wskazówek, do czego służą te informacje. Dokumenty odnoszą się do faktu, że archiwum zostało zebrane w ramach programu rządu USA Outpost, który jest kampanią monitorującą i wpływającą na media społecznościowe, mającą na celu atakowanie młodzieży z zagranicy i odwracanie jej od terroryzmu.
Vickery znalazł w archiwum pliki konfiguracyjne programu Outpost, a także indeksy słów kluczowych Apache Lucene przeznaczone do użytku z wyszukiwarką open source Elasticsearch. Inny plik odnosi się do Coral, co może być odniesieniem do programu eksploracji danych Coral Reef prowadzonego przez wojsko USA.
„Rafa koralowa to sposób analizy głównego źródła danych, aby zapewnić analitykowi możliwość wydobywania znacznych ilości danych i zapewnić sugestywne skojarzenia między osobami w celu zbudowania tej sieci społecznościowej” - Mark Kitz, dyrektor techniczny Army Distributed Common Ground System - wojsko, powiedział magazyn Stowarzyszenia Komunikacji i Elektroniki Sił Zbrojnych Sygnał z powrotem w 2012.
„Wcześniej przeszukiwaliśmy te raporty wywiadowcze lub jakiekolwiek dane, które byłyby dostępne, a to wymagałoby bardzo dużego wysiłku ręcznego”.