"alternatywne dane”, Według niektórych funduszy hedgingowych, branża, która sprzedaje informacje takie jak pobieranie aplikacji i zakupy kartami kredytowymi grupom inwestycyjnym, nie usuwa odpowiednio danych osobowych przed udostępnieniem materiałów.
Szybko rozwijający się świat dużych zbiorów danych jest postrzegany jako coraz bardziej atrakcyjne źródło informacji dla zarządzających aktywami poszukujących istotnej przewagi inwestycyjnej, a dostawcy danych sprzedają wszystko, od rozmów w mediach społecznościowych i pokwitowań e-mailem po federalne dane lobbingowe, a nawet zdjęcia satelitarne z kosmosu. Ale kilka funduszy hedgingowych twierdzi, że niektórzy sprzedawcy sprzedają informacje, które nadal zawierają poufne dane osobowe, które można wykorzystać do identyfikacji osób.
„Sprzedawcy twierdzą, że usuwają wszystkie dane osobowe, ale od czasu do czasu znajdujemy numery telefonów, kody pocztowe i tak dalej” - powiedział Matthew Granade, szef wywiadu rynku w Point72 Stevena Cohena. „To wielka sprawa, że mamy kilku pełnoetatowych pracowników technicznych, którzy sami zmywają dane”.
Szef innego dużego funduszu hedgingowego powiedział, że nawet gdy dane osobowe zostały usunięte z zestawu danych, przywrócenie danych było zbyt łatwe. „Byliśmy zszokowani, jak łatwo było zanonimizować dane” - powiedział. „Jeden z moich analityków 30 poświęcił kilka minut na znalezienie kogoś, kto prawdopodobnie miał romans”.
Zaawansowane podejścia algorytmiczne, takie jak „uczenie maszynowe”Pozwalają zarządzającym pieniędzmi przeszukiwać ogromne zbiory danych w celu uzyskania zyskownych wzorców. Firma konsultingowa Tabb Group szacuje, że w samych Stanach Zjednoczonych wydatki na duże zbiory danych podwoją się w ciągu najbliższych pięciu lat do 400m, podczas gdy CB Insights, dostawca danych, liczy co najmniej start-upy 30 w terenie.