Według nowego badania nawet jeśli uważasz, że przeglądasz Twitter „anonimowo”, algorytmy uczenia maszynowego mogą nadal wskazywać cię w tłumie innych użytkowników 10,000 korzystających z metadanych powiązanych z Twoimi postami.
„Metadane” odnoszą się do danych o innych danych. W kontekście postu na Twitterze obejmuje to datę i godzinę postu, liczbę znaków w nim, urządzenie, z którego został wysłany, jego styl gramatyczny, lokalizację, z której został wysłany, oraz wiele innych znaczników. Przeciętny tweet zawiera około 144 fragmentów metadanych.
Korzystając z uczenia maszynowego, naukowcy z University College London i Turing Institute opracowali metodę identyfikacji poszczególnych użytkowników z dokładnością 96.7 przy użyciu samych metadanych. Nawet jeśli Twój uchwyt to „LibPwner2016”, metadane nadal mogą ujawnić, kim jesteś. Większość tych metadanych jest dostępna za pośrednictwem interfejsu API Twittera.
Eksperyment przeprowadzono na Twitterze, ale naukowcy twierdzą, że te same metody można wykorzystać do testowania prywatności na innych platformach.
„Metody opisane w tej pracy można zastosować do ogromnej klasy platform i systemów generujących metadane o podobnych cechach” – podsumowują badacze.
To zła wiadomość dla Facebooka, który spędził większość tego roku na kontroli krajowej po wielokrotnych skandalach związanych z utratą poufnych danych użytkowników na rzecz stron trzecich.