Przez wiele lat anonimowość była jednym z fundamentów funkcjonowania internetu. Użytkownicy mogli wypowiadać się na forach, w mediach społecznościowych czy pod artykułami bez konieczności ujawniania swojej prawdziwej tożsamości. Coraz więcej wskazuje jednak na to, że ten etap w historii sieci powoli dobiega końca.
Nowe badania prowadzone przez naukowców z Politechniki Federalnej w Zurychu we współpracy z firmą Anthropic pokazują, że sztuczna inteligencja jest w stanie z dużą skutecznością powiązać anonimowe wpisy z konkretnymi osobami.
Cyfrowy odcisk stylu pisania
Kluczem do identyfikacji użytkowników jest tzw. stylometria, czyli analiza sposobu pisania. Każdy z nas — często nieświadomie — używa charakterystycznych zwrotów, konstrukcji zdań czy powtarzających się słów. Te elementy tworzą swoisty językowy odcisk palca.
W przeszłości tego typu analiza była bardzo czasochłonna. Badacze musieli ręcznie porównywać duże zbiory tekstów, aby odnaleźć podobieństwa. W praktyce oznaczało to dziesiątki lub nawet setki godzin pracy nad jednym przypadkiem.
Sztuczna inteligencja zmieniła jednak zasady gry.
Nowoczesne modele językowe potrafią analizować ogromne ilości tekstu w bardzo krótkim czasie, a jednocześnie wychwytywać subtelne podobieństwa w stylu wypowiedzi.
Eksperyment z anonimowymi użytkownikami
W ramach eksperymentu badacze próbowali powiązać anonimowe wpisy publikowane w internecie z rzeczywistymi osobami.
Analizie poddano między innymi użytkowników serwisów takich jak Reddit oraz Hacker News, gdzie wiele kont funkcjonuje wyłącznie pod pseudonimami i nie wymaga podawania danych osobowych.
Modele AI porównywały anonimowe wpisy z publicznie dostępnymi treściami publikowanymi przez użytkowników w innych miejscach w sieci — na przykład na LinkedIn. Rezultat był zaskakująco
skuteczny. W około 70 procentach przypadków sztucznej inteligencji udało się poprawnie przypisać anonimowy profil do konkretnej osoby.
Jak działa identyfikacja
Proces identyfikacji przebiega w kilku etapach.
Najpierw system analizuje tekst i tworzy jego reprezentację semantyczną — czyli matematyczny model opisujący znaczenie oraz sposób użycia słów. Następnie porównuje go z ogromną bazą innych tekstów dostępnych w internecie.
Na tej podstawie sztuczna inteligencja wybiera grupę najbardziej prawdopodobnych autorów, a następnie — poprzez dalszą analizę stylu i kontekstu — zawęża wyniki do jednej osoby.
Co istotne, analiza dotyczy wyłącznie samej treści.
Oznacza to, że nawet stosowanie narzędzi takich jak VPN, które ukrywają adres IP lub lokalizację użytkownika, nie ma w tym przypadku większego znaczenia.
Koniec anonimowości?
Autorzy badania nie mają złudzeń.
Ich zdaniem rozwój narzędzi wykorzystujących sztuczną inteligencję sprawia, że pełna anonimowość w internecie przestaje być możliwa.
W przyszłości podobne technologie mogą być wykorzystywane nie tylko przez badaczy, ale również przez:
rządy i instytucje państwowe
duże korporacje
firmy zajmujące się analizą danych
a nawet cyberprzestępców
W pierwszym przypadku narzędzia te mogą służyć do identyfikowania autorów nielegalnych treści lub walki z dezinformacją. W drugim — do jeszcze dokładniejszego profilowania użytkowników i dopasowywania reklam.
Istnieje jednak także ciemniejsza strona tego zjawiska.
Niektórzy eksperci ostrzegają, że podobne technologie mogą zostać wykorzystane do masowej inwigilacji i ograniczania wolności słowa w internecie.
Czy można się przed tym bronić?
Teoretycznie tak, jednak w praktyce jest to bardzo trudne.
Aby utrudnić identyfikację, użytkownik musiałby ograniczyć publikowanie informacji, które mogą go wyróżniać — takich jak miejsce zamieszkania, zawód, wydarzenia, w których uczestniczył czy charakterystyczne zainteresowania.
Nawet drobne szczegóły mogą bowiem zawężać grono potencjalnych autorów.
Eksperci podkreślają, że w przyszłości każdy użytkownik internetu powinien zakładać jedno: wszystko, co publikujemy w sieci, może zostać kiedyś przypisane do naszej prawdziwej tożsamości.
Nie musi się to wydarzyć od razu.
Ale rozwój sztucznej inteligencji sprawia, że z każdym rokiem staje się to coraz łatwiejsze.
Dalsza część artykułu dostępna po zakupie prenumeraty lub tego numeru.
Wykup prenumeratę lub ten numer i czytaj dalej