Деанонимизация с LLM стала дешевле и быстрее. В новой статье — @kokuykin

909просмотров

51.8%от подписчиков

3 марта 2026 г.

📷 ФотоScore: 1.0K

Деанонимизация с LLM стала дешевле и быстрее. В новой статье исследователей из ETH Zurich, при соавторстве небезызвестного Николаса Карлини, проведен эксперимент по сопоставлению активности на Hacker News с реальными личностями. Авторы взяли десятки тысяч профилей и проанализировали публичные тексты с помощью LLM, после чего смогли сопоставлять пользователей форума с профилями LinkedIn с высокой точностью и полнотой порядка 90% и 54% в обе стороны. Пару лет назад я писал про первые работы в этой области, и тогда в игровой форме уже было видно, как популярные модели неплохо извлекают персональные атрибуты из произвольного текста. В новой работе авторы также показывают масштабируемость поиска: по мере роста массива кандидатов, среди которых ищется совпадение, качество падает около логарифмически. То есть метод остается эффективным даже при поиске среди сотен тысяч и теоретически сотен миллионов профилей. Что примечательно, в статье нет типичного для таких работ сравнения точности разных моделей. На разных шагах алгоритма используются Gemini, GPT-5 и Grok. Мы уже в точке, где для этого класса задач разница между топовыми моделями не является существенной. Кажется, мы приближаемся к новому открытому и асимметричному миру, где когда-то ваша приватная информация будет доступна для анализа и OSINT. Если раньше такие сюжеты были частью романов о далеком будущем, таких как «Задача трёх тел» Лю Цысиня, S.N.U.F.F. Пелевина и «Свет иных дней» Бакстера и Кларка, то сейчас, в свете новостей про скандал Anthropic и Минобороны США о массовой слежке, данный эксперимент уже не кажется фантастикой.

Другие посты @kokuykin