441просмотров
68.0%от подписчиков
3 декабря 2025 г.
question🎬 ВидеоScore: 485
Как использовать технологии конфиденциальных вычислений для монетизации данных? На Scoring Day об этом рассказала Анна Лагунова, руководитель монетизации данных для кредитного бизнеса в Т‑Банке. Почему вообще нужно что‑то менять в передаче данных, если «и так всё работает»? У кредитного бизнеса есть множество потенциально полезных источников информации, которые до сих пор недоступны банкам. Часть данных защищена законом, остальные — их владельцами, которые не хотят терять конкурентное преимущество, раскрывая сырые данные. В итоге: — теряем данные из‑за распределённости источников и тратим месяцы на подключение новых; — упираемся в потолок качества моделей, построенных только на внутренних данных или классических партнерских скорах. — и не можем строить модели на полноценных данных. Что с этим делать? Задачу можно решать с помощью технологий повышения приватности (PET, privacy‑enhancing technologies), таких как: — безопасные многопользовательские вычисления (MPC), — дифференциальная приватность (DP), — доверенные вычислительные среды (TEE), — гомоморфное шифрование и др. На международном рынке уже есть кейсы использования технологий на стыке ИИ и PET — такой подход, например, выбрала Alibaba для платформы обмена данными. Основная проблема — подобрать правильную технологию под задачу, которую вы решаете. Например, для кейса «Обучение нейросетей», в рамках которого два партнера были готовы обмениваться данными ради синергетического эффекта, оптимальным решением стали многопользовательские вычисления (MPC). Основное требование банка — персональные данные клиентов, эмбеддинги, переменные, целевые события и т. п. не должны передаваться третьим сторонам или консолидироваться у третьих лиц — даже при обучении моделей. Преимущества подхода: — данные могут быть разной природы и разной размерности;
— есть возможность обучения на любое целевое событие. В нашем примере обучение было направлено на вероятность дефолта, но это могут быть не только бинарные таргеты, но и, например, модели дохода. По типу задач ограничений фактически нет;
— нет потери в качестве модели из-за конфиденциальных вычислений; — подход легко масштабируется на любое количество участников. Для реализации кейса «Граф партнерских связей» с телеком-оператором была выбрана технология гомоморфного шифрования. Целью проекта было заявлено усиление моделей для клиентов, по которым было недостаточно данных за счет связей от партнеров (звонки, sms, предложения дружбы в соцсетях и пр.) за счет повышения полноты источников. Основным результатом стали прибавки к действующим моделям, особенно на сегменте с малым количеством внутренних данных. Видим потенциал развития графов с другими партнерами, в т.ч. возможность использования связей от нескольких партнеров одновременно. С чем можно столкнуться при проведении пилотов: — огромное количество согласований с юристами и ИБ. Они долгие и могут занимать больше времени, чем придумывание концепции и обучение модели. — некоторые регуляторные ограничения. — проблемы с кадрами. Если вы жалуетесь на нехватку датасаейнтистов, попробуйте найти криптографа‑датасайентиста. Т-Банк запустил курс по криптографии в Центральном университете, но задача формирования специалистов в этой области стоит перед всем рынком. — проблема эффективности протоколов и алгоритмов. Если модель подбирается под скоринговые задачи, она должна срабатывать в сжатые сроки — желательно, меньше минуты. Это накладывает серьезные ограничения на используемые нами алгоритмы и требует их оптимизации.