954просмотров
82.2%от подписчиков
3 февраля 2026 г.
📷 ФотоScore: 1.0K
Сжатие без потерь: уменьшаем эмбеддинги для онлайн-ранжирования рекламы Можно сделать самую лучшую на свете модель, но от нее будет мало проку, если не обеспечить ее интеграцию в реальные бизнес-процессы. Илья Бадекин, Data Scientist в команде товарных рекомендаций Wildberries, рассказал, как удалось оптимизировать текстовый энкодер для рекомендаций и контекстной рекламы на Wildberries. Хайлайты статьи: ⏹️ текстовый энкодер E5 для товаров
⏹️ семантические эмбеддинги по контенту
⏹️ Matryoshka Representation Learning для сжатия
⏹️ размерность: 1024 → 128
⏹️ сохранение 95–96% метрик
⏹️ оптимизация latency и памяти А еще внутри разбор поиска решения с графиками, сравнением подходов и примерами из продакшна. Читать статью на Хабре 👆 🌟 @wb_space