Вместо итогов года, хочу поделиться моим списком лучших — самых значимых или просто понравившихся — статей, которые я прочитал за последние два года (про 2024 раньше не писал). В порядке прочтения. Unified Embedding Статья DeepMind о том, что можно использовать одну универснальную таблицу эмбеддингов для многих sparse фичей. Полезная практическая статья. Обзоры в Рекомендательной и у Дани. Actions Speak Louder than Words Громкая статья от Meta. Первая показала, что можно обучать огромные модели ...
Wazowski Recommends
В этом канале я (@Wazowski) пишу о рекомендательных системах и не только. Реклама на канале не размещается. Забустить этот канал можно по ссылке https://t.me/WazowskiRecommends?boost
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
20 из 20Канал Коли, из которого два предыдущих поста, обещает быть интересным. Когда я уходил из Яндекса почти три года назад, Коля приходил (возвращался) практически как моя замена. С тех пор служба рекомендательных технологий выросла раза в два и продолжает демонстрировать весьма достойные результаты.
Месяц назад мне скинули ссылку на выступление от Яндекс Маркета на Highload++ (аж 2023, но, видимо, видео не так давно выложили) про их персональные рекомендации. Ничего особенного в нём нет, но зато есть кусок и про платформу DJ, и про алгоритм Mixigen — результаты работы нашей команды. Кстати, если кто знает ещё публичные рассказы про DJ — дайте знать. Про Миксиджен хочется рассказать подробнее, потому что это штука хорошая, а настоящую статью про него уже всё равно вряд ли кто-нибудь напишет....
Экс-Экс Многие из вас могут помнить, как почти год назад я расписывал, насколько классно мне работалось в X. И вот, это путешествие подошло к концу — я больше не работаю в Х. Сейчас у меня небольшой отдых, а что будет дальше — stay tuned.
Во что мы верим: Scaling Hypothesis (часть 2) Есть ли области, в которых масштабирование до сих пор не работало? Робототехника одна из них: от автономных машин до гуманойдных роботов. Главная проблема этой области - количество данных. Из всех статей про скейлинг мы видим, что 3 оси должны масштабироваться в линейной пропорции: размер модели, количество данных, количество вычислений. Однако и тут, как только с данными разобрались, всё заработало (GR00T N1: An Open Foundation Model for Generalist ...
❤️📱📱📱
Когда работаешь над рекомендательным сервисом, одна из самых частых и сложных проблем — понять (и договориться с остальными), что такое хорошие рекомендации. Конечно, мы привыкли к тому, что у нас есть метрики. Если north star растёт, а guardrail-метрики не падают — значит, всё хорошо. Так? К сожалению, часто так бывает, что приходит топ-менеджер и, не смотря ни на какие метрики, жалуется: «Какого черта вы порекомендовали мне ЭТО? Ваш алгоритм никуда не годится!» Знакомо? Особенно это распростра...
Обычно у рекомендательных сервисов есть главная метрика, которую они пытаются растить, north star. Насколько я могу судить (и когда-то я уже писал об этом), в большинстве случаев это одна из четырех: 1) Time spent (сколько времени пользователи проводят на сервисе) 2) Транзакции (количество или суммарная стоимость, GMV) 3) Подписки 4) DAU (или похожие метрики user retention) Конечно же, это исходит от бизнес-модели сервиса. У меня есть мнение (или лучше сказать — гипотеза), что среди этих метрик ...
На этой неделе я начал работать в организации-которую-нельзя-называть-без-звёздочки. По многим аспектам новый работодатель кажется полной противоположностью предыдущего. Например, по размеру. От области рекомендаций я ушёл совсем недалеко: буду заниматься рекламой. Причём одной из моих любимых тем — long-term value optimization. Мой менеджер пытался меня нанять ещё с 2021 года. На третий раз я всё-таки согласился 😊
С начала 2012 года (где-то в период «map к новому году») я начал заниматься одним из любимых видов спорта (чем-то напоминающим спортивное программирование) — хождением по собеседованиям. В ту пору бигтех-компании периодически приезжали в Москву с hiring event-ами. Сначала я успешно прособеседовался в Бинг (и отказался потом от оффера). А вот с Амазоном у меня не получилось. Во-первых, в этот раз они прицельно нанимали в AWS, а я на каждом собеседовании на вопросы общего характера отвечал, что хо...