D
Data Science News
@data_science_news441 подп.
1.6Kпросмотров
21 мая 2024 г.
questionScore: 1.8K
Harald Steck, математик из Netflix, опубликовал работу с говорящим названием Is Cosine-Similarity of Embeddings Really About Similarity? Автор задаётся вопросом почему косинус расстояние работает хуже в некоторых практических сценариях чем скалярное произведение для ненормированных векторов? Для ответа на этот вопрос в работе представлена линейная декомпозиция на синтетических данных, аналогично факторизации матриц в задачах рекомендаций. В выводах отмечено, что косинус расстояние сильно зависит от регуляризации. Сделано предположение, что векторное представление (эмбеддинги) для моделей глубокого обучения подвержены аналогичным проблемам. Harald Steck известен своей работой по линейному моделированию автокодировщика в задаче рекомендаций. Эта модель сделала своего рода революцию и открыло целое направление исследований и практических внедрений. Полный список работ Гарольда можно посмотреть здесь.
1.6K
просмотров
914
символов
Нет
эмодзи
Нет
медиа

Другие посты @data_science_news

Все посты канала →
Harald Steck, математик из Netflix, опубликовал работу с гов — @data_science_news | PostSniper