1.6Kпросмотров
9 декабря 2025 г.
📷 ФотоScore: 1.8K
Пояснения к скриншоту. 1) Голубые круги справа - это entity обогащенные из Knowledge Graph Google. Там где нет синих кругов - это сущности добытые из статей из ТОПа. 2) Similarity - косинусная близость сущности к вектору кластера запросов
3) Mentions - количество упоминаний сущностей в статьях из ТОПа
4) У себя в докладе Олег судя по цифрам юзал эмбеддинги от openAI (но это не точно) поэтому у него значения косинусной близости ближе друг к другу. Я же юзал свои любимую базу от Яндекса и там всегда разброс идет больше. Само собой есть шероховатости, но для первой итерации вполне себе интересный результат получается. Мне интересно другое смотрите Гарвард (ORGANIZATION) и Гарварде (LOCATION) - это косяк при обработке русского языка или он реально так думает? По идее я учусь (где?) в Гарварде действительно можно воспринимать как локейшн