Ц
Цифры в спорте
@numbers_in_sport620 подп.
895просмотров
20 октября 2025 г.
statsScore: 985
2.42 — 2.31 1.66 — 3.69 1.94 — 3.45 2.41 — 2.49 2.63 — 1.94 2.06 — 2.73 2.56 — 2.23 2.02 — 1.78 Что это за цифры? Это итоговый xG одного матча из 8 разных источников: провайдеров данных и крупных сайтов. Выбирайте любой подходящий вам вариант — от уверенной победы первой команды до доминирования второй. Разброс xG хозяев единица, гостей почти 2 мяча. Модели по-разному оценивают один и тот же удар (одна в 0.19 xG, другая в 0.5), и в целом, что они считают за удар (две модели, которые дали гостям 3.5+ xG засчитали им один удар на 0.8 xG, которые остальные модели за удар не посчитали). Работая с xG было бы неплохо понимать байесы и ограничения. Это в принципе неплохая практика, понимать что и как ты используешь, особенно когда разные модели дают такой разброс результатов. Для таких целей обычно используют бенчмарки. Суть их в том, что ты прогоняешь свою модель на подготовленных заданиях, получаешь результат и можешь сравнить его с результатом других моделей на том же наборе данных. Но классический бенчмарк из ML для этого случая не подойдёт из-за того, что разные провайдеры считают за удар, а что нет. Т.е. для каждой игры у разных поставщиков может быть разное количество и список ударов по воротам, отсюда и разница в xG. Поэтому тут бенчмарк может быть просто списком игр, по которым провайдер должен прислать организатору бенча результат своей модели. Задача организатора была бы в том, чтобы свести все результаты в единую таблицу. В идеале было бы в эту таблицу добавить подробное описание признаков ударов, чтобы каждому не приходилось собирать их вручную для оценки различий в работе моделей. Такой бенчмарк мог бы помочь использовать xG-модели более осознанно. Но нужно ответить на вопрос «Зачем это поставщикам данных». Без него эта идея (как любая другая, связанная с закрытыми источниками) обречена так и остаться не более, чем постом в тг. @numbers_in_sport
895
просмотров
1889
символов
Нет
эмодзи
Нет
медиа

Другие посты @numbers_in_sport

Все посты канала →
2.42 — 2.31 1.66 — 3.69 1.94 — 3.45 2.41 — 2.49 2.63 — 1.94 — @numbers_in_sport | PostSniper