Мы нанимаем! В московском футбольном клубе открылась вакансия BI-аналитика. Основная задача на этой должности — построение дашбордов в DataLens для спортивной и бизнес-частей клуба. Но т.к. команда у нас пока небольшая, то будут задачи и из смежных направлений data science: проведение EDA (разведочный анализ данных), работы с данными (их валидация и создание датасетов), исследовательские задачи с целью улучшения аналитики внутри клуба. Любить и разбираться в футболе (и в спорте в целом) необязат...
Цифры в спорте
Канал о статистике и анализе данных в спорте По всем вопросам, пожеланиям, предложениям и недовольствам - сюда: @brains14482
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
18 из 18Мы нанимаем! В московском футбольном клубе открылась вакансия дата-инженера. Мы ищем Дата-инженера, основная и первоочередная задача которого — спроектировать и реализовать централизованный Data Warehouse (DWH) для нашей аналитической платформы. DE возьмёт на себя интеграцию существующих источников данных (API и парсинг), настройку процессов обновления и оркестрации данных, логирование и проверку качества, а также разработку оптимальной схемы БД для аналитики и сервисов клуба. Формат работы: уда...
Уже по традиции в конце года Jan Van Haaren выкладывает Soccer Analytics 2025 Review - сборник различных материалов по аналитике данных в футболе за прошедший год. Структура сборника не претерпела никаких изменений, он включает в себя: • Научные статьи • Блог посты • Заметки • Подкасты • Вебинары • Список эвентов, прошедших в этом году • Репозитории с кодом Сборник отличный, но который год есть вопросы к части с кодом. Она выглядит как Песня года в 90-ых: из года в год там даются ссылки на одни ...
2.42 — 2.31 1.66 — 3.69 1.94 — 3.45 2.41 — 2.49 2.63 — 1.94 2.06 — 2.73 2.56 — 2.23 2.02 — 1.78 Что это за цифры? Это итоговый xG одного матча из 8 разных источников: провайдеров данных и крупных сайтов. Выбирайте любой подходящий вам вариант — от уверенной победы первой команды до доминирования второй. Разброс xG хозяев единица, гостей почти 2 мяча. Модели по-разному оценивают один и тот же удар (одна в 0.19 xG, другая в 0.5), и в целом, что они считают за удар (две модели, которые дали гостям ...
Дополнительная интрига для просмотра матча Вулвз - Бёрнли. Если гости сегодня выиграют, то новички этого сезона АПЛ наберут 38 очков за 9 туров, что будет лучшим результатом за последние 20 лет. Резкий разворот относительно двух последних сезонах, после которых многие принялись называть АПЛ закрытой лигой, в которую 3 команды получают wild-card на один сезон. Пока рекорд 37 очков, которые новички набирали дважды: в сезоне 08/09 (в основном стараниями Халла, который набрал 20) и в 17/18 (Ньюкасл,...
Дополнительная интрига для просмотра матча Вулвз - Бёрнли. Если гости сегодня выиграют, то новички этого сезона АПЛ наберут 38 очков за 9 туров, что будет лучшим результатом за последние 20 лет. Резкий разворот относительно двух последних сезонах, после которых…
@numbers_in_sport
Opta заявила Sports reference о нарушении использовании их данных на FBref.com и потребовала их удалить. Sports reference требование выполнил. В миг FBref потерял всю продвинутую статистику. Морали и рассуждений о важности и нужности открытых данных, о том, что некоторые модели и идеи двигаются именно сообществом, а не клубными ds и аналитиками, не будет, просто грустно. FBref был хорошим и удобным инструментом быстро посмотреть и проанализировать данные. Теперь мы потеряем не только много класс...
В свете игры Астон Виллы в этом сезоне пошли разговоры о том, что Эмери "взломал" код xG и модели в отношении АВ не работают. 1) Лидеры почти всегда обгоняют xP. В чемпионатах на 20 команд за 10 лет чемпионы в среднем обгоняют xP на 11 очков, серебряные призёры на 8. Аутсайдеры, наоброт, обычно очков недобирают. Причины, скорее всего, две: удача и несовершенство модели. Под несовершенством подразумеваю, что она гораздо лучше предсказывает середину выборки (5-15 места), чем концы. Это обычная сит...
В блоге отдела аналитики Пармы (очень советую почитать, но он на Notion), одной из немногих площадок, где люди из клуба делятся с сообществом своими знаниями и наработками, вышла статья про сопоставление имён игроков в разных источниках данных. Проблема важная, потому что мы бы хотели аккумулировать в единый PLAYER_ID все данные об игроке из всех доступных нам источников, но этому активно мешает тот факт, что логика нейминга у каждого источника своя. И если с Олегом Ивановым, скорее всего, пробл...