4.0Kпросмотров
9 октября 2025 г.
Score: 4.5K
Здравствуйте, товарищи😎😎😎
Сегодня поговорим о олимпиадах по анализу данных и покажем вам небольшой гайд по подготовке😎😎 Про олимпиады
Олимпиады — отличный способ попробовать себя в настоящей аналитике, научиться работать с данными и строить гипотезы. Плюс это хороший старт для будущих поступлений в ВУЗ или для первых проектов в аналитике. Посмотрите на ту же олимпиаду DANO от Т-Банка, призер/побед этой олимпиады даёт БВИ/100 баллов по ЕГЭ в такие вузы как ВШЭ, ИТМО, УрФУ и Иннополис!!! Сегодня мы разберём олимпиаду DANO ⬇️ Как она проходит? Первый этап
На решение заданий даётся 120 минут, начать можно в любое удобное время, пока задания доступны.
Формат заданий — проверка базовых знаний математики и логики. Для выполнения заданий будет достаточно любого курса по статистике и теорверу Второй этап
Доступ только у победителей и призёров первого этапа, которые являются школьниками или студентами СПО в сфере искусства.
Этап проходит онлайн с прокторингом, на выполнение заданий — 210 минут.
Здесь уже проверяются навыки работы с данными. Задачный тур финала
Онлайн с прокторингом, 240 минут.
Задания — творческие, со свободным ответом, проверяют глубокие знания и аналитические навыки.
Вес тура — 0.5 в итоговом результате. Проектный тур финала
Проходит очно в формате выездной школы под Москвой!
Проживание и питание — за счёт организаторов, участники оплачивают только проезд.
За неделю — предзащита и защита проектов, образовательная и развлекательная программа.
Команды получают фидбэк от экспертов и могут доработать свои исследования. Какие технологии нужно изучить для олимпиады?
🐍 Очевидно, изучаем Python - для обработки данных, первичной визуализации, EDA, и следующие библиотеки:
pandas — работа с табличными данными (чтение, фильтрация, группировка, агрегирование, очистка). Главный инструмент для подготовки данных.
numpy — быстрые числовые вычисления, работа с массивами, векторные операции. Часто используется совместно с pandas.
matplotlib — базовая визуализация: линии, столбцы, гистограммы, scatter-плоты. Основа для любых графиков.
seaborn — продвинутая визуализация поверх matplotlib, удобные красивые графики для EDA: тепловые карты, парные графики, распределения.
plotly — интерактивные графики, можно зумить, наводить курсор и делать дашборды. Полезно для презентации результатов.
Jupyter Notebook — среда для написания и запуска Python-кода, удобна для EDA, позволяет объединять код, графики и текстовые заметки.
scipy.stats — статистические функции: проверки гипотез, корреляции, распределения, t-тесты и прочее для анализа данных. И опциально: 💻 SQL (опционально, если данные из базы)
📊 Визуализация (Yandex Datalens, Superset, и др. ) - если нужно интерпретировать данные в удобном формате. Изучили, что дальше?
Примеры берем с сайта олимпиады — DANO, либо заходим на Kaggle, ищем любой датасет и проводим eda. @postupashki_prog