П
Поступашки - Информатика
@postupashki_prog2.0K подп.
4.0Kпросмотров
9 октября 2025 г.
Score: 4.5K
Здравствуйте, товарищи😎😎😎 Сегодня поговорим о олимпиадах по анализу данных и покажем вам небольшой гайд по подготовке😎😎 Про олимпиады Олимпиады — отличный способ попробовать себя в настоящей аналитике, научиться работать с данными и строить гипотезы. Плюс это хороший старт для будущих поступлений в ВУЗ или для первых проектов в аналитике. Посмотрите на ту же олимпиаду DANO от Т-Банка, призер/побед этой олимпиады даёт БВИ/100 баллов по ЕГЭ в такие вузы как ВШЭ, ИТМО, УрФУ и Иннополис!!! Сегодня мы разберём олимпиаду DANO ⬇️ Как она проходит? Первый этап На решение заданий даётся 120 минут, начать можно в любое удобное время, пока задания доступны. Формат заданий — проверка базовых знаний математики и логики. Для выполнения заданий будет достаточно любого курса по статистике и теорверу Второй этап Доступ только у победителей и призёров первого этапа, которые являются школьниками или студентами СПО в сфере искусства. Этап проходит онлайн с прокторингом, на выполнение заданий — 210 минут. Здесь уже проверяются навыки работы с данными. Задачный тур финала Онлайн с прокторингом, 240 минут. Задания — творческие, со свободным ответом, проверяют глубокие знания и аналитические навыки. Вес тура — 0.5 в итоговом результате. Проектный тур финала Проходит очно в формате выездной школы под Москвой! Проживание и питание — за счёт организаторов, участники оплачивают только проезд. За неделю — предзащита и защита проектов, образовательная и развлекательная программа. Команды получают фидбэк от экспертов и могут доработать свои исследования. Какие технологии нужно изучить для олимпиады? 🐍 Очевидно, изучаем Python - для обработки данных, первичной визуализации, EDA, и следующие библиотеки: pandas — работа с табличными данными (чтение, фильтрация, группировка, агрегирование, очистка). Главный инструмент для подготовки данных. numpy — быстрые числовые вычисления, работа с массивами, векторные операции. Часто используется совместно с pandas. matplotlib — базовая визуализация: линии, столбцы, гистограммы, scatter-плоты. Основа для любых графиков. seaborn — продвинутая визуализация поверх matplotlib, удобные красивые графики для EDA: тепловые карты, парные графики, распределения. plotly — интерактивные графики, можно зумить, наводить курсор и делать дашборды. Полезно для презентации результатов. Jupyter Notebook — среда для написания и запуска Python-кода, удобна для EDA, позволяет объединять код, графики и текстовые заметки. scipy.stats — статистические функции: проверки гипотез, корреляции, распределения, t-тесты и прочее для анализа данных. И опциально: 💻 SQL (опционально, если данные из базы) 📊 Визуализация (Yandex Datalens, Superset, и др. ) - если нужно интерпретировать данные в удобном формате. Изучили, что дальше? Примеры берем с сайта олимпиады — DANO, либо заходим на Kaggle, ищем любой датасет и проводим eda. @postupashki_prog
4.0K
просмотров
2876
символов
Да
эмодзи
Нет
медиа

Другие посты @postupashki_prog

Все посты канала →
Здравствуйте, товарищи😎😎😎 Сегодня поговорим о олимпиадах — @postupashki_prog | PostSniper