Мой топ: как я подбираю визуализацию и библиотеку под неё 📊 Визуальный анализ — база любого проекта. Для частых задач я собрал свой набор графиков, где миксую matplotlib, seaborn и plotly. Сегодня расскажу, какую библиотеку и под какой сценарий беру. Гистограмма распределения с выделением мер центральной тенденции ↗️ Для визуализации распределения я обычно использую seaborn, так как kde-сглаживание и hue-группировка делаются в одну строку. Добавление линий среднего и медианы помогает понять, в ...
Analyst’s Notebook📖
Жизнь аналитика: карьера, образование, хард и софт скиллы etc Автор: @glebgavrin
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
11 из 11Что я смотрю на YouTube: подборка каналов для аналитика 📺 Сегодня воскресенье, поэтому решил не грузить вас объемными постами, а просто поделиться подборкой каналов про анализ данных и карьеру на 📺, которые я смотрю 📚 Фундамент и теория 📊StatQuest with Josh Starmer Короткие ролики, которые ставят всё на свои места. Идеально, когда нужно быстро понять конкретную тему по ML или статистике. 🔵🟤3Blue1Brown Лучший в своем жанре (короткие ролики с анимацией) канал. Тут можно найти плейлисты по мн...
Корреляция ≠ Причинность: как не обмануться цифрами 📈 Заголовки вроде «Красное вино продлевает жизнь» часто основаны лишь на корреляции, которую выдают за причину. Путаница между этими понятиями — частая ошибка в анализе и топовый вопрос на собеседованиях аналитиков и ds (по моим наблюдениям входит в топ-10 самых популярных 🔝) Суть проблемы 🚨 Высокая корреляция — это сигнал к размышлению, а не готовый вывод. За ней может стоять: 1. Скрытая переменная: жара → рост продаж мороженого и числа уто...
Путь в аналитику: два взгляда на инвестиции в себя 🐂 Когда люди хотят вкатиться в аналитику, перед ними вырисовывается дилемма: выбрать бесплатные источники (ютуб, stepik, открытые лекции) или готовые курсы, где всё разложено по полочкам — Python, SQL, статистика и иногда даже помощь в поиске первой работы. У каждого пути есть свои преимущества и подводные камни. Поэтому мы с Машей, автором канала RockAnalyst, решили подискутировать на эту тему. Я расскажу, как вошёл в аналитику без вложений, и...
Как я управляю временем на работе? ⏳ В первые месяцы работы, когда я еще был стажером, я часто разрывался в попытках успеть все и сразу. С опытом я выработал (и продолжаю дорабатывать) систему работы с задачами. Сейчас она экономит мое время и нервы, возможно и для вас будет полезна. Составление корзины 🛒 Раз в неделю на catch up с коллегой смотрим на список всех моих задач и обновляем статусы и приоритеты. Список является обычным письмом в почте с примерной структурой: 1. Модель X - до 30.01 с...
Идём учить A/B-тесты ⚡️ Недавно задумался о том, в каком разделе аналитики мне больше всего не хватает знаний, и осознал, что A/B тесты на 1 месте с отрывом. Я знаю теорию и даже решал какие-то задачи, но глобального понимания процесса не хватает. Хочется уверенно определять оптимальный метод для эксперимента, правильно интерпретировать результаты. Я решил, что так это оставлять нельзя и начал ресерч, с целью найти лучшие курсы по A/B и выбрать один из них для себя. ✍️В первую очередь я ориентир...
Разбор кейса: сырые данные, коммуникация и вайбкодинг — как я собрал дашборд 📈 Контекст Недавно наша команда получила доступ к общебанковской CRM. В ней хранятся данные по всем кампаниям продаж — настоящий кладезь информации. Как только коллеги из бизнес‑подразделения узнали об этом, они пришли к нам с запросом: «Сделайте дашборд по кампаниям другого департамента. Хотим понять, влияют ли их лиды на продажи нашего продукта». На всякий случай напишу: Лид (конкретно в моей сфере ) — это клиент, ко...
Парадокс Симпсона: ловушка, которую обязан знать каждый аналитик ⚡️ Представьте такую ситуацию: вы исследуете данные, в которых есть 2 группы объектов, в каждой из которых прослеживается одна и та же тенденция. Но когда вы объединяете данные, направление зависимости меняется на противоположное. Поначалу может показаться, что в данных ошибка, но на самом деле это один из известных статистических парадоксов — парадокс Симпсона. Парадокс становится возможен, когда каждый объект имеет какой-то сущес...
Самая скучная, но самая важная привычка в моей работе 🥱 Думаю, каждый из нас хоть раз ошибался и отправлял коллеге неверные данные. У меня это последний раз случилось на прошлой неделе, поэтому я решил составить себе чек-лист для проверки данных перед отправкой, чтобы в следующий раз не попасть впросак. Этим чек-листом поделюсь и с вами, уверен, многим будет полезно. Уникальность и дубли 🛍 Нет ли задвоений там, где их быть не должно (id клиента, номер транзакции и т.п.) В pandas это легко пров...
Мои первые ошибки в аналитике: разбор с последствиями 🫣 Когда я только пришел в аналитику, мои хард скиллы были не на очень высоком уровне, как и софт скиллы, которые я вообще недооценивал. Сегодня я расскажу 3 реальные истории из первых месяцев работы. Это чисто технические ошибки. А поведенческие ошибки разберет Кристина, автор канала risk & data talks Неправильно понял бизнес логику поля 🔍 В одной из первых задач я использовал витрину валютных операций с полем direction, которое принимает з...