A
Analyst’s Notebook📖
@analysts_notebook267 подп.
414просмотров
6 февраля 2026 г.
📷 ФотоScore: 455
Корреляция ≠ Причинность: как не обмануться цифрами 📈 Заголовки вроде «Красное вино продлевает жизнь» часто основаны лишь на корреляции, которую выдают за причину. Путаница между этими понятиями — частая ошибка в анализе и топовый вопрос на собеседованиях аналитиков и ds (по моим наблюдениям входит в топ-10 самых популярных 🔝) Суть проблемы 🚨 Высокая корреляция — это сигнал к размышлению, а не готовый вывод. За ней может стоять: 1. Скрытая переменная: жара → рост продаж мороженого и числа утоплений. В таком случае корреляция между продажами мороженого и количеством утоплений будет высокой, но первое явно не является причиной второго. 2. Обратная причинность: не прием таблеток → смерть, а болезнь → приём таблеток + смерть. 3. Случайное совпадение: если перебрать тысячи наборов данных, найдутся идеальные тренды, как акции Barclays и число экологов в штате Нью-Джерси (на картинке). Множество подобных примеров собрано на этом сайте. 4. Истинная причинно-следственная связь: как раз то, что нужно уметь распознавать аналитикам. ❗️Таким образом, из причинно-следственной связи следует корреляция, а вот обратное верно далеко не всегда. Как искать причинность? Практические методы 👍 1. Золотой стандарт: A/B-тесты 🆎 Рандомизация на тестовую и контрольную группы позволяет изолировать эффект. Статистическая проверка результатов часто основана на линейной регрессии, что тесно связывает эксперимент с базовой аналитикой. 2. Если эксперимент невозможен (работа с историческими, рыночными данными), применяют: - Проверку временного порядка: Причина всегда предшествует следствию. Если это правило не выполняется – можно не продолжать анализ. - Контроль смешивающих факторов: Внеся в модель (например, через регрессию) возможные скрытые переменные (например, социальный статус), можно увидеть, исчезнет ли исходная связь. - Поиск инструментальных переменных и другие квазиэкспериментальные методы для приближения к чистоте эксперимента. Если интересно узнать больше про эконометрические способы детекции эффектов воздействия, ставьте 🐳 Еще могу порекомендовать данный канал, он специализируется на этом. Корреляция — начало расследования, а не его итог. Чтобы говорить о причине, нужны доказательства, которые можно получить с помощью экспериментов 🔬 А встречали ли вы в своих проектах / задачах кейсы с высокой корреляцией, за которой не стояла причинно-следственная связь? Пишите в комментариях! 💬 Ставьте 🔥 если было полезно ❤️ если интересны разборы популярных вопросов с собеседований 🤩 если хотите увидеть посты про корреляционный и каузальный анализ #аналитические_методы #статистика #собеседования
414
просмотров
2628
символов
Да
эмодзи
Да
медиа

Другие посты @analysts_notebook

Все посты канала →
Корреляция ≠ Причинность: как не обмануться цифрами 📈 Загол — @analysts_notebook | PostSniper