488просмотров
66.2%от подписчиков
4 февраля 2026 г.
📷 ФотоScore: 537
Разбираем меры центральной тенденции📊
(Помним, что статистика - это просто, поэтому не углубляемся😁) Все мы слышали этот ироничный пример: «средняя температура по больнице 36,6 - все пациенты здоровы!»
Его придумали именно для того, чтобы показать абсурдность слепого доверия к среднему значению. Но почему это так важно для нас?
Начнем с определения. Мера центральной тенденции (мера центра, центральной позиции; measure of central tendency) — это обобщающая мера, которая пытается описать весь набор данных одним значением, представляющим середину или центр его распределения. Три главных героя: среднее, медиана и мода. Представьте, что вы анализируете время, которое коллеги тратят на чашку кофе. Данные: 5, 5, 6, 7, 52 минуты (один коллега застрял в интересном разговоре). 1️⃣ Среднее арифметическое (Mean): складываем всё и делим на количество: (5+5+6+7+52) / 5 = 15 минут
Вывод по среднему: «В среднем, мы пьем кофе 15 минут». Это неправда для 4 из 5 человек. Виноват выброс (outlier) - тот самый разговорчивый коллега. Среднее чувствительно к крайним значениям! 2️⃣ Медиана (Median): значение, которое стоит ровно посередине упорядоченного ряда.
Ряд: 5, 5, 6, 7, 52. Медиана - 6 минут.
Вывод по медиане: «Половина сотрудников тратит на кофе ≤ 6 минут, а половина — ≥ 6 минут». Это более честно описывает ситуацию. Медиана боится выбросов гораздо меньше. 3️⃣ Мода (Mode): самое часто встречающееся значение. В нашем ряду это 5 минут. Вывод по моде: «Чаще всего сотрудники тратят на кофе 5 минут». Полезно для понимания самого распространенного сценария.
Еще преимущество моды заключается в том, что ее можно найти как для числовых, так и для категориальных (нечисловых) данных. Есть ещё один случай, когда мы обычно предпочитаем медиану среднему значению (или моде) - это когда наши данные имеют асимметричное распределение. (Фото, по краям) А вот если мы рассмотрим нормальное распределение (то самое - Гаусса-Лапласа, поскольку это наиболее часто встречаемое распределение в статистике), то увидим, что когда данные «идеально» нормальны, среднее значение, медиана и мода совпадают. (Фото, по центру) Так что и когда использовать? 🤔 Это вопрос сложный, потому что есть десятки распределений, нюансов и прочих страшилок, но если кратко и базово: Задайте два вопроса! 1. Как выглядят данные?
Постройте гистограмму или «ящик с усами» (box plot). Если видите выбросы или распределение «скошено», то ваш выбор медиана. 2. Что я хочу узнать?
Какой результат самый частый? → мода
Какое типичное значение для «среднего» пациента в реальных условиях? → медиана
Какое общее суммарное воздействие? (например, общее снижение уровня гемоглобина) и данные симметричны → среднее НО главное помните, если вы видите, как кто-то считает зарплату, используя среднее и улыбается, то вы тот, кто ест капусту😁 А если вы хотите посмотреть наглядный пример с медицинскими зарплатами, то для вас есть вот эти два интереснейших поста! https://ordinatura.org/rich-doctors#rec621888180 https://rpubs.com/Ebm_base/1293328 Ссылки: ЖКвТГ | ЖКвВК | EBMbase | YouTube