R
RADAR
@radarresearch2.0K подп.
433просмотров
22.0%от подписчиков
24 марта 2026 г.
📷 ФотоScore: 476
Кластерный анализ и сегментация При работе с кластерным анализом аналитику нужно держать в голове огромное множество параметров. На одних и тех же исходных данных можно построить бесконечное количество решений! Решения будут различаться в зависимости от: — Переменных, включенных в анализ (строить кластеры на всех переменных, или только на некоторых? на факторах или на исходных?) — Способа их перекодировки / стандартизации (на исходных, на дихотомических (TOP-1 или TOP-2?), или на стандартизованных?) — Выбора метода кластерного анализа (например, дальнего соседа или K-means?) — Выбора метрики пространства (например, расстояние Евклида, или косинус?) — Выбора количества кластеров (сколько взять: 5, 7, 10?) — Критерия устойчивости — Критерия интерпретируемости В карточках – общая схема работы кластерного анализа и пример дендрограммы (схемы последовательного объединения кластеров), которую дают прекрасные иерархические методы Сегодня в 19:00 на лекции в Школе Анализа Данных разбираемся с кластерным анализом. Поговорим о переменных, которые задаём на вход. Обсудим, какую форму кластеров дают разные методы. Какие подводные камни таит K-means? Какие бывают расстояния и на каких переменных какие лучше использовать? Как определить оптимальное количество кластеров? И, главное, как всё это интерпретировать! Записаться в ШАД: только открытые лекции | + практика | + разборы ДЗ #radar_school #data_analysis_school #SDA #lectures #course #data_analysis #mark_shaphir #segmentation #cluster
433
просмотров
1508
символов
Нет
эмодзи
Да
медиа

Другие посты @radarresearch

Все посты канала →