Х
Хроники ботки
@botka_chronics628 подп.
647просмотров
8 июля 2024 г.
Score: 712
Желание разложить что-угодно по группам на основе схожести - естественная черта человека, но задача кластеризации данных, почти всегда как плохое ТЗ для дизайнера - делай красиво, а не красиво не делай. Какой алгоритм кластеризации хороший, а какой плохой если сравнивать результат их работы не с чем? Джон Клейнберг из Корнеллского университета в 2002 году сформулировал три критерия хорошего алгоритма кластеризации: - Масштабная инвариантность. Если все расстояния между точками умножить на положительное число, это не должно менять результат работы хорошего алгоритма. - Насыщенность/разнообразие. Хороший алгоритм способен создать любую произвольную комбинацию разбиения входных данных. - Согласованность. Если уменьшаем внутрикластерные расстояния и/или увеличиваем межкластерные, алгоритм должен возвращать то же разбиение на кластеры.
647
просмотров
843
символов
Нет
эмодзи
Нет
медиа

Другие посты @botka_chronics

Все посты канала →
Желание разложить что-угодно по группам на основе схожести - — @botka_chronics | PostSniper