990просмотров
51.5%от подписчиков
31 января 2026 г.
📷 ФотоScore: 1.1K
Тут попалась мне на глаза картинка, которую ожидаемо распылили на атомы в контексте датавиз-манипуляций. И да, если смотреть формально — манипуляция на манипуляции. График не от нуля. Две разные шкалы. Обе логарифмические. При этом шаги внутри этих логарифмических шкал разные, но визуально они аккуратно нормированы друг к другу. Порядок нейросеток странный. В общем, полный набор того, за что обычно хватаются, когда хотят сказать «фу, опять все наврали». Но каждый раз, когда я вижу такое, мне становится интереснее не что тут неправильно, а что вообще хотели сказать авторы. И откуда этот график взялся. В каком он контексте. Это отчёт? Презентация? Маркетинговый материал? Слайд внутри большого дока? Какие графики были до него и после? Почему один столбец выделен цветом? Почему именно эти бенчмарки? Потому что сама по себе картинка сделана слишком аккуратно, чтобы списывать всё на «безграмотного дизайнера». Это работа Anthropic, и очевидно, что там не последние люди в профессии сидят. Значит, решения принимались осознанно. Например, построение не от нуля. Формально — да, «ошибка». А по факту — абсолютно нормальная практика для бенчмарков в ИИ. Потому что в этой области десятые доли процента — это не шум. Это годы исследований, сотни инженеров и тонны вычислений. Разница между 99,9% и 99,8% — это не косметика, это (перекладывая скажем на беспилотные тачки) буквально «в какой-то момент ты впилишься в дерево». Пример грубый, но интуитивно понятный: в беспилотниках, медицине, ИИ — вот эти доли процента решают всё. Поэтому фокус на малых различиях — логичен. Они и есть предмет разговора. Второй, гораздо более интересный вопрос — зачем здесь две шкалы. Вот тут реально хочется подумать, а не открывать сразу чеклист «как правильно строить графики». Возможно, авторам было важно не показать абсолютные значения, а визуально сблизить два разных бенчмарка, чтобы человек глазами понял: вот здесь лидерство, вот здесь отрыв, вот здесь плотная конкуренция. Цифры как таковые — вторичны. Важна разница. Полпроцента. Десятая. Намёк на тренд. И тут без контекста мы, честно, гадаем. Потому что чтобы это оценить корректно, надо быть ещё и специалистом по самим этим бенчмаркам. Понимать, как они считаются, что в них считается успехом, и почему именно эти значения вообще имеют вес. И вот к чему я всё это. Мне не хочется сразу прыгать на график с криком «ужас, манипуляция, всё плохо». Формально — да, к чему придраться есть. Но это примерно как вопрос: «можно ли использовать три шрифта на одной странице?» Ответ всегда один и тот же — зависит от задачи. И от мастерства исполнителя. При этом, если уж совсем честно, самая корректная дата-визуализация — это Excel-таблица. Строки, столбцы, цифры. Всё. Ковыряйся сколько хочешь. Всё остальное — это всегда интерпретация. Вопрос не в том, есть ли манипуляция. Она есть всегда. Вопрос — зачем и насколько она соответствует задаче. Короче, я бы не спешил вешать ярлык «плохой график». Скорее это хороший повод задать более интересный вопрос: а мы вообще понимаем, что именно нам здесь хотели показать? UPD говорят, график оказался просто чьим-то стебом на тему :)