115просмотров
20.4%от подписчиков
19 марта 2026 г.
Score: 127
👋 прочитал от Игоря Котенкова лонгрид про домашку от антропик Anthropic's Original Performance Take-Home читал в 3 захода. очень интересно, но мои джипитишные мозги уже тяжеловато заставить шестеренкам крутить 😎 вот сам лонгрид в целом вся задачка, это показательный кейс про то, как вообще рождается перформанс. вот в этом посте я разбрал лекци от яндекса, где тоже рассказывали про насущную проблему memory/compute bound вычисленй в обучени LLM. в целом лонгрд имеет отличную структуру повествования. сначала у тебя есть наивная реализация. потом ты понимаешь:
• можно векторно обрабатывать сразу пачку объектов
• не надо бессмысленно гонять одни и те же данные между DRAM и scratchpad
• мало просто ускорить математику — нужно еще плотно упаковать инструкции, чтобы больше утилизировать доступных мощностей ну и наверное для меня самая полезная мысль, как для инженера: ботлнек почти никогда не живет только в алгоритме. важно думать о том, как именно двигаются данные и как железо переваривает нструкции. в общем, кайфовый материал 😎