10.3Kпросмотров
10 октября 2025 г.
Score: 11.3K
Красивые детальные статьи Выходные это отличное время, чтобы потратить пару часов на то, чтобы прочитать какую-нибудь очень детальную статью и подробно в чем-то разобраться. По этому поводу хочу поделиться несколькими качественными длинными постами. 1. https://www.aleksagordic.com/blog/matmul — очень подробно про перемножение матриц на GPU. Что-то в стиле "What Every Programmer Should Know About Memory", только про GPU. У него в блоге еще есть про внутренности vLLM и всякие другие штуки. 2. https://thinkingmachines.ai/blog/lora/. Thinking machines начали публиковать довольно интересные блоги. У них там еще есть про Modular Manifolds, но на мой вкус слишком много математики. 3. https://pair.withgoogle.com/explorables/grokking/ прикольные визуализации про эффект grokking-а. В какой-то момент мне настолько понравилась статья, что я сделал задачу в контесте по ее мотивам. 4. https://transformer-circuits.pub/2025/attribution-graphs/methods.html У Anthropic есть много красивых статей про внутренности LLM. 5. https://bminaiev.github.io/simulated-annealing Когда-то у меня хватало свободного времени, чтобы писать длинные посты. Я скинул chatgpt список выше и попросил найти что-то похожее. Можете поверить наслово, он сгенерировал хороший ответ, но почему-то кнопка "поделиться ответом" не работает. Поэтому вместо этого вот вам еще один пост из хорошего блога — https://lilianweng.github.io/posts/2023-01-27-the-transformer-family-v2/ Накидайте в комментариях каких-нибудь еще красивых подробных статей на любые темы!