1.0Kпросмотров
14 октября 2025 г.
statsScore: 1.1K
В прошлый четверг 9 октября мы послушали два доклада: 1️⃣ Сергей Карпухин рассказал про работу Parallel Scaling Law for Language Models, где обсуждалось улучшение качества за счёт паралеллизации обучения и инференса. 2️⃣ Нина Коновалова рассказала про работу VAR, а также следствие из нее SCALE-WISE VAR IS SECRETLY DISCRETE DIFFUSION, где объясняется, почему VAR можно рассматривать с точки зрения дискретной диффузии. 📁 Презентации
📹 Запись Спасибо всем, кто пришёл и будем вас ждать на следующей ридинг встрече!