346просмотров
3.8%от подписчиков
28 марта 2026 г.
📷 ФотоScore: 381
⚡️Google представили TurboQuant — алгоритм для сжатия LLM, который меняет правила игры. Он резко снижает нагрузку на ОЗУ при работе с длинным контекстом, не жертвуя качеством генерации. Результат: в 6 раз меньше памяти и до 8 раз выше скорость. Рынок отреагировал мгновенно — акции производителей памяти начали падать. Discovery: IT, технологии, бизнес Наука и Бизнес