89просмотров
7.9%от подписчиков
26 марта 2026 г.
📷 ФотоScore: 98
Google спасёт нас от дефицита ОЗУ: выпустили алгоритм сжатия TurboQuant для LLM 📱 Алгоритм сжимает KV-кэш — ту самую память нейросети, которая позволяет помнить каждый предыдущий токен во время генерации ответа. Результаты впечатляют: 🔜 Требования к памяти снижаются в 6 раз.
🔜 Скорость работы увеличивается до 8 раз.
🔜 При этом без потери точности. Инвесторы новость оценили и побежали сливать акции производителей памяти — Micron, SK Hynix и другие упали в цене 📉 🤖 Ботоферма в деле!