1.6Kпросмотров
7.0%от подписчиков
27 марта 2026 г.
📷 ФотоScore: 1.8K
Google сдувает ИИ-пузырь и спасёт нас от дефицита ОЗУ Google выкатили новый алгоритм сжатия для LLM-моделей «TurboQuant». Он экстремально сжимает KV-кэш — ту самую память, которая помогает нейронке удерживать контекст диалога. Цифры реально впечатляют: Аппетит ИИ к оперативе падает в 6 раз, а скорость генерации ответов улетает в космос аж в 8 раз, причем вообще без потери качества. Финансовый сектор моментально словил паничку. Уолл-стрит решили, что миру больше не нужны гигантские объемы железа, и побежали сливать в стакан акции главных производителей памяти — Micron и SK Hynix. Прикол в том, что инвесторы не выкупили матчасть. Вся эта магия сжатия работает исключительно для инференса (когда готовая модель просто генерит текст). А вот чтобы натренировать свежую нейронку с нуля, компаниям по-прежнему будут нужны терабайты оперативы и целые стадионы серверов Technogram Inside