407просмотров
55.1%от подписчиков
26 марта 2026 г.
Score: 448
Google Research показали TurboQuant — и это способ экстремально ужимать векторы, KV-cache и индексы для векторного поиска. По сути кратко, это пайплайн квантования, помогающий реализовать длинный контекст, семантический поиск и инференс в целом сильно дешевле…