381просмотров14.8%от подписчиков28 марта 2026 г.Score: 419Буржуйский сеошник Дэн Петрович реализовал с нуля на PyTorch представленный гуглоидами алгоритм сжатия для LLM TurboQuant и делится его полным кодом, включая ядро Triton.