105просмотров
3.6%от подписчиков
26 марта 2026 г.
📷 ФотоScore: 116
🌟 Релиз LongCat-Next Модель объединяет текст, изображения и аудио в одну систему и работает по тому же принципу next-token prediction, но уже не только для текста. Что внутри:
• 68.5B параметров (3B активных, MoE) • единая модель для “видит - рисует - говорит” dNaViT 0 визуальный трансформер, который кодирует изображения в дискретные токены → работает с любым разрешением → совмещает генерацию и понимание (раньше это был компромисс) Paper: https://github.com/meituan-longcat/LongCat-Next/blob/main/tech_report.pdf GitHub: https://github.com/meituan-longcat/LongCat-Next HuggingFace: https://huggingface.co/meituan-longcat/LongCat-Next Demo: https://longcat.chat/longcat-next Blog: https://longcat.chat/longcat-next/intro