8.0Kпросмотров
13.0%от подписчиков
17 марта 2026 г.
🎬 ВидеоScore: 8.8K
🚀 Себастьян Рашка собрал в одном месте галерею архитектур современных языковых моделей. Внутри - 40+ моделей (2024–2026):
от DeepSeek и Qwen до Nemotron и Grok. Для каждой модели есть: • наглядная схема архитектуры
• размер и число параметров
• тип декодера
• ссылки на технические отчёты и конфиги
• иногда даже реализации По сути это единая карта современных LLM, где можно быстро посмотреть, как устроены разные модели и как эволюционируют архитектуры. https://sebastianraschka.com/llm-architecture-gallery/ 🐍 Python полезные ресурсы 🚀Max @pythonl