D
Data Science Private Sharing
@ds_private_sharing2.0K подп.
3.7Kпросмотров
29 сентября 2025 г.
📷 ФотоScore: 4.1K
Крупное обновление в курсе Разработка LLM с нуля. Добавил в курс разработку пяти новых моделей: - GPT-2 - Llama - Mistral - Mixtral - Gemma В процессе их разработки мы изучим новые архитектурные фишки: - Pre-norm, RMSNorm - новые способы нормализации - GELU, SiLU, SwiGLU, GeGLU - новые функции активации - KV-cache, SWA - механизмы, позволяющие оптимизировать инференс - RoPE - новый способ кодирования позиционных эмбедингов - GQA, MQA - новые экономичные механизмы внимания - MoE - новая экономичная архитектура для FNN По такому событию, следующие две недели по промокоду ALL предоставляется скидка 10%
3.7K
просмотров
609
символов
Нет
эмодзи
Да
медиа

Другие посты @ds_private_sharing

Все посты канала →
Крупное обновление в курсе Разработка LLM с нуля. Добавил в — @ds_private_sharing | PostSniper