868просмотров
74.8%от подписчиков
19 января 2026 г.
question📷 ФотоScore: 955
#дайджест_wbs: какие обновления в Data Science за время праздников запомнились больше всего? Ловите нашу подборку 👇 🌟 DeepSeek предложили новую вариацию трансформера
DeepSeek вводит manifold-constrained hyper-connections: в методе расширенные residual-пути проецируются на ограниченное пространство, что сохраняет идентичность сигнала и предотвращает взрыв градиентов, обеспечивая более стабильное и масштабируемое обучение моделей с десятками миллиардов параметров. 🌟 Tencent выпустила WeDLM-8B-Instruct
Это открытая LLM с диффузионным декодированием. Модель генерирует ответы параллельно, работает в 3–6 раз быстрее и на ряде бенчмарков превосходит другие 8B-модели, показывая потенциал нового подхода к ускорению языковых моделей. 🌟 Technology Innovation Institute выпустили компактную Falcon H1R 7B
Модель обучали с использованием cold-start supervised fine-tuning и RL с GRPO, что позволило быстро сформировать базовые reasoning-навыки и затем целенаправленно улучшить качество рассуждений без роста параметров, тем самым приблизив 7B-модель к уровню существенно более крупных LLM. 🌟 OpenAI запускает ChatGPT Health
Это раздел, который помогает готовиться к приему врача и разбираться с повседневными вопросами здоровья. Система не использует данные для обучения, разработана при участии более 260 врачей и проходит оценки по клиническим стандартам. Интересная фича — возможность загрузить все свои медицинских данных, от снимков и анализов до результатов тренировок с часов. Комментарии подготовили ML- и DS-специалисты Wildberries 💘 🌟 @wb_space