D
Data Science Мастерская
@workshopdatasci_vanguard3.8K подп.
1.2Kпросмотров
30.5%от подписчиков
28 июня 2024 г.
📷 ФотоScore: 1.3K
Яндекс разработал и опубликовал библиотеку YaFSDP — собственное решение для ускорения обучения больших языковых моделей. При обучении LLM возникает проблема сложности вычислений и коммуникаций GPU в кластере. Большие расчёты должны синхронизироваться на разных видеокартах, а для этого сами устройства должны обмениваться информацией, чтобы не считать два раза одно и то же. Если GPU делают это неэффективно, то они теряют до 30% недоутилизированной мощности. Библиотека YaFSDP позволяет ускорить обучение больших языковых моделей до 25%. С её помощью можно тратить меньше времени на обучение и расходовать меньше ресурсов графических процессоров (GPU). Подробнее о том, как менялись подходы к оптимизации ресурсов можно прочитать в статье на «Хабре».
1.2K
просмотров
753
символов
Нет
эмодзи
Да
медиа

Другие посты @workshopdatasci_vanguard

Все посты канала →
Яндекс разработал и опубликовал библиотеку YaFSDP — собствен — @workshopdatasci_vanguard | PostSniper