3.6Kпросмотров
21 мая 2024 г.
Score: 3.9K
Здравствуйте, дорогие подписчики! Уже в это воскресенье (26 мая) мы организуем секцию OptimalDL на DataFest2024. Секция будет в онлайне, чтобы можно было поприсутствовать на докладах где бы вы не находились! На секции планируются следующие доклады: Докладчик: Дмитрий Раков
Описание
Расскажет о своем опыте ускорения нейронной сети SegFormer для задачи сегментации в ЖД домене. Докладчик разработал собственный фреймворк для data aware прунинга данной архитектуры, и смог получить ускорение в 1,5 раза при незначительной потере точности. Докладчик: Дмитрий Иванов
Описание
Сделает обзор области оптимизации нейронных сетей, а именно методов прунинга и квантования. Доклад охватывает направления исследований от Lottery ticket hypothesis до 4ех битного квантования LLM. Докладчик: Алексей Гончаров
Описание
Поделится опытом оптимизации расходов на инференс LLM с применением квантования, дообучения моделей, LoRA адаптеров и низкоуровневых фреймворков инференса. Докладчик: Григорий Алексеев
Описание
Расскажет об опыте написания собственного CUDA-kernel-а для оптимизации Flash Attention Докладчик: Андрей Щербин
Описание
Поведает о том, как мы принимали участие в конкурсе LPCV2023 и получили самое точное среди быстрых решений