200просмотров
10 февраля 2026 г.
Score: 220
Привет, сделал декомпозицию задач про ускорение свёрточных операций — сердце современных CNN: • https://gitverse.ru/kolkir/adept/tasktracker/TSKDPT3-90 • https://gitverse.ru/kolkir/adept/tasktracker/TSKDPT3-79 Есть три основных задачи: 🔥 Быстрые свёртки для инференса (CPU/GPU) Цель: Максимально ускорить вывод моделей за счёт оптимизированных алгоритмов свёрток. Что делать: Исследовать подходы (включая Winograd и альтернативы) Учесть ограничения: поддержка batch, channels, padding Реализовать ядра: • CPU — через SIMD-библиотеку Highway • GPU — через compute-шейдеры Vulkan Сравнить результат с текущим im2col 💡 Идеально, если хочешь разобраться в алгоритмах свёрток и хочешь «выжать» максимум из железа. ⚙️ Умная диспетчеризация режимов Цель: Автоматически выбирать алгоритм в зависимости от сценария. Логика: Инференс: быстрые свёртки для ядер 3×3–7×7 → иначе im2col Тренировка: всегда im2col (работа с большими матрицами) 🎥 Как устроена наша диспетчеризация 🚀 Implicit GEMM для тренировки Цель: Ускорить обучение за счёт сокращения аллокаций памяти. Почему это круто: Минимум промежуточных буферов Эффективный тайлинг — строим только нужный фрагмент матрицы свёртки «на лету» Лучшее распараллеливание → выше производительность на тренировке Этапы: дизайн → реализация (CPU/GPU) → бенчмарки против im2col → замена при профите. 👉 Готов браться? Читай правила участия, пиши— обсудим детали и подберём задачу под твои скиллы! #opensource #machinelearning #optimization #vulkan #simd #cpp
200
просмотров
1499
символов
Да
эмодзи
Нет
медиа

Другие посты @adept_platform

Все посты канала →
Привет, сделал декомпозицию задач про ускорение свёрточных о — @adept_platform | PostSniper