О
Опушка единорогов
@UnicornGlade306 подп.
387просмотров
9 марта 2026 г.
Score: 426
Сказал ему ускорить на Vulkan API: создай отдельный новый промпт и туда теперь записывай, напиши код который ускорит эти добавленные photoconsistency вычисления на Vulkan API - при этом если нет ни одного Vulkan устройства - вычисления на имеющейся CPU кодовой базе, но если они есть - то рендеринг карт глубины, рассчет SSD и остальное вплоть до получения photoconsistency map - должно делаться на видеокарте, изложи план по шагам, в т.ч. скажи как ты будешь убеждаться в корректности? на мой взгляд стоит сравнить все промежуточные результаты - сверить их и с эталоном CPU, они не обязаны совпадать но должны быть очень похожи, и финальная проверка - обработай датасет и я сравню результаты с результатами рендеров при рассчете на CPU Дальше мои промпты: хорошо, действуй по этому плану действуй дальше запусти nvidia-smi - ты видишь 4090? (пришлось выпустить ИЗ КЛЕТКИ, в sandbox видеокарта не доступна) а сейчас? действуй и не останавливайся либо пока ты не построишь датасет и рендеры на новой быстрой Vulkan-based реализации, либо если не встретишь какую-то проблему которая требует обсуждения 1 (предложила какой-то простой выбор) да действуй сделай то что будет достаточно быстрым но при этом не слишком много сложного кода сделай на GPU эффективную реализацию - например отправлять данные по PCI-E шине на CPU и обратно можно только когда грузятся исходные данные (например один раз на отправку геометрии, один раз картинка референсная, один раз на каждую соседнюю картинку, но потом когда эта соседняя картинка будет нужна для другой референсной картинки - она будет прогружаться заново) и когда считывается результат (результирующая получившаяся photoconsistency map, или у тебя и так уже это было так организовано? действуй на датасете сколько времени занимает вся обработка, сколько от нее времени занимает preprocess, сколько из нее времени занимает самый медленный кернел? и что он делает опиши запусти целиком датасет отрендери результаты, какой глобальный путь к папке с рендерами? а путь к папке с рендерами полученными ранее на CPU? я хочу проверить что все корректно, и какая разница в скорости в сумме от полного CPU до ускоренного на Vulkan? а какая разница в скорости photoconsistency рассчета который добавлен в новом алгоритме? и сколько времени занимает традиционный старый код mvs-texturing? и какой кернел занимает больше всего времени? и сколько конкретно? да, выясни, чтобы была разбивка сколько времени уходит на трансфер данных, сколько процентов на каждый кернел, может быть лучше использовать для этого профилировщик для Vulkan API да, действуй (оказалось что она все еще часто грузила результаты из видеопамяти и хотя раньше она об этом была в курсе - четко это поняла после профилирования, КАК ЧЕЛОВЕЧНО 😭) отрендери результаты x10.3 ускорение получено 😎 ух, уработался 😂 Итак, делаем выводы: действуй и да - лучшие промпты для x10 ускорения кода 🕺
387
просмотров
2894
символов
Да
эмодзи
Нет
медиа

Другие посты @UnicornGlade

Все посты канала →
Сказал ему ускорить на Vulkan API: создай отдельный новый пр — @UnicornGlade | PostSniper