1.9Kпросмотров
18 января 2024 г.
Score: 2.0K
Вот что мне нравится в хороших работах по Super Resolution – они почти все являются форком. Один раз с шаблоном проекта ознакомился и вперёд. Таким образом достигается единообразие по отношению к обучению, добавлению архитектур, наборов данных, функций ошибок и т.д. Давно думал о том, что пора уже руками пощупать Super Resolution, а тут совпали необходимость и желание. Большое количество кода, связанного с преобразованием данных, уже написано. Подготовительный этап включает в себя лишь несколько простых шагов: скачать датасет, поправить пути и запустить парочку питоновских скриптов. Модели обучал на датасете DIV2K, уже в последний день объединил его с Flickr2K, что дало незначительный буст в метрике. Помимо VapSR, я экспериментировал с архитектурами SAFMN(Spatially-Adaptive Feature Modulation for Efficient Image Super-Resolution) и DLGSANet (Lightweight Dynamic Local and Global Self-Attention Networks for Image Super-Resolution). Финальное решение строилось на архитектуре DLGSANet и подборе оптимальных параметров у этой модели. На момент закрытия лидерборда я занимал 3 место. Во многих соревнованиях используется практика пересчета очков у решений участников. Набор данных делится на две части: public и private. В таблице отображаются очки за public часть, а затем посылки перетестируют на private, чтобы исключить возможность «подгонки» решения. Я уступал второму месту 68 баллов, но после пересчета результатов на приватной части, мое решение получило на 57 баллов больше, что позволило мне подняться на ступень выше. Я не хотел занимать 3 место и очень рад, что все сложилось таким образом. Да, конечно, хотелось завершить 2023 год победой, но и такой результат считаю неплохим.