Обучить "тяжёлую" модель на плохой разметке Известен способ, — @everydaycv

1.6Kпросмотров

24 сентября 2023 г.

📷 ФотоScore: 1.8K

Обучить "тяжёлую" модель на плохой разметке Известен способ, когда маленькую модель обучают на "знаниях" большой модели - дистилляция. Но можно попробовать и в обратную сторону. Многие вещи становятся более понятны на примерах, поэтому вернёмся к задаче детектирования рук. Казалось бы, а что тут сложного ? Взяли данные, закинули в разметку, написали ТЗ, люди разметили, результат провалидировали, модельку обучили и выкатили в прод. Да, идея замечательная, но есть одно но - не совсем понятно, как это размечать, сколько данных нужно, как это нечто будет работать, когда не будет работать: краевые случаи, ложные срабатывания и прочие радости жизни. Мне захотелось поэкспериментировать, и я разметил изображения с помощью MediaPipe. Модель от Google плохо работала в ситуациях, когда рука находилась под большим углом, в руке был предмет или наличие > двух рук в кадре. Обучил на этом более тяжелую модель, сгенерировал разметку уже этой моделью, а затем обучил новый детектор. Результат превзошёл мои ожидания: точность возросла, краевые случаи обрабатываются лучше, а самое главное - для этого совсем не нужно использовать человеческую разметку. Как итог - получилось сделать быстрее и точнее, чем было у MediaPipe, с помощью MediaPipe 🤓🤡 В следующей раз хочу показать, как можно использовать LLM (ну ладно, не совсем LLM, а LVLM) для решения всё той же насущной задачи - разметки данных.

Другие посты @everydaycv