2.8Kпросмотров
18 января 2025 г.
📷 ФотоScore: 3.1K
💙 Прогнозирование проходных баллов с помощью машинной обработки заданий В основном проходные баллы прогнозируют по протоколам олимпиад, но это хорошо работает только при доступности данных всех участников. Без протоколов сбор данных становится сложным, а гугл-формы и неофициальные рейтинги имеют проблему самоотбора 💬 Мы предлагаем обработку заданий для оценки их сложности На примере Всероса по информатике 🔹 Для этого сравнили три подхода:
- Prompt Engineering + Llama3.1-3B
- Finetuning BERT
- GRU с эмбеддингами Universal Sentence Encoder, обученная на задачах LeetCode Лучший результат дала модель GRU (коэффициент корреляции сложности заданий с проходными ~0.67) 💬 Далее построили прогнозную модель проходных
Признаками были средняя сложность заданий и проходной в прошлом году В итоге модель CatBoostRegressor ошибалась в среднем на ~3.6% 💬 Такой подход также помогает составителям оценивать проходные баллы еще на этапе их составления ❤️🔥 20 реакций и прогнозируем проходной по экономике