ММыcли очередного дата-сайентиста

Мыcли очередного дата-сайентиста

@everydaycv📚 Образование🇷🇺 Русский📅 март 2026 г.

О компьютерном зрении, хакатонах, науке и преподавании @exceptmeplsnow

📊 Полная статистика📝 Все посты
##39
513
Подписчики
1.5K
Ср. охват
302%
Вовлечённость
18
Постов
~0.1
В день

Графики

📊 Средний охват постов

📉 ERR % по дням

📋 Публикации по дням

📎 Типы контента

Лучшие публикации

18 из 18
Eeverydaycv
everydaycv
5 янв., 15:30

Дайджест действующих соревнований 🟢RecSys Competition 2023/2024 HH.RU проводит уже второй ML-чемпионат, на этот раз участникам предстоит по последовательности событий внутри сессий предсказать вакансию, на которую пользователь откликнется. 🔶Соревнование проводится в 3 этапа: — В первом этапе участники на протяжении двух месяцев (до 28 февраля) загружают свои решения в формате csv. — Топ 20% (но не более 50 команд) участников первого этапа пройдут во второй этап, где им предстоит подг...

👁 2.3K
Eeverydaycv
everydaycv
18 янв., 16:06

Вот что мне нравится в хороших работах по Super Resolution – они почти все являются форком. Один раз с шаблоном проекта ознакомился и вперёд. Таким образом достигается единообразие по отношению к обучению, добавлению архитектур, наборов данных, функций ошибок и т.д. Давно думал о том, что пора уже руками пощупать Super Resolution, а тут совпали необходимость и желание. Большое количество кода, связанного с преобразованием данных, уже написано. Подготовительный этап включает в себя лишь несколько...

👁 1.9K
Eeverydaycv
everydaycv
9 нояб., 11:50

Yandex ML Cup и немного теории игр Недавно были довольно длинные выходные, которые я провёл за попытками улучшить своё решение для задачи "Nowcasting". Суть задачи - предсказание погоды на следующие два часа, имея данные о погоде за последние 40 минут. Я попробовал много разных архитектур, но, видимо, всё же что-то делаю не так. Мне удалось подняться с 21 места на 12, но, я явно что-то упускаю. Вчера нашёл статью, в которой предлагается взвешивать ошибку за разные промежутки предсказаний. Очевид...

👁 1.8K
Eeverydaycv
everydaycv
2 сент., 20:51

Клонирование голоса Недавно в трендах GitHub'а я увидел очень любопытный проект, который нельзя было обойти стороной. Группа энтузиастов обучала модель VALLE-E X, решающую zero-shot задачу преобразования текста в речь. Архитектура была изначально предложена компаний Microsoft. Но, увы, Microsoft опубликовали лишь исследование, не добавив туда ни код, ни предварительно обученную модель. Как пишут сами авторы реализации: "Осознавая потенциал и ценность этой технологии, наша команда взяла на себя т...

👁 1.7K📷 photo
Eeverydaycv
everydaycv
29 июл., 23:41

Первые записи докладов готовы ✅ И они с потока CV & Speech: ▫️Как развитие LLM влияет на будущее голосовых технологий. Евгений Брицын, Head of Speech, Т-Банк ▫️Визуально-текстовая мультимодальность. Роман Исаченко, руководитель подгруппы дискриминативного анализа изображений, Яндекс ▫️Ускорение создания моделей синтеза речи — от обработки данных до production. Валерий Болдаков, Team Lead, Speech Synthesis, Т-Банк ▫️От непризнанного научного бенчмарка до основной метрики качества голоса в VK Звон...

👁 1.7K
Eeverydaycv
everydaycv
24 сент., 16:20

Обучить "тяжёлую" модель на плохой разметке Известен способ, когда маленькую модель обучают на "знаниях" большой модели - дистилляция. Но можно попробовать и в обратную сторону. Многие вещи становятся более понятны на примерах, поэтому вернёмся к задаче детектирования рук. Казалось бы, а что тут сложного ? Взяли данные, закинули в разметку, написали ТЗ, люди разметили, результат провалидировали, модельку обучили и выкатили в прод. Да, идея замечательная, но есть одно но - не совсем понятно, как ...

👁 1.6K📷 photo
Eeverydaycv
everydaycv
14 окт., 15:37

История одного бага или как я сделал пул-реквест в PaddleOCR С августа месяца мне приходится активно решать задачи, связанные с оптическим распознаванием символов (OCR): детекция текста, сегментация на слова/линии, распознавание чисел и слов. Как я уже говорил в посте выше, для решения части задач я использую библиотеку PaddleOCR. Меня радует, что там довольно активное сообщество, которое развивает продукт, и оперативно исправляет баги. Однако один из багов заставил потратить меня несколько дней...

👁 1.6K📷 photo
Eeverydaycv
everydaycv
18 янв., 16:05

BSRC-2023 или как сделать так, чтобы ничего не делать Про соревнование я узнал в конце августа, прочитав анонс в какой-то из групп в tg. Ознакомился с условием, посмотрел на метрику и благополучно закрыл до лучших времен. "Окей, вернусь к этому в конце сентября, когда станет понятнее, что с этим делать", - подумал я про себя. Наступил сентябрь. Я наконец-то попытался отправить в тестирующую систему baseline от организаторов. Угадаете, что было дальше? Правильно, решение не засчитывалось. Я всё в...

👁 1.6K
Eeverydaycv
everydaycv
19 дек., 19:44

Уважаемые участники, добрый вечер! Рады вам объявить победителей соревнования по результатам перетестирования решений на приватном лидерборде: 🏆 1 место — caxapok (9664) 🏆 2 место — exceptmeplsnow (9288) 🏆 3 место — DGAENNYY (9231) Команды-призеры: 💥 4 место — goofy_dumplings (8917) 💥 5 место — uzbek (7790) 💥 6 место — Malik (7336) 💥 7 место — LabADT (5604) Команды-победители и команды-призеры, просим вас в срок до 27 декабря направить на почту соревнования bsrc@hse.ru следующую информаци...

👁 1.6K📷 photo
Eeverydaycv
everydaycv
26 окт., 20:06

Сверточные нейросети догнали трансформеры на больших данных Долгое время бытовало мнение, что трансформеры лучше масштабируются и превосходят сверточные сети при обучении на огромных наборах данных из интернета. Однако недавнее исследование опровергает это убеждение. Ученые обучали мощные сверточные модели семейства NFNet на наборе данных JFT-4B, содержащем 4 миллиарда изображений. Бюджет обучения варьировался от 400 до 110 000 часов на TPU v4. Чем больше вычислительных ресурсов тратилось, тем л...

👁 1.6K📷 photo

Типы хуков

Нейтральный16 | 1.6K просм.
Вопрос1 | 1.3K просм.
Статистика1 | 1.6K просм.

Длина постов

Очень длинные (1000+)11 | 1.6K просм.
Длинные (500-1000)3 | 1.6K просм.
Средние (200-500)2 | 1.3K просм.

Влияние эмодзи

1.7K
С эмодзи (3)
1.5K
Без эмодзи (15)
+10.3% охвата

Типы контента

📝
8
text
1.6K просм.
📷
10
photo
1.5K просм.
Мыcли очередного дата-сайентиста (@everydaycv) — Telegram-канал | PostSniper