Сбор данных и разметка: как с нуля собрать хорошие данные под реальную ML-задачу? Хорошие данные — залог успеха.Но на практике это недели и месяцы разметки, потраченные ресурсы, спорные инструкции и баги. Хорошая новость: эти проблемы уже решаются — с помощью LLM, гибридных пайплайнов и продуманных процессов. В статье расскажем, как меняется подход к разметке и что уже работает на практике: - как использовать LLM в роли разметчика и быстро получить данные - где всё ещё нужен человек и зачем - ка...
НейроБаза | Алексей Яндутов
Нейросети и их применение без сложностей. Как внедряю в работу и жизнь. 🟡 ML инженер в поиске Яндекса ⚪️ Более 4 лет в машинном обучении: Сбер, Accenture, МГУ Автор - @yandutov
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
12 из 12Топ 2 неочевидных совета по написанию рабочих запросов для LLM, которые использую на практике Часто получаете в ответах GPT не то, что ожидате? Особенно, когда нужно стабильное качество в регулярных задачах? В прошлом посте делился, какие рабочие задачи уже решаются с пользой, просто написав промт в GPT. И как раз недавно у нас в поиске автоматизировали сложную разметку данных за счет LLM, которую раньше делали люди. И сильно удешевели процесс . Спойлер: для большего качества использовали не тол...
Написал на прошлой неделе статью для одной школы по машинному обучению Классное чувство, когда делаешь то, что интересно, и готов делать просто так. А потом оказывается, что это ещё и нужно и другим, что готовы выкладывать , и даже за это платить. Причём это моя первая полноценная статья, длиннее поста в телеграмме, еще и для ML специалистов (не считая научных статей с универа). И сходу получилось кайфово, судя по отзывам. В этой школе в мае ещё планирую провести занятия. Интересно попробовать с...
Кажется, это единственный канал об AI, в котором не было о китайской модели Deepseek. Все потому что админ отдыхал в это время в горах. Делюсь видео и фоточками. Правда даже там трудно было пропустить, и поднимаясь на подъемнике не читать статьи и скидывать мемы о deepseek. Ездил уже второй раз в детский лагерь зимний выезд @lomonosovkataet компашкой в 600 человек. В котором днем катались, а вечером тусили на крутых мероприятиях. Когда вернулся, пересматриваю фоточки, ощущаю, насколько было насы...
Зачем мы пишем промты по 500+ строк в поиске яндекса? И часто ли встречаете такие длинные запросы к gpt? Я раньше не часто, но в последние месяцы - регулярно. Все больше моих рабочих задач ML инженера сводятся к написанию качественных промтов, а не обучения моделей и написания кода. Вот она, новая эра, и это только начало. 😄 Где используем такие длинные промты: 📌 Разработка прототипов Процитирую пост с канала моего руковода (не реклама, но рекомендую!) Как делать надо (”проверять продукт”): - ...
Давненько сюда не писал, но теперь точно есть повод. Выступаю в эту пятницу на Highload в треке GenAI с докладом «AI-ответы в Яндекс Поиске: как увеличить счастье пользователей и сэкономить GPU». Доклад технический и будет интересен тем, кто работает с Gen AI продуктами. Поговорим про - внедрение генеративных моделей с пользой - llm роутинг - как масштабировать и экономить при этом ресурсы и не только… Рассмотрим на реальной практике нескольких релизов поиска на более чем 100+ млн пользователей....
Вернулся с каникул, делюсь прикольной утренней рутиной, которую пробую регулярно последнюю неделю. Вы хоть раз ставили цель - выучить английский? Если да, то скорее сталкивались с одной болью, когда начинаете регулярно читать книги, статьи, смотреть видосики и фильмы. Временами встречаешь неизвестные слова, фразы, отсылки. И идти гуглить каждое - совсем не хочется, так как сбивает темп и кайф чтения. С другой стороны даже если понимаешь по контексту, можешь упустить детали. Особенно если это тех...
Видно, сейчас уже не до душных постов и подробных разборов. Оставим на следующий год В предновогоднюю суету поделюсь чем-то легким и личным. Например последнее мое открытие, которое помогло +- регулярно писать - делать это с утра, причем сразу после подъема. Когда голова и мысли не забиты ничем лишним, и даже сомнениями. Выделять на это окошко ровно в 25 минут, а потом лететь по делам. Правда спустя пару дней понял, что моему перфекционмзму не хватает этого времени и нужно выделять минимум час З...
От школьников до Гарварда: как ИИ меняет образование Пробовали вбивать математические задачки в поиск Яндекса? Или фоткать страницу учебника в приложении с умной камерой. Если да, то увидите, как на ходу задачка решится нейронкой (cм пост) Это один из проектов, который делаем с командой. На его примере вижу, как ИИ становится востребованнее и меняет подходы. Это также видно на исследованиях, которые обсуждали на недавнем синке команды Краткие выводы: ✏️ ИИ уже меняет образование и становится нор...