🔥 Твоя статья может принести 1 миллион рублей! ВТБ и Институт ИИ МГУ открыли прием заявок на конкурс Data Fusion Awards для data scientists и ML-исследователей. Ищут лучшие научные статьи 2025 года по ИИ. Зачем участвовать: 🔵 Продемонстрировать прорыв в математике ИИ, оптимизации или глубоком обучении 🔵Получить признание от лидеров отрасли 🔵 Забрать до 1 млн рублей из призового фонда 3 млн 🔵 Усилить резюме аффилиацией с топ-конкурсом 👉 Подавать заявку до конца января на сайте
DATApedia | Data science
Тут вы найдете всё, что связано с Data Science, AI и Machine Learning, как для начинающих, так и для бывалых специалистов. Также, для вас, мы переводим зарубежные статьи. Сотрудничество: @Seyfme
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
20 из 20Создаем простую систему RAG на Python Представьте, что вы предоставляете своему ИИ конкретные релевантные документы (или фрагменты), которые он может быстро просмотреть, чтобы найти необходимую информацию, прежде чем ответить на ваши вопросы. То есть, вместо поиска по всей базе данных (которая может не поместиться в контекстное окно модели LLM, или даже если поместится, это потребует много токенов для ответов), мы предоставляем LLM только релевантные документы (фрагменты), которые ему необходимо...
Проверяем качество ИИ без сложной математики Представьте, что ваша команда только что получила доступ к новейшей AI-модели или внедрила умный чат-бот. Коллеги в восторге от точности, скорости и функциональности инструмента. Но как понять, насколько он действительно хорош? Читать | DATApedia
Как системному аналитику перейти в дата-аналитику: советы из личного опыта Расскажу, что в профессии системного аналитика остается неизменным, какие есть ключевые концепции и инструменты Data-направления и что на самом деле нужно знать для перехода. Читать | DATApedia
Анатомия трансформеров: почему обычный Self-Attention больше не используют В этой статье я постараюсь рассказать, как механизм внимания помогает языковым моделям обрабатывать тысячи слов контекста и почему с этим не справлялись в свое время обычные RNN. В конце статьи я расскажу про проблемы классического attention и современные адаптации. Читать | DATApedia
Метрики для задач NLP. Часть 1. Классификация, NER, Кластеризация В этой статье будет рассказано о популярных метриках для NLP-задач: классификации текста, NER и кластеризации. Рассказ будет сопровождаться визуализацией, примерами и кодом на Python. Читать | DATApedia
«Галлюцинации LLM — это не баг»: профессор математики объясняет, почему ИИ не перестанет врать Владимир Крылов, профессор математики, научный консультант Artezio и один из самых глубоких русскоязычных экспертов по применению ИИ в разработке, дал интервью по итогам года. Мы поговорили о том, почему reasoning-модели галлюцинируют вдвое чаще обычных (и это математически неизбежно), почему OpenAI объявил «код красный» и отстаёт от Google, и правда ли, что программисты, умеющие писать код только рука...
Книги, видео и курсы для изучения ML Собрали бесплатные ресурсы, которые позволят погрузиться в работу с искусственным интеллектом — как для новичков, так и для тех, кто уже работает с ML и хочет углубить знания. Читать | DATApedia
Линейная регрессия, встряска рейтинга и первое место. Часть 1: Ёлочка, живи Сказ о том, как после долгого перерыва я "взял в руки шашки" (поучаствовал в ML-соревновании) и дотащил задачу на "таблички" до первого места на финальном "приватном" лидерборде с помощью простейшей подготовки фич и классической линейной регрессии с регуляризацией, внезапно обогнав при этом всех модных катбустеров, банально переобучившихся на "паблике". Читать | DATApedia