RL не улучшает навыки ризонинга модели Тренд на негативные статьи о том, что "что-то не работает или работает не так, как мы думали", остается с нами. В этот раз хайпует китайская работа под названием "Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?". Мы все привыкли к тому, что в целом ризонинг – это про RL. Но в этой статье показано, что на самом деле ничего сверхъестественного RL не вносит, а просто переупаковывает то, что уже было в распределе...
DS/ML lentagram
Лучшие посты со всех каналов По предложениям писать @kirillisupov
Лучшие публикации
11 из 11Ну давайте мужики оправдайтесь почему она а не вы https://t.me/enjicITmagic/5326
Тоже посмотрел новый сериал «Pluribus» и тоже пребываю в восторге – это тот же самый режиссёр, который снимал «Breaking Bad» и «Better Call Saul» но в Sci-Fi жанре Сериал особенно понравился потому что это какой-то новый взгляд на постапокалипсис, чего, честно говоря, давно не было – давно уже не появлялось новых вселенных в этом бесконечном мире зомби, где был бы и смысл и интересна сама вселенная А ещё, сериал актуален на фоне AGI-страшилок Короче, если ещё не смотрели, рекомендую, вышло пока ...
Введение в рексистемы. Сегодня прочитал студентам первого курса ПМИ ФКН ВШЭ вводную лекцию по рекомендательным системам. Раньше никогда не делал такие вводные лекции — обычно ограничивался парой слайдов в начале каждого доклада в духе "есть множество пользователей, множество айтемов, информационная перегрузка, хотим рекомендации". Здесь же выпала возможность максимально подробно рассказать, зачем нужны рекомендательные системы, а также показать пару простых, интуитивно понятных рекомендательных ...
✔️ Google выпустил новый 50-страничный документ о том, как создавать AI-агентов, которые реально работают в практических задачах Это понятное и структурированное введение в основы агентных систем. В гайде рассматриваются: - архитектура агента и его основные компоненты - роль LLM как «мозга» агента - подключение и использование инструментов - оркестрация нескольких агентов - подходы к деплою и продакшн-интеграции - метрики и способы оценки работы - как создаются самообучающиеся и эволюционирующие...
Российские исследователи нашли способ обучать LLM логическим рассуждениям быстрее и дешевле Исследователи из T-Bank AI Research совместно с Центральным университетом представили новый метод, который позволяет развивать способность к логическим рассуждениям у больших языковых моделей без дорогостоящего полного переобучения. Исследование станет хорошим подспорьем для дальнейшего изучения интерпретируемости ИИ. Вместо того чтобы менять миллиарды параметров, они добавили небольшие подсказки-векторы,...
#ml Machine Learning Engineer (AI) / Waibee Remote Salary: 5000€ Waibee is an international technology company headquartered in Prague, Czech Republic, building high-load digital products in AI and e-commerce. We develop next-gen solutions powered by LLMs, intellig Требования к кандидату: - 3+ years building ML/AI products in production - Strong in Python and/or TypeScript (Node.js) - Hands-on with LLMs, transformers, NLP workflows - Experience with SQL/NoSQL, CI/CD, Docker - Engineering mindset...
#ml Senior LLM-Engineer / HighSky Remote Salary: 8000$ - 15000$ Мы - динамично развивающийся стартап, решающий различные задачи AI в соревновательном формате: генерация текста, аудио и видео, обогащение данных, предиктивная аналитика. Мы осуществляем полный цикл работы над продуктом: от анализа бизнес-задачи до вывода в продакшен полноценного решения Находимся в поиске эксперта по обучению LLM. Требования к кандидату: - Опыт обучения LLM (fine-tuning / pre-training) от 2 лет - Опыт при...
#vacancy #job Вакансия: Big Data / ETL Engineer Формат работы: Удаленный Вилка: до 450 т.р на руки Что мы предлагаем: • Предлагаем оформление Контракт с UAE-компанией или самозанятость; • Испытательный срок — до 2х месяцев (можно закрыть быстрее); • Оплата в USDT, BTC, ETH или как тебе удобно; • График работы гибкий; • Удаленный формат работы из любой точки мира; Задачи: • Разрабатывать и оптимизировать ETL-пайплайны для обработки больших объемов данных (ClickHouse, Kafka, Airflow, Python); • На...
Data Dojo | Москва | 27 ноября Это мероприятие Яндекса для сообщества ML-специалистов с обсуждением трендов, прикладных кейсов и разбором реальных задач из соревнований. Зачем участвовать: 💬 послушать выступления экспертов 💬 разобрать задачи вместе с сообществом 💬 узнать, как попасть на стажировку и начать карьеру ML’щика в Яндексе 💬 завести новые знакомства и зажечь на afterparty 👉 Заполняй форму до 16 ноября. Data-самураи действуют поодиночке, но учатся вместе. Присоединяйся.