505просмотров
57.8%от подписчиков
25 марта 2026 г.
stats📷 ФотоScore: 556
🦸♂ Composer 2, Unsloth Studio и Claude, который нажимает кнопки за вас Cursor поймали с Kimi под плащом, OpenAI скупает Python-инфраструктуру, Claude учится жить вне терминала, а Unsloth решил, что файн-тюнинг пора отдавать обычным работягам. Разбираемся со всем этим. 🌟 Cursor выпустил Composer 2 и сразу же влетел в маленький детектив. На бумаге всё выглядело красиво: 61.7% на Terminal-Bench 2.0, $0.50/$2.50 за миллион токенов, дообучение и RL. А потом комьюнити нашло под капотом следы Kimi K2.5 от Moonshot AI. Токенизатор, URL модели в отладке, вот это всё. Через несколько часов Cursor объяснил, что взял K2.5 как базу, потому что она лучше всех прошла внутренние проверки среди open weight моделей, а основная ценность уже в их собственном дообучении и RL. Moonshot AI это подтвердила. По сути, мы получили первый громкий кейс, когда большой продукт берёт китайскую open weight модель, доучивает и продаёт как свою. Получается, у китайцев получилось? 🌟 OpenAI тем временем купил Astral, команду-разработчика uv, ruff и ty. Если пишете на Python, вы почти наверняка уже живёте на их инструментах. Google раньше забрал Antigravity, Anthropic купил Bun, теперь и OpenAI подтягивает дев-инфраструктуру к себе. Лаборатории больше не хотят просто продавать модели. Они хотят владеть всем стеком разработчика. 🌟 В тот же день OpenAI выкатил GPT-5.4 Mini и Nano. Mini в 2 раза быстрее GPT-5 mini, с контекстом 400k и ценой $0.75/$4.50 за миллион токенов. Это дешёвая рабочая лошадка для фоновых задач и субагентов. На BullshitBench новые малышки, правда, выступили так себе. Но хотя бы без сказок про универсального убийцу всего живого. 🌟 Claude получил computer use на macOS в research preview. То есть теперь он реально может нажимать кнопки, двигать мышь, открывать приложения и бродить по браузеру через Cowork и Claude Code. Можно будет сказать маме, что это не ты скачал те видео. Рядом появились Channels для Telegram и Discord. И вот это уже важнее, агент для кода перестаёт жить только в терминале. Написал ему в чат, он ушёл делать задачу на компьютере и вернулся с результатом. Чуть-чуть Black Mirror, но полезный. 🌟 На фоне гонки гигантов особенно приятно смотрится Unsloth Studio, который вышел как open-source интерфейс для локального запуска и обучения 500+ моделей. Главное обещание простое: файн-тюнинг прямо из UI, без танцев с кучей скриптов. Для тех, кто хотел единое окно для локальных моделей, это один из самых практичных релизов недели. 🌟 А ещё вышла Mamba-3. Не буду грузить архитектурной эзотерикой, но сигнал понятный: индустрия продолжает искать жизнь за пределами чистого трансформера, особенно там, где важны длинный контекст и дешёвый инференс. Можете почитать мою статью, там я рассказываю, в чем прикол с этими трансформерами. 🌟 Но мой любимый момент недели всё равно не модель, а Instant Grep от Cursor. Они показали regex-поиск по миллионам файлов за 13 миллисекунд вместо 16.8 секунд на ripgrep. Если цифры не маркетинговая магия, это меняет сам способ работы агента с кодовой базой. 🌟 Уважаемый, ripgrep, мы тебя всё ещё любим. Но 16.8 секунд против 13 миллисекунд это уже разрыв, после которого начинаешь смотреть на старые инструменты с лёгкой ревностью. Может, не всё будущее за новыми моделями. Может, часть будущего за теми, кто просто делает агентам нормальные руки. Расширенную версию поста ищите на сайте. Если зашел контент, не забывайте на него реагировать. Подписывайтесь на канал, делитесь статьей с друзьями и оставайтесь любопытными. #галлюцинации_недели