Google сжала память LLM в шесть раз без потери точности — новый алгоритм TurboQuant Google сжала KV-кэши языковых моделей в шесть раз без потери точности. Алгоритм TurboQuant квантизирует данные до 3 бит и на GPU Nvidia H100 даёт до восьмикратного ускорения при вычислении attention — без какого-либо дообучения модели. Фишка в том, что стандартные методы сжатия оставляют служебные биты, которые при больших контекстах накапливаются. TurboQuant избавляется от этого балласта через перевод векторов в...
MLTimes
MLTimes - если хотите быть в теме и реально понимать, что происходит в мире ИИ.
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
20 из 20ARC-AGI-3: люди справляются на 100%, ИИ — меньше чем на 1% Новый бенчмарк ARC-AGI-3 от Франсуа Шоле: люди проходят все мини-игры без правил с результатом 100%, лучший ИИ-агент набирает 2,78%, большинство — ровно 0%. Тест не объясняет правил: нужно самому понять цель, освоить управление и пройти уровень. Методологию уже критикуют: эталон — не средний человек, а один из лучших; эффективность считается по квадрату (прошёл за 100 ходов вместо 10 = 1% балла); ИИ даже не сообщают, что управление нужно...
Mistral выпустила голосовую модель, которая помещается на смарт-часах Mistral выпустила Voxtral TTS — открытую модель синтеза речи, которая помещается на смарт-часах. Клонирует голос по 5-секундному семплу, удерживает акцент при переключении между языками, задержка до первого звука — 90 мс. Девять поддерживаемых языков, конкуренты — ElevenLabs, Deepgram и OpenAI. Модель построена на Ministral 3B и позиционируется как дешевле всех аналогов при сопоставимом качестве. У Mistral теперь есть полный с...
OpenAI завершила обучение новой модели — Сэм Альтман обещает «ускорить экономику» OpenAI закончила предобучение нового флагмана под кодовым именем Spud. Альтман написал сотрудникам: через несколько недель у компании будет «очень сильная модель», которая «по-настоящему ускорит экономику». Ради неё закрывают Sora — освобождают вычислительные мощности. Spud планируют сделать основой «суперприложения», которое объединит ChatGPT, Codex и браузер Atlas. Тем временем Anthropic уверенно теснит OpenAI в ...
OpenAI закрывает Sora — Disney забирает свой миллиард OpenAI закрывает Sora — приложение просуществовало меньше полугода. Disney тут же разорвал сделку на миллиард долларов, подписанную в декабре 2025-го: компания собиралась лицензировать своих персонажей и интегрировать технологию в Disney+. Финдиректор OpenAI сослалась на нехватку вычислительных мощностей. Но за этим — провал в App Store после вирусного старта, конкуренты из Китая с более дешёвыми моделями, правовые претензии и сжирающие ресур...
Утечка раскрыла секретную модель Anthropic: «шаг вперёд» в мышлении и коде Anthropic случайно выложила в открытый доступ почти 3000 внутренних документов — из-за дефолтной настройки в CMS. Среди файлов оказались материалы о новой мощной модели, которую компания ещё не анонсировала. После публикации Fortune Anthropic признала утечку и заодно подтвердила: модель уже тестируется, делает «шаг вперёд» в рассуждениях, коде и кибербезопасности. Параллельно OpenAI завершила предобучение модели Spud. Обе...
Суд остановил преследование Anthropic: судья назвала действия властей «произвольными» Суд в Калифорнии выдал временный запрет на исполнение приказа Трампа против Anthropic. Компанию внесли в реестр угроз цепочке поставок — туда обычно попадают враждебные иностранные структуры, — после того как она вступила в спор с Министерством обороны. Судья Рита Лин назвала это «произвольным» решением и спросила у правительства: зачем вообще такой статус, если можно было просто расторгнуть контракт? На место ...
Arm впервые начнёт продавать собственные чипы — первый покупатель уже есть Arm десятилетиями продавала лицензии на архитектуру — теперь компания сама выходит на рынок чипов. Первый продукт — AGI CPU для запуска нейросетей на устройствах пользователя. Это прямой удар по нише Nvidia в инференсе. Arm исторически выигрывает там, где важна энергоэффективность, а не мощность. Meta при этом давно ищет альтернативы дорогому железу от Nvidia — и, похоже, нашла партнёра.
ИИ-агенты научились улучшать сам механизм своего улучшения Новый класс ИИ-систем — гиперагенты — умеет переписывать не только свой код под конкретную задачу, но и логику того, как именно он себя улучшает. Тест на рецензировании научных статей: точность выросла с нуля до 0,71. На робототехнике — с 0,06 до 0,37. Причём систему под эти задачи специально не затачивали. Главный результат — перенос. Агент, обученный на статьях и роботах, справился с олимпийскими задачами по математике. Оригинальная си...
ИИ всё чаще игнорирует инструкции и обманывает людей — исследование зафиксировало пятикратный рост случаев Британские исследователи из CLTR собрали 700 реальных случаев, где ИИ-агенты действовали против воли пользователей — удаляли файлы без разрешения, создавали других агентов в обход запретов, публично обвиняли своих владельцев. За последние полгода число таких инцидентов выросло в пять раз. Финансировал исследование британский государственный институт безопасности ИИ. Авторы предупреждают: по...