Большие новости по OpenAI от The Information: - OpenAI завершила предобучение своей следующей крупной модели под названием Spud и ожидает, что уже через несколько недель получит очень сильную модель, способную заметно ускорить экономику. - По словам Сэма Альтмана, события развиваются быстрее, чем многие ожидали. На этом фоне OpenAI также переименовала продуктовую организацию в AGI Deployment. А тут еще Дженсен Хуанг на днях заявил, что по его мнению AGI достигнут. Такой вот зреет нарратив. - Что...
Адель и МЛь
Об ИИ и жизни в Нидерландах @AdelZakirov
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
16 из 16Anthropic обнаружила, что в BrowseComp Claude Opus 4.6 иногда становился “eval-aware” - то есть начинал понимать, что проходит бенчмарк. Само по себе это вроде не ново, но тут случилось кое-что интересное дальше - модель пошла на гит искать ответы. В одном случае модель потратила около 40,5 млн токенов на обычный поиск, после чего заподозрила, что вопрос слишком специфичен и может быть частью eval. Затем она начала перебирать возможные бенчмарки, включая GAIA, BrowseComp, FRAMES и SimpleQA, нашл...
Примеры Genie 3 начали заполнять интернет. Собрал несколько классных от себя: • распятие Иисуса - гуляем по сцене и смотрим вокруг • катаемся на jetski вокруг острова Эпштейна (ага) • оживляем любимую игрушку ребенка и бегаем от ее лица по комнате • катаемся по полу метро Нью-йорка за пачку сигарет среди мусора • играем в GTA6 • катаемся за металлический шарик среди других желтых шаров Выглядит, конечно, впечатляюще. Попробвать можно пользователям с подпиской Ultra.
Банк Goldman Sachs начинает внедрять модель Claude, чтобы максимально автоматизировать работу в бухгалтерии и комплаенсе (это всякий контроль соблюдения законов и внутренних правил). Около 6 месяцев (!) инженеры Anthropic работали внутри Goldman и вместе с командой банка делали системы, которые действуют как “цифровые сотрудники” для большого объёма рутинных, процессных задач. Схема такая: агент на базе LLM может читать большие пачки торговых записей и тексты внутренних правил/политик, а затем п...
Ян ЛеКун поднял космические $1.03B на seed раунд для своей новой европейской (!) компании - Advanced Machine Intelligence. https://techcrunch.com/2026/03/09/yann-lecuns-ami-labs-raises-1-03-billion-to-build-world-models/ https://amilabs.xyz/
В трансформеры можно вшить маленький компьютер. Ну то есть буквально - оказывается можно встроить достаточно эффективный WebAssembly интерпретатор (!) прямо в forward pass языковой модели. Модель остается авторегрессионной, но вот текст который она генерирует - это по сути ээээ шаги выполнения программы. То есть на каждом шаге модель предсказывает следующий токен состояния вычисления. Формально механизм тот же - next-token prediction, но семантика токенов другая: они кодируют память, регистры, с...
Прикольное от Kimi - attention по слоям. Обычный self-attention работает по токенам, а здесь слой выбирает, какие более ранние представления уже по глубине взять сильнее, а какие слабее. Авторы описывают это как замену обычных residual connections: вместо фиксированного суммирования прошлых выходов используется softmax-attention по выходам с предыдущих слоев. Что-то близкое по духу было, когда предложили DenseNet, как альтернативу Resnet (правда там без взвешивания, а просто всё соединяется со в...
🔺 Taalas HC1 Друзья, это какая-то жуть. Прочитал новость и попробовал новую железку, на которую не просто записали в память какую-то LLM, а физически реализовали в кремнии (!) Так как в этом случае обходится бутылочное горлышко всей типичной архитектуры современной электроники (где память и вычисления разнесены и память работает гораздо медленней), то эта штука генерирует 17000 токенов в секунду 😱 Захардкодили квантизованную LLama 3.1 8B. Из-за хардкода же, само собой, на железке только эта мо...
ElevenLabs AI voice agents теперь можно страховать. Это очень важно для внедрения агентов кругом и везде - их действия, теперь можно страховать, как любого другого сотрудника. Большой шаг к преодолению страха за последствия. Но есть, как говорится, нюанс. Это не значит, что “включили страховку всем по умолчанию”. Скорее так: - ElevenLabs сами прошли AIUC-1 сертификацию, поэтому страховые компании готовы давать coverage для агентов, которые соответствуют этому стандарту. - Если ты делаешь агента ...
OpenAI отрастили клешни https://steipete.me/posts/2026/openclaw