🎬 Helios: открытая 14B-модель генерирует видео длиной больше 60 секунд со скоростью 19,5 FPS на одной H100 Исследователи из Пекинского университета и ByteDance выпустили Helios — открытую 14B-модель, которая генерирует видео в реальном времени - 19,5 кадров в секунду, длительностью больше минуты. Для сравнения, базовая модель Wan-2.1 14B тратит около 17 минут на 5-секундный клип. Helios делает то же самое в 128 раз быстрее — и при этом генерирует видео длиной в минуту без деградации качества. H...
Neurohive
Нейросети - свежие новости. State-of-the-art модели и методы, AI, Deep learning, Big data, Machine learning, NLP, Computer vision Website: neurohive.io/ru/ По вопросам сотрудничества: @cyrud Только уникальный контент.
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
13 из 13🫥 Лучшая AI-модель на 13% хуже людей распознает сгенерированные ASMR-видео Исследователи из Oxford, NUS и CUHK представили Video Reality Test — первый бенчмарк для тестирования способности VLM отличать настоящие ASMR-видео от сгенерированных. Одновременно проверялась способность моделей генерировать фейки. До реального понимания достоверности и создания неотличимого от реальности контента моделям еще далеко. 11 моделей анализировали 149 популярных ASMR-видео с Youtube и их вариации, которые соз...
🌍 Yume1.5: открытая модель для генерации интерактивных миров с управлением с клавиатуры Команда Shanghai AI Laboratory и Fudan University представила Yume1.5 — открытую модель для генерации бесконечных интерактивных видео-миров с управлением WASD и стрелками, как в играх от первого лица. Модель превосходит конкурентов в скорости в 70 раз: 6-секундное видео генерируется за 8 секунд против 572-971 у конкурентов. Yume1.5 на базе Wan2.2-5B генерирует видео 544×960 с 12 fps на одной A100, используя ...
🕹 Wan-Move: открытая альтернатива Kling 1.5 Pro для контролируемой генерации движений на видео Команда Tongyi Lab из Alibaba, Университета Цинхуа и Гонконгского университета представила Wan-Move — открытую модель для точного управления движением в генеративных видео. В пользовательских тестах модель превзошла коммерческий Kling 1.5 Pro по качеству движения и может применяться для создания маркетингового контента, анимации и обучающих материалов, где критичен контроль траекторий объектов. Wan-Mo...
👨💻 Claude Sonnet 4.5 побеждает на backend-бенчмарке ABC-Bench, лучше всех справившись с кодом и настройкой окружения ABC-Bench — первый бенчмарк, который проверяет способность ИИ-агентов решать полноценные задачи backend-разработки: от изучения кода в репозитории до настройки окружения и запуска сервиса в контейнере. Исследователи опубликовали код платформы оценки на Github, а датасет доступен на Hugging Face. ABC-Bench проверяет полный цикл: агент должен изучить структуру репозитория, понять...
👩⚕️💊 Baichuan-M3: открытая медицинская модель ведет диалог как настоящий врач, обходя GPT-5.2-High и людей в точности диагностики Baichuan-M3 ведет себя как опытный терапевт — методично выясняет детали: когда именно началась боль, какого она характера, есть ли сопутствующие симптомы, какие лекарства принимались, были ли подобные эпизоды раньше. Только собрав достаточно клинической информации, поставит диагноз и пропишет лечение. Baichuan-M3 — первая модель такого класса, которую можно скачать...
VBVR-WAN2.2 — "самый умный" видеогенератор Команда из 50+ исследователей из Berkeley, Stanford, CMU и Oxford опубликовала датасет Very Big Video Reasoning (VBVR) — и дообученная на нём модель Wan2.2 обогнала Sora 2 и Veo 3.1 в задачах на рассуждение. Sora, Veo, Kling умеют делать красивое видео. Но они проваливаются в задачах, где требуется провести агента через лабиринт или предсказать, как упадёт мяч после броска. Проблема не в качестве картинки, а в том, что модели не умеют рассуждать. И данн...
GLM-5: топ-1 открытая модель для генерации кода и текста, конкурирующая с Claude и GPT на агентных задачах Zhipu AI опубликовали техрепорт GLM-5 — на сегодня лучшей открытой LLM в индексе Artificial Analysis и топ-1 в кодинге и тексте на LMArena, лидер на бенчмарках BrowseComp и HLE с инструментами среди всех моделей, включая закрытые. Модель умеет писать код, искать информацию в интернете, генерировать презентации и выполнять многошаговые задачи с рассуждениями. Авторы называют GLM-5 переходом ...
🤖 OpenClaw-RL: фреймворк обновляет веса агента на ходу, обучая его на реакциях пользователя и среды Исследователи из Princeton выпустили OpenClaw-RL — фреймворк, который дообучает агента в фоне, пока тот отвечает на запросы, без отдельного датасета и без ручной разметки. Cигналы извлекаются автоматически в процессе диалога. Языковые модели не меняются от разговора к разговору: веса фиксированы, и после завершения сессии ничего не сохраняется в параметрах. То, что выглядит как «запоминание» — эт...
📘 На Stepik вышел курс — «AI Agents PRO: LangGraph, AutoGen и LLMOps в продакшне» Хотите собирать AI-агентов и RAG-сервисы так, чтобы это стабильно работало в эксплуатации: с метриками, оценкой качества, контролем стоимости и нормальным деплоем? Этот курс — полный путь от прототипа к прод-сервису. Агенты: LangGraph/AutoGen, роли/состояния, FSM/DAG, параллелизм RAG: hybrid retrieval + rerank (Qdrant/FAISS/Weaviate) Надёжность: таймауты, ретраи, идемпотентность, DLQ Eval/качество: golden-сеты, LL...