Обновление GPT Image 1.5 OpenAI представил обновлённый генератор изображений GPT Image 1.5, который работает в четыре раза быстрее и улучшает точность выполнения промптов. Модель теперь лучше редактирует изображения и удерживает детали, а также предлагает отдельные пресеты для стилей. Обновления доступны в chatGPT и через API. Подробности можно узнать здесь. @SmartChat
Smart AI News
Новости из мира нейросетей GPT и Midjourney бесплатно в нашем боте: @Smart_AI_Robot
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
19 из 19Обновление WAN 2.6 Алибаба представила WAN 2.6, который уже доступен на платформах API и на официальном сайте. Новая версия поддерживает длительность видео до 15 секунд, разрешение 1080P и режимы text-to-video, image-to-video и reference-to-video, позволяя использовать до трёх видео для консистентности. Также доступны функции генерации, редактирования и эффекты. Промпт для генерации изображений включает поддержку текста. Ссылка на WAN 2.6: WAN 2.6 @SmartChat
Обновление Suno Studio до v 1.1 Suno представил обновлённую версию Studio 1.1 для генерации музыки. В новой версии добавлен эквалайзер для регулировки частот и громкости, а также ускорено извлечение стемов до ~10 секунд. Кроме того, теперь можно изменять стиль отдельных областей стема, преобразовывая звуки, например, из пианино в гитару. Подробности можно узнать на официальном сайте или в видео. @SmartChat
Новая модель распознавания речи от ElevenLabs ElevenLabs представили Scribe v2 Realtime — модель транскрипции, которая обеспечивает точность с задержкой всего 150 мс. Она преобразует речь в текст, автоматически распознавая нескольких спикеров и справляясь с низким качеством записи. Поддерживает 90 языков и доступна в API. Для работы можно использовать следующий промпт: transcribe audio with multiple speakers Больше информации на сайте ElevenLabs. @SmartChat
📺 Day 1: Introducing Kling O1 — Brand-New Creative Engine for Endless Possibilities! 👤 Kling AI
KlingAI не отстает и выпускает свою контекстную модель для генерации видео. Теперь можно на вход подавать кадры, видео, элементы, а объяснять можно в свободном виде, модель вас поймет. Тестировать тут @SmartChat
Runway Gen-4.5: новые возможности Runway представил модель Gen-4.5, поддерживающую все режимы управления, включая преобразование изображений в видео и использование ключевых кадров. Это обновление улучшает взаимодействие с пользователем и расширяет функционал. Ознакомиться с новыми возможностями можно здесь и воспользоваться платформой здесь. @SmartChat
Релиз ChatGPT 5.2 OpenAI представила ChatGPT 5.2, который почти в два раза эффективнее в решении рабочих задач по сравнению с 5.1. Новая версия включает три режима: Instant для скорости, Thinking для сложных задач и Pro для максимальной точности. Обновления касаются отладки кода, работы с комплексными задачами и восприятия изображений. Также уменьшилось количество ошибок на 38% в режиме размышлений. ChatGPT 5.2 уже доступен здесь. @SmartChat
Новый ИИ от Google. Project Genie — это прототип веб-приложения, работающий на основе нескольких моделей ИИ, чтобы создавать свои миры. Приложение может создать вам мини игру всего за пару промтов, можно загрузить картинку, расписать что вы хотите, и вуаля. Физика, коллизия объектов, звуки, фичи которые вы пропишите, всё это будет вшито в уже готовое приложение! А ещё пару лет назад, такое казалось безумием
YouTube запустил нейродубляж на русском YouTube представил автоматический нейродубляж на русском, который поддерживает 27 языков. ИИ воспроизводит интонации, эмоции и ритм оригинальной речи. Создатели видео могут отключить дубляж или использовать свой голос. Ранее функция была доступна только для девяти языков и ограниченного числа пользователей. Подробнее здесь. @SmartChat