173просмотров
23.3%от подписчиков
20 марта 2026 г.
stats📷 ФотоScore: 190
Российские нейросети. Часть 3: Видео и звук 🎬 Текст написали, картинки нарисовали. Осталось заставить все это двигаться и говорить. В третьей части нашего обзора мы тестируем мультимедийные возможности отечественного ИИ. Смогут ли нейросети озвучить презентацию или перевести лекцию профессора из Массачусетского технологического института? На ринге снова экосистемы: 🤩 Сбер (Kandinsky Video + SaluteSpeech)
Инструменты для тех, кто создает контент с нуля. Генерация видео и Telegram-бот для озвучивания доступны бесплатно (на текущем этапе тестирования). Плюсы:
— Спецэффекты: вы отправляете сценарий, выбираете голос и получаете готовую аудиодорожку. Сервис SaluteSpeech качественно озвучивает текст.
— Голос диктора: можно создать пролет камеры над заводом или анимацию работы механизма (схематично). Kandinsky Video генерирует короткие ролики по текстовому описанию.
— Режиссерское кресло: Kandinsky умеет «оживлять» статичные изображения, добавляя им движения. 🤩 Яндекс (Шедеврум + Браузер)
Инструменты для потребления контента и быстрого создания креативов. Все функции бесплатны (встроены в браузер и мобильное приложение). Плюсы:
— Убийца языкового барьера: закадровый перевод видео в Браузере — главная фича для инженеров. ИИ распознает иностранную речь в роликах на YouTube и накладывает русский голос поверх оригинала в режиме реального времени.
— Мобильная анимация: в приложении «Шедеврум» можно создавать короткие видео-сэмплы. Подходит для динамичных обложек или сторис.
— Краткий пересказ: нейросеть «смотрит» за вас длинное видео и выдает текстовую выжимку с тайм-кодами. 🤩 Осторожно! Общие недостатки 1. Короткий метр. Сгенерировать полноценный фильм не получится. Нейросети создают видео продолжительностью всего несколько секунд (обычно до 4–8 секунд).
2. Законы физики. В сгенерированных видео объекты могут внезапно менять форму, исчезать или проходить сквозь стены. Для демонстрации точных физических процессов это пока не подходит.
3. Интонация. Синтезированный голос звучит чисто, но иногда путает ударения в профессиональных терминах или говорит слишком монотонно. 🤩Вердикт для инженера Нужно изучить зарубежный опыт или быстро понять суть длинного вебинара? Однозначно Яндекс Браузер.
Нужно озвучить ролик для отчета или создать футуристичную видеозаставку? Используйте связку Kandinsky и SaluteSpeech. Ставьте ❤️, если пользуетесь закадровым переводом видео! 🤩 MAX | 🤩 VK