D
Deep 🍒 Picking | Артём Вишня
@asvishnya_blog107 подп.
139просмотров
11 января 2026 г.
question🎬 ВидеоScore: 153
📷 Живой или не особо? Digital Twin на скорую руку В 2025-м мы много работали над применением ИИ (по линии LLM) в рамках так называемых "воркфлоу". Суть буквально в том, что бралась облачная или (в силу конфиденциальности) локальная большая языковая модель, через Structured Output делалась ожидаемая схема JSON-ответа (для детерминированности результата), все это оборачивалось в цепочку рассуждений (Chain-of-thought (CoT)) и в виде System + User Prompts отправлялось на OpenAI-compatible REST API, а получаемые результаты обрабатывались в коде и выполнялся нужный бизнесу Action. Где-то рядом были парсеры + RAG, транскрибаторы и вот это вот все 🤓 Не смотря на бурный хайп тематики Agentic-сценариев реализации всего этого со второй половины ушедшего 2025-го, от меня совершенно ускользала тема генерации медиа, а прежде всего - цифровые аватары (Digital Twins). Да, на фоне пробовал и suno для аудио, и nano banana pro для графики, и синтезаторы речи в духе elevenlabs, но вот all-in-one - нет. В рамках новогоднего звонка с Ольгой, которая медийно достаточно активна, родилась мысль: а что, если взять и сделать экспериментально ее "цифровую копию", которую потом попробовать в разных сценариях (о них расскажу позже). Задумано - начато - в процессе 💻 Что сделал для старта в тематике: 1️⃣ Нашел хорошее сольное видео у нее на "тытрубе". 2️⃣ Чтобы не ждать ответов ее монтажеров для получения сырца с фронтальной камеры, забрал полное видео через оперативно собранный python-скрипт с yt_dlp. 3️⃣ Взял Creator-подписку на HeyGen и проверил соответствие видео требованиям. Коротко: HD 1920x1080p@25 или выше. 4️⃣ Понял, что придется ручками (ибо каникулы и все отдыхают) резать (съемка была Multicam, а мне нужен анфас = фронталка, потому что для качественного датасета аватара нужен стабильный взгляд в камеру без резких поворотов головы), поэтому через простейший LosslessCut пришлось пройтись ручками по ключевым кадрам и фреймам, разметив нужные мне сегменты для экспорта. 5️⃣ Полученное видео загрузил в HeyGen -> Avatar -> Start from a video, а результат на момент написания поста ждет пока верификации (Verify Identity от самой Ольги). Но уже есть Preview! В комментах кидаю несколько скринов процесса для понимания, но, в целом, даже на текущем этапе я приятно удивлен тем возможностям, которые сегодня есть для продакшена контента при наличии хорошего сырца (а лучше нескольких). Чуть позже напишу о результатах генерации более длинных роликов, а пока аттачу буквально 5 сек. Живой человек или не особо, что думаете? 😵‍💫 P.S.: врачебная тематика ролика на входе, конечно, была щепетильная, но AI-то что, правда? 🤥
139
просмотров
2636
символов
Да
эмодзи
Да
медиа

Другие посты @asvishnya_blog

Все посты канала →
📷 Живой или не особо? Digital Twin на скорую руку В 2025-м — @asvishnya_blog | PostSniper