ЗЗахар Варфоломеев | Музыкальный ИИ

Захар Варфоломеев | Музыкальный ИИ

@vf_science🎵 Музыка🇷🇺 Русский📅 март 2026 г.

Генерацией музыки и всем, что связано с аудио ML я занимаюсь, а всем остальным ML интересуюсь) Делюсь знаниями, мыслями, событиями по своей карье, делаю анонсы своих онлайн/офлайн мероприятий. Автор: @varfolomeefff

📊 Полная статистика📝 Все посты
🔗 Связанные:@sinecor
##audio#perfomances#036#39
1.1K
Подписчики
2.1K
Ср. охват
187.4%
Вовлечённость
19
Постов
~0.1
В день

Графики

📊 Средний охват постов

📉 ERR % по дням

📋 Публикации по дням

📎 Типы контента

Лучшие публикации

19 из 19
Vvf_science
vf_science
11 окт., 18:29

👀 Про аудио кодеки в Deep Learning School Сегодня выложили 2 части лекции и она немножко затянулась, примерно на 100 минут :) На лекции мы обсудили основополагающую технологию VQ-VAE и дошли до современных подходов к обучению аудиокодеков. Попутно рассмотрели…

👁 7.5K
Vvf_science
vf_science
11 окт., 15:37

👀 Про аудио кодеки в Deep Learning School Сегодня выложили 2 части лекции и она немножко затянулась, примерно на 100 минут :) На лекции мы обсудили основополагающую технологию VQ-VAE и дошли до современных подходов к обучению аудиокодеков. Попутно рассмотрели специфические для них проблемы и способы их решения — такие как недифференцируемость в процессе обучения, коллапс кодовой книги, неэффективное покрытие домена и недостаточная репрезентативность для последующих задач. Отметили тенденции в с...

👁 7.1K
Vvf_science
vf_science
3 сент., 13:44

Все лекции и семинары «Лето с AIRI 2025» теперь в открытом доступе 🔥 Собрали для вас записи выступлений ведущих исследователей и экспертов — от фундаментальных вопросов искусственного интеллекта до практических примеров его применения в науке и индустрии. 📎Сохраняйте ссылки на плейлисты: VK Видео, YouTube

👁 2.2K📷 photo
Vvf_science
vf_science
22 окт., 14:33

Интерактивный tutorial по аудио кодекам от Kyutai labs 😎 https://kyutai.org/next/codec-explainer

👁 1.8K
Vvf_science
vf_science
8 нояб., 10:12

12го ноября прилечу в Питер к Сергею Николенко (@sinecor), буду рассказывать в главном здании СПбГУ все, что знаю про дискретные репрезентации и выбор между непрерывными фичами, это будет экстраполяция семинара про аудио кодеки на весь ML Пишите/заходите…

👁 1.7K
Vvf_science
vf_science
3 дек., 06:16

В команду успешной музыкальной платформы с 15-летней историей ищем талантливого ML-разработчика, для качественного усиления, в связи с ростом. Плеер гитарных табов — наш основной продукт, которым ежемесячно пользуются миллионы. Мы работаем над сложными задачами в ML, включая разработку моделей для автоматической транскрипции музыки. Наши модели уже успешно создают табулатуры из аудио — вот пример результата . Это лишь часть наших проектов в области AI и музыки. Требуемые навыки: • Разработка и о...

👁 1.6K
Vvf_science
vf_science
8 нояб., 10:09

👀 Про аудио кодеки в Deep Learning School Сегодня выложили 2 части лекции и она немножко затянулась, примерно на 100 минут :) На лекции мы обсудили основополагающую технологию VQ-VAE и дошли до современных подходов к обучению аудиокодеков. Попутно рассмотрели…

👁 1.6K
Vvf_science
vf_science
18 мар., 17:06

Кто сказал «мяу»? ИТ-компания «Криптонит» приглашает на дататон «Криптонит.Тембр», где нужно распознать, кто говорит! Тебе предстоит обучить Speaker Recognition модель, устойчивую к искажениям аудио, возникающим в реальных сценариях эксплуатации речевых интерфейсов и систем обработки звука: 🔹искажения, вносимые акустической средой; 🔹посторонние шумы; 🔹реверберация; 🔹большое расстояние до микрофона; 🔹искажения каналов связи. Участвуй и ты сможешь: 🟦получить шанс разделить призовой фонд в 60...

👁 1.6K📷 photo
Vvf_science
vf_science
2 авг., 21:25

Знаю все типы людей 😆 А кто вы?

👁 1.5K📷 photo
Vvf_science
vf_science
25 авг., 19:40

Наш русскоязычный датасет для TTS опубликован! Сегодня выкладываем открытые корпуса на 4000+ часов речи, а еще синтезатор речи ESpeech-TTS-1 Наш датасет содержит больше 4000 часов русской речи. Статистика по корпусам: Многоголосые: ESpeech-podcasts - 3200…

👁 1.5K

Типы хуков

Нейтральный15 | 2.2K просм.
Статистика3 | 1.5K просм.
Вопрос1 | 1.6K просм.

Длина постов

Средние (200-500)11 | 2.1K просм.
Очень длинные (1000+)4 | 2.5K просм.
Длинные (500-1000)2 | 1.4K просм.
Короткие (<200)2 | 1.7K просм.

Влияние эмодзи

1.7K
С эмодзи (3)
2.1K
Без эмодзи (16)
-22.2% охвата

Типы контента

📝
12
text
2.4K просм.
📷
6
photo
1.5K просм.
🎬
1
video
1.0K просм.
Захар Варфоломеев | Музыкальный ИИ (@vf_science) — Telegram-канал | PostSniper