Захар Варфоломеев | Музыкальный ИИ

@vf_science🎵 Музыка🇷🇺 Русский📅 март 2026 г.

Генерацией музыки и всем, что связано с аудио ML я занимаюсь, а всем остальным ML интересуюсь) Делюсь знаниями, мыслями, событиями по своей карье, делаю анонсы своих онлайн/офлайн мероприятий. Автор: @varfolomeefff

📊 Полная статистика 📝 Все посты

🔗 Связанные:@sinecor

##audio#perfomances#036#39

1.1K

Подписчики

2.1K

Ср. охват

187.4%

Вовлечённость

Постов

~0.1

В день

Графики

📊 Средний охват постов

📉 ERR % по дням

📋 Публикации по дням

📎 Типы контента

Лучшие публикации

19 из 19

vf_science

11 окт., 18:29

👁 7.5K

📊 Аналитика

vf_science

11 окт., 15:37

👀 Про аудио кодеки в Deep Learning School Сегодня выложили 2 части лекции и она немножко затянулась, примерно на 100 минут :) На лекции мы обсудили основополагающую технологию VQ-VAE и дошли до современных подходов к обучению аудиокодеков. Попутно рассмотрели специфические для них проблемы и способы их решения — такие как недифференцируемость в процессе обучения, коллапс кодовой книги, неэффективное покрытие домена и недостаточная репрезентативность для последующих задач. Отметили тенденции в с...

👁 7.1K

📊 Аналитика

vf_science

3 сент., 13:44

Все лекции и семинары «Лето с AIRI 2025» теперь в открытом доступе 🔥 Собрали для вас записи выступлений ведущих исследователей и экспертов — от фундаментальных вопросов искусственного интеллекта до практических примеров его применения в науке и индустрии. 📎Сохраняйте ссылки на плейлисты: VK Видео, YouTube

👁 2.2K📷 photo

📊 Аналитика

vf_science

22 окт., 14:33

Интерактивный tutorial по аудио кодекам от Kyutai labs 😎 https://kyutai.org/next/codec-explainer

👁 1.8K

📊 Аналитика

vf_science

8 нояб., 10:12

12го ноября прилечу в Питер к Сергею Николенко (@sinecor), буду рассказывать в главном здании СПбГУ все, что знаю про дискретные репрезентации и выбор между непрерывными фичами, это будет экстраполяция семинара про аудио кодеки на весь ML Пишите/заходите…

👁 1.7K

📊 Аналитика

vf_science

3 дек., 06:16

В команду успешной музыкальной платформы с 15-летней историей ищем талантливого ML-разработчика, для качественного усиления, в связи с ростом. Плеер гитарных табов — наш основной продукт, которым ежемесячно пользуются миллионы. Мы работаем над сложными задачами в ML, включая разработку моделей для автоматической транскрипции музыки. Наши модели уже успешно создают табулатуры из аудио — вот пример результата . Это лишь часть наших проектов в области AI и музыки. Требуемые навыки: • Разработка и о...

👁 1.6K

📊 Аналитика

vf_science

8 нояб., 10:09

👁 1.6K

📊 Аналитика

vf_science

18 мар., 17:06

Кто сказал «мяу»? ИТ-компания «Криптонит» приглашает на дататон «Криптонит.Тембр», где нужно распознать, кто говорит! Тебе предстоит обучить Speaker Recognition модель, устойчивую к искажениям аудио, возникающим в реальных сценариях эксплуатации речевых интерфейсов и систем обработки звука: 🔹искажения, вносимые акустической средой; 🔹посторонние шумы; 🔹реверберация; 🔹большое расстояние до микрофона; 🔹искажения каналов связи. Участвуй и ты сможешь: 🟦получить шанс разделить призовой фонд в 60...

👁 1.6K📷 photo

📊 Аналитика

vf_science

2 авг., 21:25

Знаю все типы людей 😆 А кто вы?

👁 1.5K📷 photo

📊 Аналитика

vf_science

25 авг., 19:40

Наш русскоязычный датасет для TTS опубликован! Сегодня выкладываем открытые корпуса на 4000+ часов речи, а еще синтезатор речи ESpeech-TTS-1 Наш датасет содержит больше 4000 часов русской речи. Статистика по корпусам: Многоголосые: ESpeech-podcasts - 3200…

👁 1.5K

📊 Аналитика

Типы хуков

Нейтральный15 | 2.2K просм.

Статистика3 | 1.5K просм.

Вопрос1 | 1.6K просм.

Длина постов

Средние (200-500)11 | 2.1K просм.

Очень длинные (1000+)4 | 2.5K просм.

Длинные (500-1000)2 | 1.4K просм.

Короткие (<200)2 | 1.7K просм.

Влияние эмодзи

1.7K

С эмодзи (3)

2.1K

Без эмодзи (16)

-22.2% охвата

Типы контента

📝

text

2.4K просм.

📷

photo

1.5K просм.

🎬

video

1.0K просм.

⚠️ 0/100

Подозрительно высокий охват

#6228

из 17,947 в Музыка