https://x.com/WonderingApp https://wondering.app/ Очень интересное приложение а-ля duolingo, но на все материалы. Автор из notebooklm, Cheng-Wei Hu. Вы можете как и выбрать рандомную тему, так и подгрузить свои материалы. Приложение выстраивает план, объясняет в картинках и карточках материал. Дает задания на понимание. Отдельно мне понравились анимации. Сейчас идет бета версия, код сегодня mastery.
grokaem себя
A bunch of things that I encounter during my journey as NLP/Audio developer
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
15 из 15Видела довольно много постов о Voicebox в линкедине. Я их пропускала, так как не понимала, почему поднялся хайп на старую модель meta. Оказывается, это сделали ui с запуском on-device qwen и whisper. Overview and download page GitHub page Что можно делать? • voice cloning • распознание текста • просто генерация речи без voice clone Сейчас поддерживается только qwen и whisper, обещают также и другие модели coming soon. Обе модели тяжелые и медленные. Обещают также real-time synthesis. Мой опыт: В...
Соединенные куски за последние дни. После последнего такого поста я также работала, а потом решила «а что будет если удалить зуб мудрости?». И что-то как-то выпала. Вообще сейчас период, в котором я чувствую сложность. Но она приятная, так как дает ощущение, что я развиваюсь. Снова начала а-ля челлендж без инстаграма. Последний раз я так продержалась около полугода. Это было приятно. Но наверное это про отдельный пост. Хочется вернуться с интересными обзорами статей и есть пару идей более обширн...
Текст из одного из постов тут
Я не знаю, кому это надо было в понедельник. Но вот soviet groove & love song фиты 🎹 https://www.youtube.com/watch?v=kdXYwFleqxs
https://huggingface.co/HumeAI/tada-1b Что-то очень интересное. 1:1 Token Alignment: Unlike standard models, TADA’s tokenizer encodes audio into a sequence of vectors that perfectly matches the number of text tokens. Будем читать 🙂
Может быть, надо вернуться в medium. Почему-то до сих пор туда подписываются люди. Я так и не нашла хорошую платформу для длинных публикаций. Это драфт 2022 года
Всех подписчиц этого канала с праздником! В этот день я ещё раз напоминаю себе о том, как мне повезло: • говорить, что хочу • учиться где и чему хочу • работать кем хочу • путешествовать куда хочу — одна и не одна • одеваться так, как я хочу • любить кого хочу • заниматься любым видом спорта • голосовать • и многое другое, что к счастью стало для меня нормой Я рада, что на моём пути было много прекрасных девушек, которые стали для меня примером. Буду стараться стать примером для таких же маленьк...
SIDON Demo page Относительно новая speech restoration модель от японской лабы SaruLab. Ребята обработали одни из самых популярных open-source датасетов: common voice, yodas, MLS.. Что заметила я? Модель справляется прекрасно с шумом, который связан с качеством записи: микрофоны, небольшое шипение, телефония. Но будет выдавать разного рода артефакты на примерах с более резкими шумами. Как например открытия пакетов на моей записи и изменение моего акцента.
Мне нравится работать утром. Кажется, утром время идет медленнее. Утром я писала диплом на бакалавриате. Утром я ботала все, что связано с физикой звука. Это всегда было с девизом «успеть до работы». Надо придумать, что хочу делать утром теперь. Может быть, все таки только работать? 😅