1.0Kпросмотров
23.5%от подписчиков
19 марта 2026 г.
stats📷 ФотоScore: 1.1K
За 2 дня навайбкодил бота, который превращает мок-собесы в текст и саммари 🤖 Собрал себе Telegram-бота, который:
— принимает YouTube ссылки, mp4, аудио, голосовые
— делает транскрибацию
— если несколько спикеров, то разбивает на диалоги
— чистит текст, делает саммари По сути просто способ быстро превращать любой видео/аудио контент в текст, с которым уже можно работать, делать поиск, анализ 📌 Реальный кейс
1 часовой мок-собес → обрабатывается за 5–10 минут Репа с кодом: https://github.com/topsycreed/Playground/tree/master/telegram_mp3_transcriber 👈 Что под капотом:
— Python, Whisper, NVIDIA NeMo
— Telegram Bot API в Docker
— Google Gemini 3.1
— LM Studio с GPT-OSS 20B
— плюс всякие утилиты для видео/аудио и скачивания с YouTube Почти всё получилось бесплатно, то есть даром. Из платного у меня только сам вайбкодинг (у меня подписка ChatGPT ~$20) Инсайды по инструментам 🤔 Пробовал: Warp, Cursor, Codex, VS Code + Copilot, IDEA с Codex В итоге больше всего зашла сама IDE Codex так как у нее самый дружелюбный интерфейс и она не подвисает как IDEA И немного реальности про локальные модели 🐱 У меня 64GB RAM и NVIDIA 5070
Я честно думал, что сейчас буду всё гонять локально и не зависеть от облаков Но через LM Studio всё работает довольно… грустно. Медленно, нестабильно, качество так себе... В какой-то момент просто сдался и переключился на Google AI Studio (free tier), где использую Gemini 3.1 Flash Lite.
И он за минуты делает то, с чем локалка не справляется вообще или делает с 5 попытки за час. А у вас получилось уже что-то навайбкодить полезного? Делитесь в комментариях 👇