195просмотров
30.6%от подписчиков
20 марта 2026 г.
📷 ФотоScore: 215
RnD ML @ Sber-AI Хотим порекомендовать канал от коллег — t.me/rndml_team. Это блог команды RnD ML, который ведёт Саша Капитанов 📎 Вместо типичного потока ИИ-новостей они пишут про свою внутреннюю кухню: фундаментальные исследования, опенсорс-релизы, сборку датасетов и бенчмаркинг, обучение моделей в самых разных областях GenAI. А что особенно ценно — честно разбирают свои технические факапы. Если вы работаете с Computer Vision, Speech, NLP или мультимодальными моделями в GenAI, там точно есть за что зацепиться. Ребята работают с технологиями и делятся опытом с сообществом. 🔗 Основные R&D направления 🔮 Omnimodality: работа с омнимодальными архитектурами в домене изображений, длинных видео и смешения модальностей (вижен + спич)
🤖 Исследования в области VLA-моделей, навигации роботов и обучения агентов («компьютер оператор») в сложных средах.
🎙 Audio & Speech: нативный войс мод, а также музыкальные и речевые технологии, включая редактирование аудио.
🚀 LLM Architectures & Pre-training: поиск и тестирование альтернатив классическому трансформеру. Гибридные архитектуры, линеаризация Attention , внедрение векторов памяти и современные подходы к организации претрейна.
📩 Data & Evaluation: разработка пайплайнов для сбора, фильтрации и анализа датасетов. Построение процессов бенчмаркинга GenAI моделей (включая расширение мультимодальных тестов MERA) и валидации метрик.
🧏 РЖЯ: исследования в области жестового языка от распознавания дактиля до полноценных моделей реалтайм-переводчика.
🛠 3D/CAD: ресерч и генерация в нестандартных и специфических модальностях, выходящих за рамки текста и растра — векторная графика (CAD, SVG), 3D-представления объектов. Подписывайтесь: @rndml_team 👾