Qwen3-VL Наконец вышли завершающие размеры в серии Qwen3-VL — 4B и 8B. В двух форматах: instruct и thinking И в двух точностях: bf16 и fp8 До этого вышли MoE версии: 235B-A22B, 30B-A3B Qwen-VL это моя любимая модель ♥️, мне понравилось с ней работать в…
Нейронный Кот
by @fursov https://www.linkedin.com/in/fursovia
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
18 из 18Qwen3-VL Наконец вышли завершающие размеры в серии Qwen3-VL — 4B и 8B. В двух форматах: instruct и thinking И в двух точностях: bf16 и fp8 До этого вышли MoE версии: 235B-A22B, 30B-A3B Qwen-VL это моя любимая модель ♥️, мне понравилось с ней работать в поколении Qwen2.5-VL. На моей задачи многоклассовой классификации удалось выбить ~0.95 F1 Я пробовал gemma-3(n), SmolVLM(2), Phi-4, Phi-3.5 — все они так себе. Только Kimi-VL хорошо работала, но была существенно тяжелее. В планах попробовать Qwen3...
Куда еще проще? 💃 Деплой FastAPI приложений одной командой — fastapi deploy https://fastapicloud.com/
Репозиторий RM моделей Код для обучения + блог посты Реализации всех основных RM — Bradley-Terry (pointwise моделька), Pairwise RM, RRM, Odin RM (борются с байесом длинных ответов) и другие https://github.com/RLHFlow/RLHF-Reward-Modeling
Claude до сих пор не поддерживает structured output? В 2025 это must have Да, claude сможет работать с простыми JSON схемами на выходе. НО если у меня вложенная структура? Десятки разных enum типов? Ограничение на длину списков и тд? Показывать пример JSON-а в промпте? — this is so 2023 К счастью, хотя бы tool use у них со строгой схемой. Еще и API-шка супер дорогая, еще и кредиты (покупные!) сгорают за год. Они у меня так сожгли пару десятков долларов 😱 Кто как Claude использует? 4.5 sonnet в ...
DeepSeek-V3.2-Exp Вышел новый дипсик! 🔹построен на основе V3.1-Terminus (неделю+ вышла моделька) 🔹DeepSeek Sparse Attention (DSA) для ускорения инференса при длинных контекстах 🔹по API цена ниже на 50% 🔗 ссылка на модель
Be blocked on Telegram forever 😱 Меня тут @BotFather забанил — теперь не могу ботов создавать Забанил за новоиспеченного бота (я указал описание и аватарку загрузил). Этим ботом никто не пользовался даже (кроме меня) Это классификатор ошибся? Кто-то сталкивался?
Ловушка Грока 🤡 В разных независимых бенчмарках (1, 2, etc) оказывается, что Grok 4 достаточно хорош. Почему? Мне кажется интересной идея, что когда ты являешься AI компанией, которая пытается догнать другую AI компанию (e.g. OpenAI), то ты можешь позволить себе катить очень большие модели на прод, ведь у тебя намного меньше юзеров => тебе можно иметь меньше GPU Очевидно, что при прочих равных модель с бОльшим количеством параметров лучше той, у которой меньше параметров (только если она не пер...
tldr; ищу Computer Vision Engineer (Freelance) к себе -- Привет! Я знаю, что в этом канале апдейты появляются не часто (и я не обещаю это исправить 😅). Но я безумно рада и благодарна что вы еще здесь. ✨ С 2024 года я работаю над проектом MyArchitectAI в качестве CTO и ко-фаундера. Наша цель это заменить physical based rendering на более простой и быстрый ai рендер. У нас уже есть юзеры, которые используют нас вместо Vray! 🤩 Мы хотим быть one stop shop для архитектурной визуализации, что включа...
Попался, Atlas Chrome! Залогинился в твиттер через новый браузер от OpenAI — Atlas. И мне твиттер вот такой имейл прислал 😰