2.2Kпросмотров
48.3%от подписчиков
10 февраля 2026 г.
stats📷 ФотоScore: 2.5K
👩⚕️💊 Baichuan-M3: открытая медицинская модель ведет диалог как настоящий врач, обходя GPT-5.2-High и людей в точности диагностики Baichuan-M3 ведет себя как опытный терапевт — методично выясняет детали: когда именно началась боль, какого она характера, есть ли сопутствующие симптомы, какие лекарства принимались, были ли подобные эпизоды раньше. Только собрав достаточно клинической информации, поставит диагноз и пропишет лечение. Baichuan-M3 — первая модель такого класса, которую можно скачать, развернуть и независимо проверить. Модель использует многоэтапное рассуждение, связывая разрозненные симптомы в логичную диагностическую картину точно так же, как это делают врачи. На вход принимается только текст. Baichuan-M3 обучалась по трёхэтапной схеме:
— Task-Specific RL создаёт отдельных «экспертов» по опросу, консультациям и клиническому рассуждению;
— Offline Policy Distillation объединяет экспертов без катастрофического забывания;
— Multi-Teacher Online Distillation донастраивает модель в реалистичных клинических сценариях. Для обучения диалогу разработан алгоритм SPAR, который оценивает каждую реплику отдельно, а не консультацию целиком. Это позволяет устранять логические ошибки, повторы и некорректные медицинские формулировки точечно. Благодаря методу Fact-Aware Reinforcement Learning ошибки в диагнозах и лечении штрафуются сильнее, чем неточности в общих рекомендациях, что резко снижает риск опасных галлюцинаций. На тестах Baichuan-M3 показывает результаты выше GPT-5-High и людей-врачей. На ScanBench (клинический опрос) 74.9 против 62.5 у GPT-5.2-High и 54.6 у людей. На HealthBench-Hard: 44.4 против 42.0 у GPT-5.2-High. Галлюцинации в ответах - 3.5%, что лучше всех конкурентов. Модель 235B, W4-квантованная версия и веса доступны на Hugging Face и GitHub под лицензией Apache 2.0. #Benchmark #Stateoftheart