7просмотров
4 февраля 2026 г.
📷 ФотоScore: 8
Ollama GLM-OCR: Китайский распознавалка документов у нас дома Ollama выкатили поддержку GLM-OCR. Визуальный эксперт на 9 млрд параметров от Zhipu AI выносит GPT-4o и Claude 3 Opus в тестах распознавание текста. 📄 Сложная верстка больше не проблема: Обычные OCR сыплются на таблицах, формулах и мелких подписях. GLM-OCR работает в разрешении 1120x1120 и видит структуру документа целиком. Он считывает иерархию данных и понимает разницу, например, между заголовком и данными в ячейке. ⚙️ Техника: Модель весит ~6 ГБ — средняя видеокарта (8ГБ VRAM) или Apple Silicon проглотят её спокойно.
Поддерживает многошаговый диалог. Можно скормить скан и сразу попросить: «собери JSON из этой таблицы» или «выпиши итоговые суммы». 🚀 Интеграция в один клик: ollama run glm-ocr Зачем это бизнесу: Полная автоматизация бухгалтерии и архивов без трат на API. Косты на обработку падают до цены электричества. Это идеальный входной шлюз для локальных RAG-систем, работающих со сканами. Наконец-то мощная распознавалка малого размера. Для внутренних задач по разбору документов,- идеально! #Ollama #OCR #GLM #ZhipuAI
------
@tsingular