289просмотров
52.1%от подписчиков
25 февраля 2026 г.
📷 ФотоScore: 318
Смотрите, сделал одному из клиентов интересную штуку. Задача простая —
чтобы его клиенты могли закидывать PDF-файлы,
а агент полностью читал их и работал с текстом.
И тут есть два варианта, как это вообще можно реализовать.
Вариант 1 — платные сервисы
Можно не париться.
Подключить Google Document AI, Amazon Textract и прочие сервисы.
Они всё делают красиво, стабильно, масштабируемо.
Но. Если смотреть по рынку, то:
• минимум — от 0.0015$ за страницу
• типичный диапазон — 0.01–0.07$ за страницу
• SaaS-пакеты — по факту выходит 0.05–0.30$ за страницу
И если считать в месяц, то спокойно набегает
10–50$ и выше, просто за то, чтобы читать PDF. Вариант 2 — сделать у себя
Мы пошли другим путём.
У клиента стоит свой сервер с N8N,
там же крутится агент.
Можно установить туда Tesseract (OCR),
прикреплять PDF напрямую
и обрабатывать всё локально.
По сути — бесплатно за страницу.
Потому что всё уже на одном сервере. И тут был интересный момент.
Мы столкнулись с тем, что из PDF читался только один лист.
А документ мог быть на 10–20–30 страниц.
Сегодня это исправил.
Теперь можно закидывать хоть сколько страниц —
весь текст полностью забирается
и передаётся агенту.
Вот это уже совсем другой уровень. Да, сама доработка была платной.
Но она того стоит.
Потому что если у клиента идёт поток PDF-документов,
то экономия в долгосроке — очевидная. Вопрос.
Как вы считаете, стоит ли внедрять такие вещи,
которые уменьшают постоянные расходы?
Даже если это «всего лишь» чтение PDF. Кстати сравнение:
сервер n8n+сервер по чтению PDF = 800р+1000 р (+-)
сервер n8n+Tesseract= 800р ну а дальше вы сами посчитаете выгоду в год?)