665просмотров
21 ноября 2025 г.
Score: 732
Backend-разработчик (Node.js) Локация: Удаленно
Компания: Scrapeit.io
ЗП: обсуждается на собеседовании
Занятость: Полная Scrapeit.io ищет Backend-разработчика (Node.js) 2+- лет коммерческого опыта.
Если вы любите копаться в низкоуровневых деталях HTTP, писать устойчивые сервисы и вас не пугают антибот-защита, капчи и highload-скрейпинг - вам к нам 🙂 🚀 О КОМПАНИИ:
Scrapeit.io - продуктовая/сервисная компания, которая занимается веб-скрейпингом и обработкой данных для бизнеса.
Мы делаем кастомные решения по сбору, очистке и доставке данных с сайтов и мобильных приложений для клиентов по всему миру:
• крупные и высоконагруженные сайты
• сложная антибот-защита
• динамические SPA, мобильные приложения, API и нестандартные источники Данные доставляем в формате CSV/JSON/XML в хранилища клиентов (FTP, S3, GCS и др.). 🛠 РОЛЬ / ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ:
• Разрабатывать и поддерживать backend-сервисы для web scraping / data processing (Node.js, JS/TS)
• Проектировать и реализовывать скрейперы и пайплайны обработки данных (очистка, нормализация, валидация, агрегация)
• Интегрироваться с внешними API, прокси-провайдерами и брокерами сообщений
• Работать с PostgreSQL и MongoDB: моделирование схем, оптимизация запросов, индексы, миграции
• Использовать Redis для кэшей и вспомогательных сценариев
• Контейнеризировать сервисы в Docker, участвовать в базовой оркестрации и деплое
• Поддерживать и настраивать Linux-сервера (логирование, мониторинг, деплой, troubleshooting)
• Использовать инструменты мониторинга и алертинга (Grafana, Prometheus/аналоги)
• Работать с брокерами сообщений (BullMQ и т.п.) для построения асинхронных пайплайнов
• Повышать устойчивость скрейперов: HTTP, ретраи, прокси, блокировки, капчи, антибот-механизмы
• Участвовать в обсуждении архитектуры, ревью кода и улучшении внутренних стандартов и tooling ✅ ОБЯЗАТЕЛЬНЫЕ ТРЕБОВАНИЯ:
Опыт и стек:
• 2+ лет опыта как backend-разработчик
• Знание Node.js (v16+), JavaScript / TypeScript
• Глубокое понимание HTTP: методы, статусы, headers, cookies, redirects, CORS, rate limits и т.д.
• Опыт работы с PostgreSQL и/или MongoDB: сложные запросы, индексы, профилирование
• Опыт работы с Redis (кэширование, очереди или похожие сценарии)
• Практический опыт с Docker (docker-compose, сборка и оптимизация образов)
• Базовые навыки Linux-администрирования:
– работа в консоли
– systemd, логи, ssh
– от HTTP-запроса до записи в БД
– устойчивость и наблюдаемость сервисов
• Опыт работы с Git (branch-стратегии, code review, pull requests)
• Опыт работы с инструментами мониторинга/логирования, желательно Grafana.
• Умение читать и писать техническую документацию
• Английский язык: A2+ (выше будет плюсом) 🎯 БУДЕТ БОЛЬШИМ ПЛЮСОМ:
Опыт именно в сфере web scraping / data extraction:
• Headless-браузеры и скрейпинг:
– Puppeteer
– CLI-браузеры
• Работа с Cheerio или аналогами для парсинга HTML
• Понимание и практический опыт обхода:
– капч (reCAPTCHA, hCaptcha, Cloudflare Turnstile и др.)
– антибот-систем (Cloudflare, Akamai, Datadome и т.п.)
– fingerprinting, прокси-инфраструктура, rotation, residential / mobile proxies
• Опыт работы с Python (скрипты, утилиты, простые парсеры)
• Опыт интеграций с LLM/AI:
– OpenAI, Anthropic и др. провайдеры
– использование LLM для парсинга, нормализации, категоризации данных и любых других задач 💼 УСЛОВИЯ:
• Полностью удалённый формат работы
• Гибкий график (важно пересечение по времени с командой)
• Работа с реальными боевыми проектами: сложный скрейпинг, антибот-защита, масштаб
• Влияние на архитектуру и технические решения, возможность предлагать свои подходы и инструменты
Тип договора:
• B2B - для специалистов вне Польши
• Umowa o pracę / Umowa zlecenie - для специалистов из Польши
Уровень компенсации обсуждается на собеседовании и зависит от опыта, зоны ответственности и формата сотрудничества. 📩 Резюме отправлять: info@scrapeit.io
• CV / GitHub / GitLab
• Краткое описание релевантного опыта:
– Node.js / JS / TS
– scraping / браузеры / антибот
• (Опционально)