217просмотров
84.1%от подписчиков
10 декабря 2025 г.
Score: 239
AI-инженер Локация: Удалённо в РФ
Компания: Green Wave Palace ltd ЗП: обсуждается на собеседовании
Занятость: Частичная Оформление:Самозанятость / ИП / ТК РФ ‼️Можно совмещать с основной работой ‼️ Чем предстоит заниматься:
• Проектировать и внедрять продукционные LLM-сервисы: от ingestion и индексирования данных до генерации ответов и обратной связи пользователей.
• Строить RAG-пайплайны: гибридный поиск (векторный + BM25), сжатие контекста, переранжирование (cross-encoder/learning-to-rank), фильтрация по метаданным.
• Оркестрировать агентные сценарии (LangChain / LangGraph): планирование шагов, вызов инструментов, обработка ошибок и фолбэков.
• MCP (Model Context Protocol): умение поднимать/подключать MCP-серверы и публиковать tools/resources/prompts для хоста (например, Claude/ChatGPT/IDE), понимание безопасности и аутентификации MCP. • Выполнять оценку качества: автоматические и человек-в-контуре (groundedness, factuality, relevance, hallucination rate).
• Разрабатывать и поддерживать REST/HTTP API (FastAPI, async/await), сервисные интеграции и очереди фоновой обработки.
• Обеспечивать надежность и безопасность: контроль PII, guardrails, валидация и санитизация входных данных.
Обязательные требования
• Python 3.x: асинхронщина (asyncio/httpx), типизация, Pydantic, FastAPI, SQLAlchemy; уверенный практический опыт продакшн-бэкенда.
• Опыт построения RAG: выбор эмбеддингов (OpenAI, e5, BGE и др.), стратегия чанкинга/оверлапа, индексация и обновление индексов, векторные БД (FAISS, Pinecone, Weaviate), гибридный поиск и переранжирование.
• LangChain/LangGraph или любой другой агентский фреймворк; умение собирать цепочки/графы, подключать инструменты, внешние API и хранилища.
• Работа с несколькими LLM-провайдерами (OpenAI, Anthropic, Mistral, Gemini, др.), маршрутизация моделей и фолбэки; базовая настройка токен-параметров и системных промптов.
• Практика оценки и наблюдаемости: метрики качества, латентности и стоимости; умение построить простую eval-линию. Желательно (будет плюсом):
• LLMOps/Observability: Langfuse/Arize Phoenix, Promptfoo/Ragas, cost & latency dashboards, трейсинг цепочек. • Поиск: Elasticsearch/OpenSearch, гибридный (BM25 + dense), внешние reranker-модели (например, cross-encoder/Cohere ReRank). • Облака и инфраструктура: AWS/GCP/Azure (в т.ч. Azure OpenAI/Bedrock/Vertex), Docker/K8s, очереди (Celery/Kafka), Redis. Jobgether
• Мультимодальность (VLM), OCR, извлечение структурированных фактов из документов. 💬 Резюме отправлять: @irinaalekseevnashi –––
Бесплатный постинг вакансий: @freeIT_job