Какая LLM лучше для юридического RAG-бота? Провёл серию тестов — прогнал 10 разных моделей через бот с RAG-системой на одних и тех же вопросах. Когда запускал бота, я не особо думал о выборе модели — просто взял Gemini 3.0 Flash Preview по советам из чата. Модель быстрая, дешёвая, меня в целом устраивает. Но со временем возник вопрос — а так ли она хороша конкретно в моём проекте? И насколько велика разница между бюджетными моделями и «люксом» вроде Claude Sonnet 4.6, GPT-5.4, Gemini 3.1 Pro? Ус...
Draft AI | Иван Кундиль
Практикующий юрист. Пишу код с помощью нейросетей и создаю инструменты для юристов и бизнеса. В канале — процесс разработки, ошибки и реальные результаты. 🤖 AI-ассистент для расчета компенсации по IP спорам: @GetINNinfo_bot ✉️ Связь: @ivankundil
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
17 из 17Борщ, пентест и план апгрейда: итоги первых тестов чат-бота, который может за минуту оценить компенсацию за нарушение интеллектуальных прав Спасибо всем, кто принял участие в краш-тесте бота по интеллектуальной собственности. Отдельная благодарность Павлу Мищенко за его репост — это дало хороший приток пользователей и помогло выявить больше скрытых багов. Из забавного: в процессе пентестов одному из пользователей удалось обойти системный промпт и заставить бота выдать пошаговый рецепт борща. Пос...
Как я оставил бота без «мозгов» и эпично стер базу В предыдущем посте я писал, что перенёс бота на удалённый сервер. Звучало гладко. На деле всё оказалось не совсем так. Что произошло Код нормально подгрузился с GitHub, бот запустился и начал отвечать пользователям. Проблема была в одном - я забыл загрузить векторную базу. Бот работал «по старой памяти» (точнее, уверенно галлюцинировал), не имея доступа ни к одному из 858 загруженных судебных дел. При этом ответы выглядели крайне правдоподобно😄...
Коллеги, собрал RAG-бота в сфере IP и авторского права. Нужен ваш "краш-тест" и фидбек. Что он делает: Считает "вилку" компенсации за нарушение прав на РИД и подсказывает методику расчета. На чем работает: В базе сейчас 850+ актов СИП (свежая практика 2024–2026 гг.) + актуальная 4 часть ГК РФ. Зачем это нужно: Чтобы быстро оценить перспективу: стоит ли идти в суд, какую сумму реально взыскать и на какую практику ссылаться. Если вы со стороны ответчика — помогает понять, адекватны ли требования и...
От бота к агенту Честно, до недавнего времени я был уверен, что «ИИ-агент» — просто бот, которого переименовали, коммерческий ход, не более. Однако разница существенная — агент способен оценивать промежуточный результат и на основе этой оценки менять свой дальнейший ход. Добавил своему юридическому боту (в сфере IP) способность принимать решения на промежуточных этапах. Для этого внёс три изменения в архитектуру: ✔️ Анализ вопроса перед поиском (Intake-агент) Перед поиском отдельная LLM переводи...
Продолжаем пилить чат-бота. После того как я разобрался с теорией (схемы из прошлых постов), пришло время переходить к практике и нагружать бота объемом данных. Небольшой апдейт: ранее я писал, что буду делать бота по поставке. Но для тестов архитектуры решил «переобуться» на сферу интеллектуальной собственности. Она показалась мне более показательной для проверки точности поиска. На данный момент загрузил в RAG приличное количество судебной практики + 4 часть ГК РФ. На скриншоте видно точное ко...
➡️IP Agent на карте LegalTech и переезд на сервер Недавно наткнулся на карту российских LegalTech-проектов. Это ресурс, где собирают отечественные решения — позволяет мониторить, что вообще сейчас есть на рынке. Решил подать заявку со своим ботом (AI-ассистент для оценки компенсации за использование РИД). Заполнил небольшую форму, прошел модерацию, и теперь проект официально появился на карте. За поддержку и развитие этого ресурса отдельное спасибо Holger Zscheyge. ➡️ Что нового внутри самого бо...
Пояснения к Схеме №1 «Полный цикл загрузки в RAG» В разных источниках «ингестия» и «индексация» могут означать весь процесс загрузки данных в RAG, а иногда строго разделяются. В прикрепленной схеме они разделены: ингестия — подготовка и очистка текстов, индексация — нарезка, метаданные и перевод текста в векторы. Этап 1. Ингестия Начиная с блока 1.3 (Парсинг), всё происходит автоматически и, по сути, «невидно для глаза». Используются библиотеки, которые извлекают текст из файлов (PDF, Word и т.п...
Закончил вторую памятку на тему «какой путь проходит заданный вопрос в системе RAG?». К тексту прилагаю схему, которая помогает визуализировать этот процесс. Тема достаточно объёмная, больше информации о каждом процессе/механизме — в прикреплённой памятке ниже. Кратко про «путь» заданного вопроса: 🔹 Оптимизация запроса (необязательный этап). В «базовой комплектации» RAG этого блока нет — его нужно отдельно реализовывать через скрипт/код. Фактически это переформулировка запроса для более точного...