327просмотров
29 сентября 2025 г.
📷 ФотоScore: 360
ПравоТех форум запомнится масштабными дискуссиями и мастер-классами по практическому использованию облачных ИИ-приложений. Поделюсь общими наблюдениями. Юридические функции некрупных корпораций активнее всего используют разные облачные ИИ-сервисы (Кстати perplexity называли одной из самых адаптированных под юр задачи). Это та категория счастливчиков, у которых нет департамента информационной безопасности и каких-либо запретов на использование иностранного облачного софта. Даже слышал, что некоторые продолжают использовать Google Docs и Google Sheets (серьёзно, вы ещё пользуетесь ими?). Порадуемся за них, но не от всего сердца, потому что не стоит забывать о тренде (о котором мало говорят на таких форумах, но много — на форумах по информационной безопасности) на постепенную “чебурнизацию” отечественного интернета. Замедленные звонки в WhatsApp и Telegram — лишь бета-версия чебурнета. А вот когда все VPN погаснут и у нас с вами перестанут работать облачные иностранные ИИ-сервисы — вот тогда считайте, что вышла альфа-версия. И что мы будем делать? Ответ стоит искать у первопроходцев внедрения ИИ в защищённом контуре. Этим занимаются как раз крупные корпорации, у которых есть грозное ИБ и строгие требования к информационной безопасности. Внедрение ИИ на своих серверах - это относительно дорогая “игрушка” (одна только видеокарта стоит от 4 млн ₽, а радоваться функционалу начнёте, когда их будет хотя бы 4–5 штук; плюс поддержка инфраструктуры — и да, видеокарты иногда выходят из строя, их приходится менять) и внедряют её в первую очередь под основные задачи бизнеса (потому что ваш ДИТ может даже не знать, что вам нужен ИИ для оптимизации юридических функций). Если у вас серверов “как у дурака фантиков”, уже локально развернута LLM-модель (спросите руководителя ДИТ) и сформулирован запрос по автоматизации процесса, начинайте подключать вашу ИТ-команду. Но, “вангую”, мучения ИТ вашими "юридическими вопросами" долго не продлятся: вам как заказчику зададут один очень важный вопрос — «а датасеты есть?» — и ИТ уйдут в закат, не ожидая ответа. Датасет, простым языком, — это таблица, в которой вы классифицировали свои данные. Возьмём для примера обычную задачу по классификации запросов в юридический департамент (ЮД). Вы хотите, чтобы клиент писал запрос “своим языком” (а не выбирал кучу опций на корпоративном портале), а LLM сама помечала запрос на выдачу доверенности как тип «запрос на выдачу доверенности», а запрос на согласование условий договора — как тип «запрос на согласование договора». Далее система автоматизации, в зависимости от типа, распределяла бы обращения по командам юридического департамента. В общем-то, функционал на первый взгляд простой. Но без таблицы с примерами (датасета), что является «запросом на выдачу доверенности», а что — «запросом на согласование условий договора», вы получите низкое качество классификации. И чем больше у вас “классов”, тем выше должно быть качество данных. Речь не о 100–200 примерах, а желательно — о тысячах. И это ещё не всё: датасеты нужно постоянно поддерживать и актуализировать. То есть быть готовыми к непрерывному “коллекционированию” данных. А это, дорогие мои, уже про культуру data-driven management — управления на основе данных, — которая ещё не сформировалась в полной мере в юридических функциях. Об этом поговорим в следующем посте.