Рутинный сбор данных из судебных решений, договоров или входящей корреспонденции отнимает у юристов часы, которые можно посвятить аналитике или работе с клиентами.
Современные технологии позволяют автоматизировать этот процесс, не требуя навыков программирования. В этой статье покажем, как на платформе Botman.one создать собственный сервис для извлечения структурированных данных из документов с помощью нейросети GigaChat.
Почему Гигачат?
Потому, что не всем доступны зарубежные нейросети, многие из которых не работают в РФ без специального софта, позволяющего обходить блок.
Также чтобы подключиться к API многих хороших зарубежных нейросетей, нужно оплачивать доступ картами иностранных банков, что тоже доступно далеко не всем.
В то же время, Гигачат отлично решает задачу извлечения данных из документов, причем, не только из pdf, но и из документов MS Word и даже из сканированных документов.
Проблема:
Юристы ежедневно сталкиваются с необходимостью выписывать из документов однотипные данные: ИНН, названия компаний, номера судебных дел, адреса, суммы и даты. Это медленно, утомительно и чревато ошибками.
Решение:
Использование связки no-code платформы Botman.one и нейросети GigaChat.
Вы создаёте сценарий, который:
-
Принимает документ (PDF, Word, изображение).
-
Отправляет его в GigaChat для анализа.
-
Получает обратно четко структурированные данные в виде строк или JSON.
Эти данные потом можно автоматически подставить в шаблоны документов с помощью встроенного в Botman.one конструктора документов, отправить в любые системы документооборота или CRM-системы, записать в таблицы и т.д. Таким образом, вы сможете автматически обрабатывать полученные с помощью парсинга данные в любых автоматизированых системах.
Шаг 1: Настройка интеграции с GigaChat
Перед созданием бота необходимо подключить API GigaChat.
Важно: Для корректной работы нужно правильно настроить запрос к нейросети, чтобы она возвращала данные в нужном формате.
🔗 Подробный гайд по настройке API GigaChat можно найти здесь.
Шаг 2: Создание бота-парсера на Botman.one
-
Создайте новый алгоритм бота.
-
Добавьте Доп. инфо типа "файл" - блок загрузки файла - пользователи будут загружать документы через интерфейс бота или API.
-
Настройте вызов GigaChat через блок "Действие":
-
Укажите промпт (инструкцию) для нейросети, например:
«Извлеки из документа следующие данные: ИНН, название организации, номер судебного дела, дату, адрес. Верни ответ в формате JSON.» -
Настройте передачу загруженного документа в блок "Действие".
-
-
Настройте подстановку данных из блока "Действие" в любые шаблоны документов на платформе Botman.one.
-
Протестируйте бота на разных типах шаблонв документов.
Для лучшего понимания того, как все это реализовать на платформе, смотрите вот это видео: ссылка
Пример использования:
Задача: Автоматически извлекать данные из решений арбитражных судов.
Решение:
-
Бот принимает PDF-файл решения.
-
GigaChat находит и возвращает:
json
{ "case_number": "А40-123456/2023", "company_name": "ООО 'ЮГ'", "inn": "7712345678", "address": "г. Москва, ул. Примерная, д. 1", "date": "2023-10-26" } -
Botman.one сохраняет эти данные в Google Таблицу или отправляет в вашу систему через API.
Почему это удобно?
✅ Не нужно программировать - весь процесс строится визуальными блоками.
✅ Гибкость - можно настроить парсер под любой тип документов.
✅ Интеграции - готовые связи с Telegram, WhatsApp, Excel, базами данных и др.
✅ Скорость - от загрузки документа до готовых данных проходит менее минуты.
No-code платформа Botman.one стирает границы между юриспруденцией и технологиями.
Теперь любой юрист может самостоятельно создать инструмент для автоматизации рутинных задач, повысив свою эффективность в разы.
Готовы автоматизировать работу с документами?
Начните с гайда по настройке GigaChat и этого видео и создайте своего первого бота-парсера на Botman.one.