Как юристу создать парсер документов с нейросетью GigaChat за 15 минут без программирования

Рутинный сбор данных из судебных решений, договоров или входящей корреспонденции отнимает у юристов часы, которые можно посвятить аналитике или работе с клиентами. 

Современные технологии позволяют автоматизировать этот процесс, не требуя навыков программирования. В этой статье покажем, как на платформе Botman.one создать собственный сервис для извлечения структурированных данных из документов с помощью нейросети GigaChat.

Почему Гигачат?

Потому, что не всем доступны зарубежные нейросети, многие из которых не работают в РФ без специального софта, позволяющего обходить блок.

Также чтобы подключиться к API многих хороших зарубежных нейросетей, нужно оплачивать доступ картами иностранных банков, что тоже доступно далеко не всем.

В то же время, Гигачат отлично решает задачу извлечения данных из документов, причем, не только из pdf, но и из документов MS Word и даже из сканированных документов. 


Проблема:
Юристы ежедневно сталкиваются с необходимостью выписывать из документов однотипные данные: ИНН, названия компаний, номера судебных дел, адреса, суммы и даты. Это медленно, утомительно и чревато ошибками.

Решение:
Использование связки no-code платформы Botman.one и нейросети GigaChat.

Вы создаёте сценарий, который:

  1. Принимает документ (PDF, Word, изображение).

  2. Отправляет его в GigaChat для анализа.

  3. Получает обратно четко структурированные данные в виде строк или JSON.

Эти данные потом можно автоматически подставить в шаблоны документов с помощью встроенного в Botman.one конструктора документов, отправить в любые системы документооборота или  CRM-системы, записать в таблицы и т.д. Таким образом, вы сможете автматически обрабатывать полученные с помощью парсинга данные в любых автоматизированых системах.

 


Шаг 1: Настройка интеграции с GigaChat
Перед созданием бота необходимо подключить API GigaChat.
Важно: Для корректной работы нужно правильно настроить запрос к нейросети, чтобы она возвращала данные в нужном формате.
🔗 Подробный гайд по настройке API GigaChat можно найти здесь.


Шаг 2: Создание бота-парсера на Botman.one

  1. Создайте новый алгоритм бота.

  2. Добавьте Доп. инфо типа "файл" - блок загрузки файла - пользователи будут загружать документы через интерфейс бота или API.

  3. Настройте вызов GigaChat через блок "Действие":

    • Укажите промпт (инструкцию) для нейросети, например:
      «Извлеки из документа следующие данные: ИНН, название организации, номер судебного дела, дату, адрес. Верни ответ в формате JSON.»

    • Настройте передачу загруженного документа в блок "Действие".

  4. Настройте подстановку данных из блока "Действие" в любые шаблоны документов на платформе Botman.one.

  5. Протестируйте бота на разных типах шаблонв документов.

Для лучшего понимания того, как все это реализовать на платформе, смотрите вот это видео: ссылка


Пример использования:
Задача: Автоматически извлекать данные из решений арбитражных судов.
Решение:

  • Бот принимает PDF-файл решения.

  • GigaChat находит и возвращает:

    json

    {
      "case_number": "А40-123456/2023",
      "company_name": "ООО 'ЮГ'",
      "inn": "7712345678",
      "address": "г. Москва, ул. Примерная, д. 1",
      "date": "2023-10-26"
    }
  • Botman.one сохраняет эти данные в Google Таблицу или отправляет в вашу систему через API.


Почему это удобно?
✅ Не нужно программировать - весь процесс строится визуальными блоками.
✅ Гибкость - можно настроить парсер под любой тип документов.
✅ Интеграции - готовые связи с Telegram, WhatsApp, Excel, базами данных и др.
✅ Скорость - от загрузки документа до готовых данных проходит менее минуты.


No-code платформа Botman.one стирает границы между юриспруденцией и технологиями.

Теперь любой юрист может самостоятельно создать инструмент для автоматизации рутинных задач, повысив свою эффективность в разы.

Готовы автоматизировать работу с документами?
Начните с гайда по настройке GigaChat и этого видео и создайте своего первого бота-парсера на Botman.one.