Программное обеспечение для интеллектуальной автоматической обработки документов
«Радар ИИ» — программное обеспечение для автоматической классификации документов, разделения многостраничных пакетов на отдельные документы и извлечения структурированных данных с использованием технологий искусственного интеллекта.
Система работает полностью локально на серверном оборудовании организации, без передачи данных во внешние сервисы. Поддерживается работа в изолированных сетях без доступа к Интернету.
Автоматическое определение типа каждого документа в загруженном PDF-файле. Список типов расширяется без изменения кода.
Определение границ каждого документа в многостраничном пакете. Возврат массива сегментов с указанием диапазона страниц.
Автоматическое извлечение структурированных данных из каждого документа. Набор полей настраивается для каждого типа.
Готовый веб-интерфейс для работы и REST API для интеграции с внешними информационными системами.
Встроенный модуль бенчмарка для сравнения результатов AI с эталонной разметкой и контроля точности.
Локальное развёртывание, аутентификация по токену. Данные не покидают инфраструктуру.
Обработка документа выполняется в два автоматических прохода:
Проход 1 — Классификация: страницы PDF конвертируются в изображения, текст извлекается с помощью OCR и передаётся AI-модели как подсказка. Модель определяет тип каждой страницы и группирует их в сегменты.
Проход 2 — Извлечение полей (NER): для каждого идентифицированного сегмента AI-модель извлекает структурированные данные согласно настроенной схеме полей для данного типа документа.
Система обеспечивает высокую точность обработки документов.
Система построена на современных открытых технологиях.
| Компонент | Технология |
|---|---|
| Язык программирования | Python 3.11 |
| Веб-фреймворк | FastAPI + Uvicorn |
| AI-модель | Большая мультимодальная языковая модель (Vision LLM), архитектура Mixture of Experts, квантизация AWQ INT4 |
| LLM-сервер | vLLM (высокопроизводительный инференс) |
| Обработка PDF | pdf2image + poppler-utils |
| OCR | Tesseract (русский + английский) |
| База данных | SQLite (асинхронный режим, WAL) |
| Контейнеризация | Docker + Docker Compose |
| Операционная система | Linux (RED OS 8, RHEL 8, Ubuntu 22.04+) |
Система развёртывается на серверном оборудовании организации.
Программное обеспечение распространяется по модели on-premises — развёртывание на серверном оборудовании организации-заказчика. Лицензия предоставляется по коммерческому лицензионному договору в соответствии с Гражданским кодексом Российской Федерации.
Правообладатель программного обеспечения «Радар ИИ»