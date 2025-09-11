Новая версия IDP-платформы ContentCapture упрощает настройку промптов и поддерживает локальные LLM

Компания Content AI, российский разработчик решений для автоматизации обработки документов, представила обновление IDP-платформы ContentCapture, расширив ее возможности в работе с большими языковыми моделями (LLM). Новая версия включает современный low-code-конструктор промптов и поддерживает локальные LLM. Это выводит автоматизацию обработки неструктурированных документов с помощью ИИ на новый уровень. Об этом CNews сообщили представители Content AI.

Ключевое нововведение платформы – автоматическое формирование промптов. Пользователям больше не нужно писать сложные промпты для LLM с нуля. Достаточно указать, какие данные необходимо извлечь, задать желаемый формат результата и добавить несколько примеров через удобный интерфейс. ContentCapture мгновенно генерирует готовый технический промпт для работы с языковой моделью.

Упрощение процесса настройки позволяет значительно ускорить автоматизацию обработки слабоструктурированных документов. Кроме того, благодаря такому инструменту платформа становится доступной даже для пользователей без технической подготовки. Например, бизнес-аналитики смогут самостоятельно настраивать извлечение данных из договоров, судебных решений, патентов, страховых исков и технической документации.

Еще одно важное обновление ContentCapture – поддержка локальных LLM. Платформа получила открытую архитектуру для интеграции с любыми языковыми моделями, развернутыми локально в инфраструктуре заказчика. Механизм реализован через фреймворк Ollama, что открывает доступ к сотням открытых моделей, включая Llama 2, Mistral, Gemma и другие.

Поддержка локальных LLM имеет большое значение при обработке конфиденциальных корпоративных документов – отчетов, документов, содержащих персональные данные или коммерческую тайну. Это критически важно для финансовых и государственных организаций, медицинских учреждений и других компаний, работающих с чувствительной информацией.

Для предотвращения ошибок и галлюцинаций LLM в платформу добавлен механизм контроля. ContentCapture теперь подсвечивает точный фрагмент текста в документе, который стал основой для извлечения данных. Это позволяет оператору верификации мгновенно проверить корректность работы модели, исключив риски переноса ошибочной информации в учетные системы.

«Раньше для полноценного использования LLM требовалась либо готовность рисковать конфиденциальными данными, отправляя их в облако, либо глубокие технические знания для самостоятельного запуска и управления моделями локально. Помимо этого, необходимо было уметь правильно формировать промпты, так как игнорирование технических нюансов приводило к низкому или нестабильному качеству извлечения данных. ContentCapture снимает все эти барьеры, — сказал технический директор Content AI Иван Волков. – Наша система – это не просто low-code, а настоящий no-code подход к ИИ. Отсутствие необходимости вручную составлять промпты обеспечивает беспрецедентную скорость и простоту внедрения. А встроенная поддержка приватных локальных LLM на основе Ollama гарантирует полный контроль и максимальную безопасность в работе с документами».

«C новыми обновлениями ContentCapture мы даем нашим заказчикам инструмент, который обеспечивает конкурентное преимущество для их бизнеса: упрощение процессов и рост скорости обработки сложных документов. Банки смогут автоматически анализировать кредитные досье, юристы – выявлять риски в договорах, а производственные компании – обрабатывать инженерную документацию. Это новый этап в развитии гиперавтоматизации в России», – сказала генеральный директор Content AI Светлана Дергачева.

ContentCapture – универсальная IDP-платформа для автоматизации обработки любых типов документов: сканов, изображений, PDF-файлов. Решение классифицирует документы, извлекает и верифицирует данные, направляет их в корпоративные системы. Платформа распознает рукописный текст и эффективно работает как со структурированными документами (счета, акты, УПД, товарные накладные), так и со слабо- и неструктурированными (договоры, резюме, протоколы).

ContentCapture включена в реестр отечественного ПО, имеет официальную ИИ-маркировку и предназначена для замещения иностранных продуктов ABBYY FlexiCapture, Kofax Capture, IBM Datacap.