Услуги оцифровки форм и бланков: распознавание и извлечение данных
Многоканальный ввод форм и бланков
Первый этап процесса — это ввод документов, т. е. получение исходных данных для обработки. Эту операцию можно выполнить несколькими способами. Мы предлагаем гибкие варианты на ваш выбор. Вы выбираете тот вариант, который подходит именно вам:
- Вывоз на нашу производственную площадку: Мы готовы забирать бумажные оригиналы из вашего офиса или предприятия с согласованной периодичностью (например, еженедельно или ежемесячно), сканировать и обрабатывать их в нашем центре
- Абонентский ящик: Вы можете воспользоваться выделенным абонентским ящиком, на который ваши поставщики или клиенты смогут направлять документы (например, счета на оплату); мы будем их забирать, сканировать и обрабатывать
- Обработка на месте: Вы можете сканировать документацию на месте, используя собственные многофункциональные принтеры или сканеры; отсканированные изображения будут автоматически поступать в нашу систему для обработки
- Электронная почта: Вы можете отправлять документы на выделенный электронный адрес iGuana; они будут автоматически импортированы в нашу систему для обработки
Оцифровка форм и бланков
Если вы примете решение сканировать и оцифровывать документы самостоятельно или отправлять их нам по электронной почте, мы будем обрабатывать их в оперативный срок, используя высокотехнологичные алгоритмы распознавания и извлечения данных. Если вы желаете, чтобы сканирование выполнили наши специалисты, нам необходимо сначала забрать бумажные оригиналы непосредственно в месте вашего нахождения или через абонентский ящик. Мы применяем только самые качественные и эффективные сканеры для документов, доступные на рынке. Современные многофункциональные сканеры промышленного уровня позволяют получить отличные цифровые изображения. Также мы используем собственную технологию контроля, оптимизации и автоматизации всех операций сканирования под названием ScanFactory Resource Planning (SRP). Ее основная цель — сократить вмешательство человека до абсолютного минимума и устранить риск ошибок, обусловленных «человеческим фактором». Все этапы сканирования, включая контроль качества, распределение персонала и применение высокопроизводительных сканеров для обработки документов, находятся под полным контролем SRP.
Классификация форм и бланков
Платформа SRP автоматически классифицирует входящий поток документов. Она идентифицирует контент любого типа (в частности, контракты, счета-фактуры, бланки заявлений, налоговые декларации) и использует 4 технологии классификации — на основе изображений, текстовой информации, правил или наличия и содержания разделительной страницы. В зависимости от принципов классификации и настроек проекта, классификаторы могут применяться раздельно или совместно (в форме механизма голосования). К полностью и частично структурированным документам применяется классификация на основе изображений, а неструктурированные документы классифицируются на основе контента с использованием семантического подхода и на основе ключевых слов.
Распознавание форм и бланков
На этапе распознавания SRP выполняет полностью автоматизированную идентификацию и анализ.
Разделение
Многостраничные документы идентифицируются, сортируются и отделяются от входящего потока; для целей обработки они рассматриваются как отдельный тип документов. Для этого в SRP применяются функции обнаружения пустых страниц и заголовков, разделительные листы и алгоритмы классификации.
Технологии распознавания
Мы применяем современные технологии, в том числе: оптическое распознавание символов (OCR), интеллектуальное распознавание символов (ICR), оптическое распознавание меток (OMR) и распознавание штрихкодов.
- Оптическое распознавание символов доступно для обработки печатного текста на 190 языках.
- Интеллектуальное распознавание символов позволяет обрабатывать рукописный текст на 110 языках.
- Оптическое распознавание меток работает с самыми разными символами и обозначениями.
- Технология распознавания штрихкодов позволяет обрабатывать различные типы одномерных (линейных) и двухмерных штрихкодов.
Если данные невозможно распознать автоматически, они вводятся вручную.
Извлечение данных
SRP автоматически извлекает данные из структурированных и неструктурированных форм и бланков, в частности из заявок о предоставлении кредита или открытии кредитной карты, налоговых деклараций, контрактов и счетов на оплату. Для решения ряда бизнес-задач требуются детальный анализ и понимание контента. Наша платформа SRP анализирует текстовые данные, автоматически выявляя и вычленяя релевантную информацию, в том числе из неструктурированных источников, таких как контракты и отчеты. Также SRP может выполнить полное извлечение текстовых данных. Например, извлечь весь текст документа с помощью оптического распознавания символов. Полное извлечение текстовых данных позволяет создавать файлы PDF с возможностью поиска.
Проверка достоверности данных
Для обеспечения точности данных на этапе проверки достоверности в SRP применяется автоматический и ручной контроль. Встроенная бизнес-логика также проверяет соответствие данных и бизнес-системы, к которой они относятся (например, системы планирования бизнес-ресурсов (ERP), системы управления документооборотом (СЭД), системы управления информацией о клиентах (CRM), системы управления персоналом (HRM/HCM) и т. д.). Функции автоматического сопоставления и сквозной обработки обеспечивают высокий уровень автоматизации.
Автоматическая проверка
Автоматическая проверка достоверности гарантирует высокое качество данных и сокращает тот объем проверок, который операторы должны выполнять вручную. SRP может выполнять следующие автоматические проверки:
- Сопоставление с базами данных
- Соблюдение встроенных правил проверки
- Соответствие форматов
- Упорядочение данных
- Пользовательские проверки
Проверка вручную
Проверка (индексация) вручную применяется, если невозможно гарантировать точность автоматического извлечения данных. Если при индексации вручную невозможно досконально проверить правильность ввода индексов, применяется метод двойного ввода: два человека вручную, отдельно друг от друга индексируют документ, а затем проверяется, совпадают ли соответствующие значения. Оба индекса должны быть идентичны.
Экспорт: Доставка метаданных и изображений
Для доставки изображений и метаданных могут применяться прямая передача файлов (по VPN) или внешние устройства хранения данных (например, зашифрованный жесткий диск или USB-накопитель). Клиент выбирает тот вариант, который ему подходит. Доставка полностью автоматизирована и осуществляется под жестким контролем SRP. Все отсканированные изображения и метаданные хранятся непосредственно в информационной базе SRP. Экспорт из SRP осуществляется автоматически, без вмешательства человека. Благодаря этому, вы получаете практически полную свободу в выборе формата файлов изображений и метаданных. В частности, это графические форматы JPEG, TIFF, PDF, PDF/A, форматы XML и CSV для метаданных, а также любые форматы для импорта в вашу СЭД.
Подтвержденное уничтожение
Все физические носители находятся на карантинном хранении (в закрытом хранилище) в течение стандартного периода — 1 месяц с момента доставки клиенту отсканированных документов и метаданных. Это позволяет клиентам проводить собственный контроль качества. После истечения срока хранения и получения прямого разрешения клиента, все документы, помещенные на карантинное хранение, уничтожаются с соблюдением регламентов безопасности и конфиденциальности согласно уровню безопасности P3, описанному в стандарте DIN 66399. После уничтожения физических носителей все отсканированные изображения и метаданные, находящиеся в нашей системе SRP, удаляются. Клиенту выдается документ, подтверждающий конфиденциальное уничтожение.
Конфиденциальность и безопасность
iGuana уделяет особое внимание аспектам конфиденциальности, безопасности и защиты данных. Наш штатный специалист по защите данных отвечает за соблюдение внутренних регламентов конфиденциальности и безопасности, а также за внедрение процедур информационной безопасности в соответствии с требованиями GDPR и ISO 27001.
Видео ScanFactory
Контроль качества и графическая оптимизация
Для каждого этапа операций сканирования — от получения материалов до доставки метаданных и изображений — установлены четкие регламентные процедуры. Каждая операция с вашими документами отслеживается в SRP в режиме реального времени. В наших сканерах для документов применяются встроенные инструменты контроля качества изображений, в частности технология Perfect Page, удаление пустых страниц, обнаружение двойной подачи, двухпотоковое сканирование, интеллектуальный контроль качества, система бинаризации iThresholding и автоматическое выравнивание перекосов.
Работу модуля оптимизации изображений в нашей системе SRP поддерживает выделенный 16-ядерный сервер, обслуживающий только обработку изображений после сканирования и выполняющий ряд сложных алгоритмических задач. В дополнение к различным проверкам качества, выполняемым вручную, наш менеджер по качеству получает от SRP автоматические уведомления о любых проблемах, выявленных с помощью сложных алгоритмов контроля качества системы SRP.
И последний, но не менее важный аспект — наши сотрудники изучают и применяют в своей работе принципы менеджмента качества ISO 9001.
Запросить информацию
Мы готовы ответить на ваши вопросы. Один из наших специалистов свяжется с вами в ближайшее время.