Služby sběru dat z formulářů: Rozpoznávání formulářů a extrakce dat

Dokážeme snímat údaje prakticky ze všech druhů papírových formulářů, extrahovat z nich data a digitální snímky a data exportovat přímo do vašeho systému plánování podnikových zdrojů (ERP), systému pro správu dokumentů (DMS), systému řízení odběratelů (CRM) nebo jakéhokoli jiného vámi používaného IT systému. Skenujeme, sbíráme a extrahujeme data z: objednávek, průzkumů, dotazníků, žádostí (o úvěr, hypotéku, otevření účtu, pracovní místo apod.), oznámení pojistných událostí, formulářů průzkumu trhu, daňových přiznání, stížností, lékařských testů a řady dalších formulářů. Díky více než 30 letům praxe ve skenování, indexaci a archivaci obrovských objemů dokumentů víme o zpracování, rozpoznávání a extrakci dat vše. Naše služby sběru dat vám poskytuje naše divize ScanFactory prostřednictvím svých vysoce kvalifikovaných pracovníků s bezpečnostní prověrkou. Spolupracujeme s personálními odděleními, finančními a účetními odděleními, pojišťovnami, finančními institucemi, bankami, firmami zabývajícími se výzkumem trhu, orgány a útvary státní správy a samosprávy, právními kancelářemi, nemocnicemi atd. K příkladům formulářů, které zpracováváme, patří mimo jiné:

  • Nákupní faktury
  • Žádosti
  • Bankovní úvěry a výpisy
  • Hypoteční žádosti
  • Žádosti o vydání kreditní karty
  • Formuláře k otevření účtu
  • Formuláře zpětné vazby zákazníků
  • Lékařská vyšetření a formuláře
  • Stížnosti a formuláře souhlasu
  • Oznámení pojistné události
  • Daňové formuláře a daňová přiznání
  • Formuláře průzkumu trhu
  • Průzkumy a dotazníky
  • Smlouvy a dohody o dodávce služeb
  • Formuláře hospitalizace a propuštění
  • Doklady doručení

Vícekanálový vstup formulářů

Prvním krokem procesu je vstup dokumentů, tzn., že vaše formuláře potřebujeme k jejich zpracování obdržet. To lze provést několika způsoby. Můžete si vybrat z nabídky několika flexibilních variant. Sami se rozhodnete, která varianta vám vyhovuje:

  • Vyzvednutí: Můžeme si papírové formuláře vyzvedávat přímo u vás ve sjednaných intervalech (tj. týdně, měsíčně apod.), naskenovat je na našem skenovacím pracovišti a zpracovat je
  • P.O. Box: Vyhrazený P.O. Box, kam budou vaši dodavatelé či odběratelé zasílat své dokumenty (např. faktury); my je ze schránky vyzvedneme a následně naskenujeme a zpracujeme
  • Skenování na místě: Své formuláře můžete skenovat na místě pomocí vlastních multifunkčních zařízení nebo skenerů; naskenované snímky se automaticky zavádějí do našeho systému ke zpracování
  • E-mail: Své formuláře můžete zasílat na zvláštní e-mailový účet společnosti iGuana; e-mailem zaslané formuláře se automaticky importují do našeho systému ke zpracování

Snímání formulářů

Pokud se rozhodnete skenovat / snímat své formuláře sami nebo nám je budete zasílat e-mailem, zahájíme jejich zpracování přímo pomocí naší sofistikované technologie pro rozpoznávání formulářů a extrakci dat. Pokud si přejete, abychom si papírové formuláře vyzvedli u vás nebo z P.O. Boxu, nejdříve je budeme muset naskenovat. K tomu používáme pouze ty nejkvalitnější dokumentové skenery, které jsou na trhu k dispozici. Naše produkční skenery jsou vybaveny těmi nejmodernějšími funkcemi, které nám umožňují dodat vám digitální snímky nejvyšší kvality. Kromě toho používáme vlastní technologii pro kontrolu, zjednodušení a automatizaci všech našich skenovacích procesů od A do Z – technologii ScanFactory Resource Planning (SRP). Jejím hlavním smyslem je snížit míru zásahů člověka na absolutní minimum a odstranit riziko selhání lidského faktoru. Všechny fáze procesu skenování formulářů jsou řízeny výhradně systémem SRP, a to včetně kontroly kvality, přidělení lidských zdrojů a použití špičkových dokumentových skenerů.

Třídění formulářů

Platforma SRP automaticky třídí tok příchozích dokumentů. Identifikuje všechny typy obsahu (např. smlouva, faktura, žádost, daňové přiznání apod.) a využívá 4 klasifikační technologie: obrazovou, textovou, na bázi oddělujících stránek a na bázi pravidel. V závislosti na profilu třídění a nastavení vašeho projektu lze třídicí faktory (klasifikátory) používat jednotlivě, nebo ve vzájemné kombinaci (rozhodovací engine). U strukturovaných a polostrukturovaných dokumentů se provede klasifikace snímku, nestrukturované dokumenty se klasifikují sémanticky podle obsahu a podle klíčových slov.

Rozpoznávání formulářů

Ve fázi rozpoznávání náš systém SRP provede plně automatizovaný proces identifikace a analýzy dokumentů/formulářů.

Oddělování

Obdržené dokumenty o více stránkách se v toku příchozích dokumentů identifikují, roztřídí a oddělí a zachází se s nimi při zpracování jako s jediným dokumentem. Toho je dosaženo detekcí prázdné stránky, detekcí nadpisů, oddělujícími listy nebo pomocí předdefinovaných klasifikačních algoritmů v našem systému SRP.

Rozpoznávací technologie

Používáme několik moderních rozpoznávacích technologií včetně: OCR, ICR, OMR a rozpoznávání čárových kódů.

  • Optické rozpoznávání znaků „OCR“ v tištěném textu až ve 190 jazycích
  • Inteligentní rozpoznávání znaků „ICR“ v rukou psaném textu až ve 110 jazycích
  • Optické rozpoznávání značek „OMR“ pro celou řadu zatrhávacích značek
  • Rozpoznávání čárových kódů pro nejrůznější 1D (jednorozměrné neboli lineární) a 2D (dvourozměrné) čárové kódy

Manuální zadávání se používá v případech, kdy není možné formuláře „rozpoznat“ automaticky.

Extrakce dat

Náš systém SRP automaticky extrahuje data z nejrůznějších strukturovaných i nestrukturovaných formulářů, jako jsou žádosti o hypotéku, daňová přiznání, dotazníky, žádosti o vydání kreditní karty, smlouvy, faktury a mnohé další. Některé obchodní úkoly vyžadují granulární analýzu a porozumění obsahu. Naše SRP platforma poskytuje funkce analýzy textu automatickou identifikací a extrakcí relevantních obchodních informací z vašeho obsahu, zejména pak z nestrukturovaných informací, jako jsou smlouvy a zprávy. Náš systém SRP dokáže také provádět fulltextovou extrakci. Pomocí technologie OCR dokáže extrahovat z dokumentu celý text. Fulltextová extrakce umožňuje dodání prohledávatelných souborů formátu PDF.

Ověření dat

Ve fázi ověření dat provádí náš systém SRP automatizované i manuální kontroly s cílem zajistit věrnost dat. Zabudovaná pracovní logika také určuje, zda určitá hodnota dat odpovídá napojenému podnikovému systému (ERP, DMS, CRM, HRM apod.), což s sebou přináší možnost služeb automatického párování, přímé zpracování a vysokou míru automatizace.

Automatické ověření

Automatickým ověřením dat se zajišťuje vysoká kvalita dat a snižuje se nutnost manuálního ověření lidskou obsluhou. Náš SRP dokáže provádět tato automatická ověření:

  • Srovnání s databázemi
  • Shoda se zapracovanými validačními pravidly
  • Dodržení formátů
  • Normalizace dat
  • Uživatelsky definovaná kontrola

Manuální ověření

Manuální ověření (indexace) se používá, pokud nelze zaručit přesnost automatické extrakce dat. Pokud při manuálním indexování nelze zcela validovat zadání indexů, používá se metoda dvojitého zadání, tzn. stejný dokument nezávisle na sobě indexují dvě osoby a srovnáním dvou indexačních hodnot se zjistí jejich shoda. Tyto dva indexy musí být shodné.

Export: Dodání metadat a snímků

Předání snímků a metadat se provádí buď metodou přímého přenosu dat (VPN), nebo metodou externího paměťového zařízení (např. šifrovaný pevný disk, přenosný USB disk apod.). Sami se rozhodnete, která varianta vám vyhovuje. Dodání představuje plně automatizovaný proces řízený výhradně SRP. Všechny naskenované snímky a metadata se ukládají přímo do databáze SRP. Tyto snímky a metadata se automaticky exportují ze SRP bez jakéhokoli zásahu člověka. Díky tomu si můžete prakticky bez omezení vybrat preferované formáty snímků a metadat, jako např.: JPEG, TIFF, PDF, PDF/A apod. u snímků, soubor XML nebo CSV apod. u metadat, nebo jakýkoli formát importu pro váš software pro správu dokumentů.

Skartace s osvědčením

Všechny fyzické spisy jsou uloženy v karanténě (zapečetěném skladu) po standardní dobu 1 měsíce ode dne, kdy vám byly naskenované dokumenty a metadata dodány. To vám dává možnost provést svou vlastní kontrolu kvality. Po uplynutí karanténní doby a s vaším výslovným souhlasem je u všech dokumentů v karanténě provedena zabezpečená, důvěrná skartace podle bezpečnostní úrovně P3 normy DIN 66399. Po skartaci fyzických dokumentů se všechny naskenované snímky a metadata vymažou z našeho systému SRP. Obdržíte osvědčení o zabezpečené skartaci.

Ochrana údajů a zabezpečení

Společnost iGuana bere záležitosti soukromí, bezpečnosti a ochrany osobních údajů velmi vážně. Mezi svými zaměstnanci máme pověřence pro ochranu osobních údajů (DPO), který odpovídá za zajištění shody s interními předpisy v oblasti ochrany soukromí a bezpečnosti a za provádění postupů v souladu s nařízením GDPR a s normou informační bezpečnosti ISO 27001.

  • Vlastní pověřenec pro ochranu osobních údajů
  • Striktní kontrola přístupu; nonstop monitoring
  • Zákaz Wi-Fi a mobilních telefonů
  • Prověrky osob a dohody o mlčenlivosti
  • Bezpečná přeprava a zapečetěné uskladnění
  • Zabezpečené dodání snímků a metadat
  • Důvěrná skartace s osvědčením

Video ScanFactory

Vylepšení kvality a obrazu

Každý jednotlivý krok našich skenovacích operací ‒ od vyzvednutí dokumentů až po dodání metadat a snímků ‒ se řídí souborem jasně definovaných postupů. Každý úkon provedený v souvislosti s vašimi dokumenty se v reálném čase zaznamenává do systému SRP. Naše skenery jsou vybaveny zabudovanými funkcemi kontroly kvality, jako je např. technologie Perfect Page, odstranění prázdných stránek, detekce podání více stran, duální skenování, inteligentní kontrola kvality, iThresholding, automatická oprava zešikmení atd.

Modul pro vylepšení obrazu v našem systému SRP využívá 16jádrový server, který je určený výhradně pro zpracování snímků po naskenování a provádí nejrůznější funkce algoritmického vylepšení obrazu. Kromě celé řady manuálních kontrol kvality je náš supervizor kvality rovněž systémem SRP automaticky upozorněn na případné problémy s kvalitou, které propracované algoritmy SRP pro kontrolu kvality zjistí.

V neposlední řadě jsou také naši pracovníci proškoleni v uplatňování zásad řízení jakosti ISO 9001 ve své práci.

Požádejte o informace

Budeme rádi, když nás kontaktujete. Náš specialista se s vámi co nejdříve spojí.