Services de reconnaissance de formulaires et d’extraction de données
Introduction de formulaires via divers canaux
La première étape du processus consiste en l’introduction du document. En d’autres mots, nous devons être en possession de vos formulaires pour pouvoir les traiter. Ceci peut se faire de diverses façons. Nous vous proposons dans ce contexte plusieurs options flexibles. À vous de choisir celle qui vous convient le mieux :
- Enlèvement : Nous pouvons enlever vos formulaires papier directement dans vos locaux à une fréquence convenue (par ex. 1x par semaine, 1x par mois, etc.), puis les scanner et les traiter sur notre site.
- Boîte aux lettres : Vos fournisseurs ou clients peuvent envoyer leurs documents (par ex. factures) vers une boîte aux lettres dédiée créée à cet effet ; nous récupérons les formulaires dans la boîte aux lettres, nous les scannons et nous les traitons.
- Numérisation sur votre site : Vous pouvez numériser vos formulaires sur votre site à l’aide de vos propres scanners ou appareils multifonctions ; les images scannées sont automatiquement envoyées vers notre système pour traitement.
- E-mail : Vous pouvez envoyer vos formulaires par e-mail vers un compte e-mail iGuana dédié ; les formulaires que vous envoyez ainsi sont automatiquement importés dans notre système pour traitement.
Capture des formulaires
Si vous décidez de numériser / capturer vous-même vos formulaires ou de nous les envoyer par e-mail, nous pourrons les traiter immédiatement à l’aide de notre technologie sophistiquée de reconnaissance de formulaires et d’extraction de données. Si vous souhaitez que nous venions enlever vos formulaires papier sur votre/vos site(s) ou dans une boîte aux lettres, nous devrons les numériser avant de pouvoir les traiter. Pour cela, nous utilisons exclusivement les meilleurs scanners de documents disponibles sur le marché. Nos scanners de production sont équipés de fonctionnalités de pointe qui nous permettent de livrer des images numériques de haute qualité. Nous utilisons en outre notre technologie propriétaire, ScanFactory Resource Planning (SRP), pour contrôler, rationaliser et automatiser toutes nos activités de numérisation, de A à Z. Son principal objectif est de réduire l’intervention humaine à un minimum et de supprimer le risque d’erreur humaine. Toutes les étapes de numérisation sont entièrement contrôlées par le système SRP, y compris le contrôle de la qualité, l’affectation des ressources humaines et de nos scanners performants.
Classification des formulaires
La plate-forme SRP classifie et reconnaît automatiquement le flux de documents entrants. Elle identifie tous les types de contenus (par ex. contrat, facture, formulaire de demande, déclaration d’impôts, etc.) et exploite 4 technologies de classification : basée sur l’image, basée sur le texte, basée sur la séparation des pages, et basée sur des règles. En fonction du profil de classification et des paramètres de votre projet, les méthodes de classification peuvent être utilisées individuellement ou combinées (« voting engine »). Les documents structurés et semi-structurés sont classifiés sur la base de l’image, les documents non structurés sont classifiés selon leur contenu, à l’aide d’approches basées à la fois sur la sémantique et sur des mots clés.
Reconnaissance des formulaires
À l’étape de la reconnaissance, notre plate-forme SRP applique un processus entièrement automatisé d’identification et d’analyse des formulaires / documents.
Séparation
Les documents comptant plusieurs pages sont identifiés, triés et séparés du flux de documents entrants, et traités comme un seul document. Pour y parvenir, on utilise la détection des pages blanches, la détection d’en-tête, des feuilles de séparation ou des algorithmes de classement prédéfinis dans notre système SRP.
Technologies de reconnaissance
Nous utilisons plusieurs technologies de reconnaissance avancées, notamment : OCR, ICR, OMR et reconnaissance des codes-barres.
- Reconnaissance optique des caractères (OCR) dans le texte imprimé, en 190 langues
- Reconnaissance intelligente des caractères (ICR) pour les textes manuscrits, en plus de 110 langues
- Reconnaissance optique de symboles (OMR) pour une large gamme de coches
- Reconnaissance de différents types de codes-barres 1D (unidimensionnels ou linéaires) et 2D (bidimensionnels)
S’il est impossible de ‘reconnaître’ les formulaires automatiquement, nous procédons à une saisie manuelle.
Extraction des données
Notre système SRP extrait automatiquement les données d’une gamme de formulaires, structurés et non structurés, tels que demandes d’hypothèque, déclarations d’impôts, questionnaires, demandes de carte de crédit, contrats, factures et bien d’autres. Certaines tâches commerciales requièrent une analyse et une compréhension granulaire du contenu. Notre plate-forme SRP fournit une analyse textuelle en identifiant et extrayant automatiquement les informations pertinentes, particulièrement dans des documents non structurés tels que des contrats et des rapports. Notre système SRP peut également exécuter une extraction complète de texte via OCR. Ce genre d’extraction permet de fournir des PDF entièrement ‘recherchables’.
Vérification des données
Pendant l’étape de vérification, notre système SRP réalise des vérifications automatiques et manuelles afin de garantir l’exactitude des données. Une logique commerciale intégrée détermine également si la valeur d’une donnée correspond à un système commercial lié (ERP, DMS, CRM, HRM, etc.), et offre la possibilité de mettre en place des services de mise en correspondance automatiques, un traitement sans rupture (« straight-through processing ») et des niveaux d’automatisation élevés.
Vérification automatique
La validation automatique des données garantit une grande qualité des données et réduit le besoin de vérification manuelle par des opérateurs humains. Notre système SRP peut effectuer les vérifications automatiques suivantes :
- Comparaison par rapport à des bases de données
- Conformité avec des règles de validation intégrées
- Conformité avec des formats
- Normalisation des données
- Vérification définie par l’utilisateur
Vérification manuelle
La vérification (indexation) manuelle est utilisée lorsque l’exactitude de l’extraction automatique des données ne peut être garantie. Si, durant l’indexation manuelle, il s’avère impossible de valider totalement l’introduction correcte des index, nous utilisons une méthode à double entrée, c’est-à-dire que deux personnes vont indexer manuellement le même document, séparément l’une de l’autre, et qu’une comparaison est ensuite faite entre les deux indexations pour voir si elles correspondent. Les deux index doivent être identiques.
Exportation : livraison des métadonnées et des images
La livraison des images et des métadonnées peut être effectuée soit par le biais d’une méthode de transfert direct de fichier (VPN) ou via un support de stockage externe (par ex. disque dur crypté, clé USB). C’est vous qui décidez l’option qui vous convient le mieux. La livraison est un processus entièrement automatisé qui est intégralement piloté par le système SRP. Toutes les images scannées et les métadonnées sont stockées directement dans la base de données du SRP. Ces images et métadonnées sont automatiquement exportées du SRP, sans la moindre intervention humaine. Vous disposez par conséquent d’une flexibilité quasiment illimitée pour le choix des formats de fichiers d’images et de métadonnées (par ex. JPEG, TIFF, PDF, PDF/A, etc. pour les images ; CSV, XML, etc. pour les métadonnées ; ou tout autre format d’importation pour votre logiciel de gestion de documents).
Destruction certifiée
Tous les fichiers physiques sont mis en quarantaine (stockage scellé) pendant une période standard d’1 mois à partir du jour où les documents numérisés et les métadonnées vous ont été livrés. Vous avez ainsi le temps d’effectuer votre propre contrôle de qualité. Au terme de cette période de quarantaine et moyennant votre autorisation expresse, tous les documents en quarantaine sont détruits selon une procédure sûre et confidentielle avec niveau de sécurité P3, dans le respect de la norme DIN 66399. Une fois que les documents physiques sont détruits, toutes les images scannées et les métadonnées sont effacées de notre système SRP, et vous recevez un certificat attestant de la destruction confidentielle de vos documents.
Vie privée & Sécurité
iGuana prend très au sérieux les questions de respect de la vie privée, sécurité et protection des données. Nous possédons notre propre Data Protection Officer (DPO), membre du personnel d’iGuana, qui est responsable de garantir la conformité avec les politiques internes en matière de vie privée et de sécurité, ainsi que de mettre en place des procédures en conformité avec le RGPD et la norme ISO 27001 relative à la sécurité des données.
Vidéo ScanFactory
Qualité & Amélioration d’image
Une série de procédures clairement définies pilotent chaque étape de nos activités de numérisation, depuis l’enlèvement des boîtes jusqu’à la livraison des images et des métadonnées. Chaque action posée par rapport à vos documents est retracée en temps réel dans le système SRP. Nos scanners comprennent des fonctions de contrôle de la qualité embarquées : technologie Perfect Page, suppression des pages blanches, détecteur de double alimentation, numérisation en double flux, contrôle qualité intelligent, iThresholding, redressement automatique, etc.
Le module d’amélioration d’image du SRP utilise un serveur 16 cœurs dédié exclusivement au traitement d’image après la numérisation, et exécute une série de fonctions algorithmiques complexes d’amélioration des images. En plus de nombreux contrôles manuels de la qualité, notre Quality Supervisor est aussi averti automatiquement par le SRP de tout problème de qualité détecté par les algorithmes sophistiqués de contrôle de la qualité du SRP.
Enfin, nos collaborateurs sont formés à appliquer les principes de gestion de la qualité ISO 9001 dans tous les aspects de leur travail.
Demande d’informations
Adressez-nous votre demande d’informations. Un de nos spécialistes vous contactera dans les meilleurs délais.