Bienvenue dans le quatrième billet de blog de notre série en six parties consacrée aux nouveautés en matière de capture multicanale des documents et de technologie de reconnaissance optique des caractères (Optical Character Recognition, OCR) intelligente.  Nous étudions comment l’intelligence artificielle (IA) a transformé le champ des possibles en mettant les documents et les données à votre service alors qu’ils étaient auparavant perçus comme une charge." />

Dématérialisation cognitive des documents : comment évaluer la réussite du projet ?

November 20, 2019 | By Ryan Bazler

Bienvenue dans le quatrième billet de blog de notre série en six parties consacrée aux nouveautés en matière de capture multicanale des documents et de technologie de reconnaissance optique des caractères (Optical Character Recognition, OCR) intelligente.  Nous étudions comment l’intelligence artificielle (IA) a transformé le champ des possibles en mettant les documents et les données à votre service alors qu’ils étaient auparavant perçus comme une charge.

 

Dans la première partie, nous avons expliqué comment l’automatisation robotisée des processus (Robotic Process Automation, RPA) a marqué un véritable tournant en offrant aux entreprises les moyens de répondre aux problèmes liés aux tâches manuelles centrées sur les données, sans toutefois parvenir à automatiser le traitement des documents de façon efficace. Dans la deuxième partie, nous nous sommes penchés sur l’émergence de la dématérialisation cognitive des documents (Cognitive Document Automation, CDA), qui prend en charge les « tâches intellectuelles » visant à comprendre le sens d’un document ou d’un e-mail, les informations contenues et les actions requises. Enfin, dans la troisième partie de notre série, nous avons approfondi le sujet en indiquant les caractéristiques à rechercher dans une solution CDA (pour information, une fonction OCR seule ne suffit pas).

 

Dans la quatrième partie, nous abordons la question suivante : comment évaluer la réussite de la CDA ?

 

Rappelons-nous tout d’abord que les projets de CDA visent toujours à : améliorer la visibilité, réduire les coûts, accélérer les processus, limiter les erreurs et renforcer l’engagement client.  Le principal indicateur de réussite d’un projet de CDA est la productivité des utilisateurs, c’est-à-dire le gain de productivité découlant de l’optimisation et de l’accélération du travail induites par la solution CDA.

 

La productivité des utilisateurs se compose de deux éléments : la précision de la reconnaissance optique des caractères et l’efficacité de l’utilisateur.

 

Étudions de plus près les points suivants :

 

Précision de la reconnaissance optique des caractères

La question qui revient le plus souvent après une démonstration sur la technologie CDA est la suivante : quel niveau de précision puis-je espérer atteindre en matière de reconnaissance optique des caractères ?

En bref, disons que cela varie fortement selon les scénarios d’utilisation. La précision de la reconnaissance optique des caractères, et plus généralement de la classification et de l’extraction, dépend de nombreux facteurs, notamment :

  • Matériel utilisé pour la numérisation
  • Résolution de numérisation
  • Qualité d’image
  • Type de document (formulaire, facture, correspondance)
  • Texte imprimé, inscriptions manuscrites en majuscules, écritures cursives
  • Langue du document
  • Type de police et espacement des caractères
  • Cases, ombrages
  • Possibilité de mise en correspondance ou de vérification d’un total de contrôle (entre autres règles) dans la base de données

Nous reviendrons sur certains de ces facteurs plus loin. Pour l’heure, souvenez-vous que plus la précision est élevée, plus la classification et l’extraction s’effectueront automatiquement ; moins la précision est élevée, plus les tâches manuelles se multiplieront.

 

Au vu des variations en termes de précision, il est recommandé d’effectuer des tests de performances à l’aide d’exemples issus du quotidien de l’entreprise afin d’évaluer les taux de classification et d’extraction. Ces résultats vous permettront d’optimiser les paramètres du projet pour chaque type de document, champ par champ, et ainsi d’améliorer la précision pour une automatisation renforcée. Les tests de performances doivent être configurés de façon à enregistrer systématiquement la fiabilité (oui/non) et l’exactitude (oui/non). Notre objectif consiste à optimiser les vrais positifs, à limiter les faux négatifs et les vrais négatifs, et à éliminer toute exportation de faux positifs vers les intervenants, les processus et les systèmes en aval.

 

Dans ce registre, le terme « traitement direct », que vous connaissez peut-être, est également employé pour décrire les résultats de la CDA. Cet indicateur mesure le pourcentage de documents transitant sans aucune intervention humaine par le processus « acquisition, compréhension, intégration » d’une solution CDA (reportez-vous à la deuxième partie de la série de billets de blog pour en savoir plus). Le taux de traitement direct ne peut jamais être supérieur au niveau de précision le plus faible pour la reconnaissance optique des caractères d’un champ du document. Pour l’optimiser, ajustez les paramètres d’extraction en concentrant vos efforts sur les champs qui présentent la moins bonne précision.

 

Efficacité de l’utilisateur

La précision de la reconnaissance optique des caractères représente une facette de la productivité des utilisateurs. L’autre facette correspond à l’efficacité de traitement des exceptions par l’utilisateur. Les documents et les champs qui ont un faible degré de fiabilité font l’objet d’une vérification « humaine » afin de garantir qu’ils sont classés et extraits correctement.

 

En d’autres termes, l’efficacité de l’utilisateur désigne la rapidité dont ce dernier fait preuve pour examiner chaque cas de figure, déterminer l’action à réaliser (correction ou validation) et l’exécuter. C’est pourquoi l’interface de validation manuelle doit être pensée pour optimiser l’action des yeux et des mains au cours du processus visant à vérifier la classification des documents et à valider les données.

 

Voici quelques-unes des fonctions proposées par les solutions CDA de pointe qui contribuent à améliorer l’efficacité de l’utilisateur :

  • Saut jusqu’au champ à valider, en ignorant les résultats fiables
  • Surlignage du champ en question sur l’image, pour plus de contexte
  • Affichage d’un extrait de code du champ sous forme d’image à côté de la zone de saisie des données
  • Panneaux mobiles, à positionner selon les préférences de chacun
  • Possibilité de corriger un seul caractère du champ, au lieu de saisir à nouveau l’intégralité du contenu
  • Touche de raccourci pour lancer une recherche dans la base de données
  • Remplissage automatique du champ en fonction de la liste des types de document ou de la reconnaissance optique des caractères pour la page entière
  • Action de surlignage permettant de remplir toutes les données d’un tableau

Les efforts consacrés à améliorer l’efficacité et l’expérience de l’utilisateur ont un effet décuplé sur la productivité par rapport aux efforts portant sur la précision de la reconnaissance optique des caractères. C’est pourquoi il est recommandé d’accélérer le traitement manuel des exceptions en limitant au maximum l’utilisation de la souris et du clavier, pour un travail plus efficace.

Productivité des utilisateurs

Somme de la précision de la reconnaissance optique des caractères et de l’efficacité de l’utilisateur, la productivité des utilisateurs est l’indicateur majeur de réussite d’un projet de CDA.

 

Pour la calculer, il convient simplement de déterminer le nombre de documents que chaque membre du personnel peut traiter par heure/jour/semaine/mois en respectant un seuil acceptable de qualité des données. Prenons l’exemple d’une demande de prêt. Certains champs du formulaire ont plus d’importance que les autres, d’où l’utilité d’adapter le « seuil acceptable de qualité des données ». Il est nécessaire d’effectuer un test de performances du projet de CDA afin d’étudier la précision de la reconnaissance optique des caractères selon les champs et d’optimiser ainsi les taux d’extraction pour les champs prioritaires (comme le numéro de sécurité sociale et le revenu annuel).

Lorsqu’elles sont configurées de manière efficace dans l’optique d’optimiser la productivité des utilisateurs, les solutions CDA offrent un retour sur investissement intéressant, souvent observé dans les 6 à 18 mois qui suivent le lancement du système.

 

Pour en savoir plus sur les moyens permettant d’évaluer le succès d’un projet de CDA (indicateurs utiles ou non pertinents, mesure des coûts et des économies de main-d’œuvre réalisées avant et après l’automatisation, montage d’un dossier convaincant en faveur de la CDA), consultez le livre blanc « Indicateurs de réussite d’un projet de dématérialisation cognitive des documents : la vérité sur la précision de la reconnaissance optique des caractères ».

Rester informé

Inscrivez-vous à notre flux RSS pour être informé des derniers articles du blog

Souscrire