Este sitio utiliza cookies para mejorar su experiencia de usuario y para lograr estadísticas de audiencia.
AceptoMe niego a aceptarPara saber más sobre el tema
en fr
en fr
Menu
Todas nuestras noticias
31/08/2021

ICDAR 2021 : 3 contribuciones de ARIADNEXT

La 16ª Conferencia Internacional sobre Análisis y Reconocimiento de Documentos (ICDAR 2021) tendrá lugar en Lausana entre el 5 y el 10 de septiembre.

ARIADNEXT aprovechará la ocasión para presentar sus últimos avances técnicos en el ámbito del análisis de documentos.

 

Detección, clasificación y recorte de documentos de identidad1

Uno de los principales pasos del análisis de documentos de identidad es localizar el documento de identidad en la imagen enviada por el usuario e identificar su tipo (DNI francés, pasaporte alemán, etc.).

Esta tarea sigue siendo un gran reto debido, por un lado, a la gran variación de las condiciones de captura. Como el usuario simplemente toma una foto de su documento sin ninguna restricción, las imágenes producidas pueden sufrir desenfoque, variaciones de iluminación, resolución, etc. Por otro lado, hay que considerar un gran panel de documentos para tener una amplia cobertura de los documentos de identidad en uso.

En este trabajo se propone un marco modular basado en un enfoque de aprendizaje profundo totalmente multietapa. Ofrece más flexibilidad en el proceso de clasificación, además de un potencial aprendizaje incremental futuro.

Los experimentos muestran la superioridad del enfoque propuesto en términos de velocidad, manteniendo una buena precisión, tanto en conjuntos de datos académicos como industriales, en comparación con las soluciones artesanales.

 

Una solución más robusta para el reconocimiento de textos2

Los sistemas de reconocimiento óptico de caracteres permiten extraer información textual de la imagen de un documento. Los sistemas modernos de reconocimiento de caracteres, en su mayoría basados en redes neuronales recurrentes, son muy eficientes, pero también muy sensibles a las variaciones en la localización del texto debido a diversas condiciones de captura.

En este trabajo, primero mostramos la sensibilidad de las redes recurrentes a dichas variaciones. En primer lugar, se propone el aumento de datos para superar este problema. A pesar de la mejora que supone el uso de datos aumentados durante las etapas de entrenamiento, este enfoque es menos eficiente en términos de tiempo de entrenamiento y almacenamiento necesario.

A continuación se propone una nueva red neuronal totalmente convolucional. Además de ser más resistente que los sistemas de última generación, esta arquitectura es más compacta y ofrece una alternativa más ligera y eficiente que las redes recurrentes.

 

Medida de similitud de imágenes para detectar documentos falsificados3

Algunas de las verificaciones de documentos para detectar documentos falsificados requieren el uso de métodos de comparación de imágenes (por ejemplo, partes invariables del fondo).

En este trabajo se han explorado arquitecturas neuronales para medir la similitud entre dos imágenes. El uso de una función de pérdida adaptada permite calcular una distancia que sería pequeña para imágenes similares (=documento auténtico) y alta para imágenes «diferentes» (=documento falsificado).

Se ha realizado una comparación experimental entre dos arquitecturas profundas y los enfoques tradicionales basados en características artesanales en un conjunto de datos del mundo real de parches extraídos de documentos de identidad. Los resultados obtenidos muestran que nuestro enfoque supera a los métodos basados en características artesanales.

 

1: Guillaume Chiron, Florian Arrestier and Ahmad Montaser Awal, Fast End-to-end Deep Learning Identity Document Detection, Classification and Cropping, International conference on document analysis and recognition (ICDAR 2021), 2021 

2: Ahmad Montaser Awal, Timothée Neitthoffer and Nabil Ghanmi. Data augmentation vs. PyraD-DCNN: a Fast, Light, and Shift Invariant FCNN for Text Recognition.  3rd Workshop on Machine Learning in ICDAR 2021.

3: Nabil Ghanmi, Cyrine Nabli and Ahmad Montaser Awal. CheckSim: a reference-based identity document verification by image similarity measure.  3rd International Workshop on Computational Document Forensics in ICDAR 2021.

¡Síganos!
contact