Escrito por Ana Canteli en mayo 06, 2022
El origen del reconocimiento óptico de caracteres - Optical Caracter Recognition (OCR) - se puede rastrear hasta principios del s.XX, cuando en 1914 Emanuel Goldberg desarrolló una máquina que leía personajes y los convirtió en código de telégrafo estándar. Sin embargo, hasta 1974 no se consiguen los avances más destacables de la mano de Ray Kurzweil, que mejoró el reconocimiento óptico de caracteres impresos sin importar el tipo de fuente; con el objetivo de crear una máquina de lectura para personas ciegas o con discapacidad visual.
Este origen anecdótico y con un desarrollo tan extenso en el tiempo y dispar en sus objetivos, desembocó en una tecnología revolucionaria como es el OCR. Actualmente está incluido en smartphones, gafas inteligentes, dispositivos conectados a internet que leen texto gracias a las cámaras integradas en los mismos. Y donde antes se concibió para mejorar la accesibilidad a la información de personas con necesidades especiales, hoy en día es utilizado de forma masiva en infinidad de operaciones, para beneficiarse de las ventajas que proporciona y mejorar la eficiencia de los procesos organizativos a nivel global.
Si alguna vez has utilizado una app en tu móvil que traduce automáticamente letreros escritos en un idioma extranjero, esa aplicación está utilizando OCR. Ni la tipografía ni el idioma suponen ya una limitación. Las condiciones de iluminación o resolución ya no necesitan ser óptimas.
Desde sus inicios la tecnología de reconocimiento de caracteres ópticos (OCR) se ha convertido en una solución comercial utilizada para automatizar la extracción de datos - tanto de texto impreso, como de una imagen escaneada de un documento - de forma que sea legible para un ordenador. Así, los datos obtenidos de esta forma se vuelven útiles para usuarios que pueden realizar búsquedas o llevar a cabo actividades de edición.
El sistema de gestión documental OpenKM incluye un motor de reconocimiento óptico de caracteres ( Tesseract o Cuneiform ) para ampliar los casos de uso y extender así el potencial de las funcionalidades del software, allá donde la organización requiera.
Los beneficios que el ocr zonal aporta son los siguientes:
El reconocimiento óptico de caracteres es a menudo, una tecnología oculta en muchos procesos de negocio, que impulsa gran variedad de servicios en el día a día. La capacidad de extraer texto impreso a máquina de una imagen digital, es sólo un aspecto de la captura de datos. De hecho, el software de gestión documental de OpenKM puede realizar la extracción de texto de documentos en formatos diferentes: casillas de verificación (OMR), códigos de barras, etc. El sistema de reconocimiento óptico de caracteres de OpenKM funciona con plugins, de manera que el sistema se puede adaptar a la lectura de entrada de datos requerida: texto, cifras, códigos alfanuméricos, códigos de barras de cualquier tipo, etc.
Otro uso muy habitual de la tecnología OCR es la conversión automática de un archivo en formato imagen, jpg, jpeg, png, bmp, a PDF, para garantizar una mejor usabilidad y neutralidad de formato. Así se pueden tratar multitud de tipos de documentos como contratos, recibos, facturas,extractos bancarios, etc.
OpenKM proporciona reconocimiento óptico de caracteres para indexar y facilitar tareas de búsqueda, incluso a nivel de cuerpo del documento. También aplica el reconocimiento óptico de caracteres zonal, de manera que se entrena el sistema de gestión documental para que éste sea capaz de identificar tipos de documentos y extraer la información que contienen en forma de metadatos.
Una empresa de alquiler de vehículos, desea controlar el estatus de cada operación de alquiler de coches en tiempo real. Ésta empresa tiene multitud de oficinas en todo el país.
Además, posee información importante en una base de datos en una tercera aplicación.
Para gestionar toda la documentación relacionada con cada operación de alquiler de vehículos se prepararan plantillas OCR relacionadas con la documentación vinculada a cualquier alquiler.Una de ellas es la plantilla “permiso de circulación”.
El OCR zonal incluido de serie en OpenKM sirve para capturar información que siempre aparece en el mismo lugar y que cumple siempre las mismas características. En este caso, siempre que el OCR detecte una matrícula y un número de bastidor en ubicaciones concretas del documento, OpenKM reconocerá el tipo de documento “ Permiso de circulación” Ésta es información que debe tener en cuenta el Administrador.
Un usuario normal, un oficinista, lo que debe hacer es escanear la documentación obligatoria para poder alquilar un coche. Entre esa documentación tiene que estar el permiso de circulación del cliente.
La ruta automática para el documento comienza en la carpeta automatizada Scanner. En este escenario el empleado que atiende al cliente ha terminado su tarea.
Ahora imaginémonos que somos otro empleado de la empresa; trabajamos para el dpto. de atención al cliente y recibimos una llamada. ( Vamos al buscador/ búsqueda avanzada / Metadatos / seleccionamos el grupo de metadatos “Matrícula” y seleccionamos el campo de búsqueda “Matrícula”) Lo primero que tenemos que hacer es comprobar si estamos hablando con un cliente o si tenemos que liberar la línea.
La persona que nos llama lo hace desde la carretera; hay ruido y no entendemos bien. Logramos oír los 2 primeros dígitos de la matrícula y podemos comprobar cómo con estos datos OpenKM es capaz de darnos información. Desde el motor de búsqueda podemos ver que tenemos un permiso de circulación en la documentación; podemos seguir haciendo preguntas al cliente y continuar con el servicio.
Además, si analizamos el grupo de metadatos vinculados al permiso de circulación, podemos ver cómo OpenKM ha gestionado la documentación en este caso de uso.
Para empezar ha renombrado el documento, con los atributos más importantes para la empresa: la matrícula y el tipo de documento. (Cuando el documento entra en OpenKM entra con un código automático como nombre ). También ha convertido el archivo a PDF, para permitir el acceso a la información en el largo plazo.
Y a su vez ha vinculado más información al documento. En el grupo de metadatos aparece la matrícula, el número de bastidor y el tipo de documentos. Información que proviene del reconocimiento óptico de caracteres. Pero también, la fecha, la marca, el modelo y el número de identificación fiscal del cliente; que es información que proviene de la base de datos integrada con OpenKM.
Y lo más importante: ¿ Dónde está este documento ? Desde el buscador el software de gestión documental nos lleva a la ruta en la que el documento ha sido archivado automáticamente bajo el nombre de la oficina, que ha gestionado la operación, y donde aparece el documento, junto al campo de metadatos añadido y cumplimentado automáticamente por OpenKM.
El sistema de gestión documental de OpenKM puede adaptarse a cualquier escenario. Si desea saber cómo implementar las mejoras que el reconocimiento óptico de caracteres le puede aportar, no dude en ponerse en contacto con nosotros.
Norteamérica: Si necesita comunicarse con nosotros, por favor llame al +1 646 206 6071.
Horario de oficina:
Lunes - Viernes: 08:00 am - 12:00 pm, 14:00 pm - 18:00 pm EST. Ahora son las 11:29 am del Jueves en New York, USA.
Europa España: Si necesita comunicarse con nosotros, por favor llame al +34 605 074 544.
Horario de oficina:
Lunes - Viernes: 09:00 am - 14:00 pm, 16:00 pm - 19:00 pm CET. Ahora son las 17:29 pm del Jueves en Palma de Mallorca, Spain.
OpenKM en el mundo: