¿ La capacidad de escanear un documento en forma legible por máquina es un ahorro de tiempo igual. En lugar de volver a escribir el documento , y posiblemente insertando errores propios, escanearlo y pasando la imagen digitalizada a través de un lector de software puede resultar en un documento editable con un alto grado de precisión en comparación con el original. Este software se llama proceso de reconocimiento óptico de caracteres . Reconocimiento
reconocimiento óptico de caracteres óptico de caracteres (OCR ) es un proceso en el que el texto impreso o escrito a mano se lee y se convierte en una forma reconocida por una computadora mecánica o electrónicamente . El proceso sofisticado considera que las formas de las letras y los compara con una biblioteca de formas similares . Cuando se produce una coincidencia , un personaje que representa el patrón se muestra en la pantalla, o se introduce en un fichero automatizado . OCR permite que un documento que va a escanear y leído por un ordenador , la creación de un archivo que puede ser editado o actuar en consecuencia de otras maneras.
OCR Software
Las aplicaciones informáticas se utiliza para la aplicación moderna de OCR. El software ha avanzado desde sus primeros días , en el que los programas tenían que ser calibrado para cada fuente única se esperaba a reconocer . Está disponible en forma independiente como un programa creado específicamente para la tarea , y como un componente en software de escaneo . La llegada de Internet y la computación en nube se ha llevado al desarrollo de programas de OCR basado en la Web , lo que elimina la necesidad de instalaciones de escritorio o servidor individuales.
El reconocimiento de procesos
< br >
OCR funciones del software mediante el reconocimiento por primera vez la distinción entre las áreas claras y oscuras de la imagen escaneada. Como se descubre una distinción de luz-oscuridad , el software busca patrones reconocibles , tales como líneas verticales y horizontales , así como las curvas conectadas o parcial . Si se puede reconocer un patrón como una letra u otro carácter , que busca en su base de datos para el carácter correspondiente en conjunto el lenguaje del ordenador. A continuación, pasa a este personaje en el documento o la pantalla se está reuniendo . Si el software es capaz de reconocer a un personaje , puede hacer su mejor respuesta o sustituir un carácter alternativo con el fin de mantener el proceso en marcha.
Posibles problemas con OCR Software
< p > Dado que el software de OCR se basa en el reconocimiento de patrones , cualquier artefacto en la página que podría potencialmente afectar a este proceso es una fuente de problemas . OCR funciona mejor cuando hay una distinción clara entre los personajes y el fondo del documento , a ser posible negro en blanco. Los fondos de color u ocupado que hacen los patrones menos distintivas pueden causar problemas. Manchas , arrugas y otros daños al documento pueden dar como resultado el reconocimiento de caracteres correctos también.