La Tagged Image File Format , o TIFF, sirve como una opción frecuente para guardar los archivos de mapa de bits sin comprimir , incluidas las imágenes adquiridas del análisis material impreso. Puede crear archivos TIFF y ejecutar el reconocimiento óptico de caracteres en las páginas del tipo que se desea capturar en forma de texto en vivo. Si el archivo TIFF no cumple las especificaciones de OCR , el software OCR muestra un mensaje de error que le advierte de que el archivo no se puede procesar correctamente o en absoluto . Compresión
El formato de archivo TIFF TIFF permite aplicar compresión de imágenes sin pérdida al guardar documentos en un programa de software que incorpora soporte para sistemas de compresión de archivos. Estas opciones pueden reducir el tamaño del archivo , pero no todos los programas de OCR apoyar a todos , o , tipos de compresión TIFF. Para obtener mejores resultados , guarde los archivos TIFF sin compresión para que sean tan fáciles de usar como sea posible.
Baja resolución
Si usted está familiarizado con la resolución utilizada para mapas de bits en las páginas web , usted puede preguntarse por qué un archivo de 72 píxeles por pulgada que se ve bien cuando se ve en un navegador web produce resultados de baja calidad en su programa de OCR. Eso es porque el software de OCR necesita un archivo que dedica suficientes píxeles para cada carácter de texto para que sea reconocible por los algoritmos que procesan las imágenes. Para obtener los mejores resultados, es necesario al menos un escaneo de 150 ppp , si no más . La apertura de un análisis de 72 ppi y nuevo muestreo a 300 ppi sólo hace que el archivo más grande sin la mejora de la calidad de imagen . Para obtener mejores resultados , comience con alta resolución o vuelva a explorar para alcanzarlo.
Imágenes Crooked
Es difícil establecer una hoja de papel en la cubierta de imágenes de un escáner sin la hoja a la deriva un poco torcida en la superficie lisa de vidrio . Los momentos que pasas el reposicionamiento de la hoja para que pueda obtener un scan de buena calidad a pagar en mejores resultados de OCR . Incluso un escaneo torcido claras y nítidas, pone una mayor presión sobre su programa de OCR que uno que ha capturado hacia arriba y hacia abajo. Para obtener mejores resultados , baje la tapa del escáner con cuidado lo que el movimiento del aire no moleste a su papel.
Otras consideraciones
Dependiendo del programa OCR que utilice , puede encontrar mensajes de error porque los archivos TIFF utilizan un modo de color que su software de OCR no soporta . Por ejemplo , si se ha capturado en alta resolución , archivos RGB de 16 bits para su uso en un proyecto de retoque , el programa de OCR puede frustrar en el tamaño del archivo o la profundidad de bits. Scans de páginas que incluyen fotografías o dibujos resultan molestos para algunos software de OCR , que puede presentar un mensaje de error que refleja el contenido de la página , no el formato de archivo. Por último , si el análisis representa el texto en una hoja de papel de color , puede tener problemas para capturar su texto ya que carece de suficiente contraste contra el fondo.