Bibliotecas de reconocimiento óptico de caracteres Tesseract ofrecen a los desarrolladores un método para escanear documentos y textos a la imagen . Utiliza las bibliotecas Tesseract para almacenar imágenes de documentos que ya no necesita en forma impresa . Utiliza bibliotecas Tesseract en Java por un bucle a través de cada personaje y escribir el carácter en un archivo. Para utilizar las bibliotecas , debe incluir el espacio de nombres de Java para las funciones de OCR. Instrucciones
1
Haga clic en el archivo Java que desea utilizar para crear el documento OCR. Haga clic en " Abrir con " y seleccione su editor Java preferido.
2
Agregue el espacio de nombres de biblioteca de OCR en la parte superior del archivo. Copia y pega el siguiente código en su archivo de código fuente:
com.tplan.robot.imagecomparison.tesseractocr
3
Crear el código que analiza los caracteres en el archivo. Por ejemplo, el siguiente código recorre cada carácter de un archivo y lo escribe en un archivo de imagen :
Var líneas = método 0Compareto = " TOCR " cmparea = "x: 33 , y: 2 , w : 200 , h: 22 " for (i = 1 , { i } < { líneas } 1 ; i = { i } 1 ) { Typeline " _TOCR_LINE { { i } } "}
< br > 4
Haga clic en botón " Guardar" del editor de Java y haga clic en "Ejecutar " para ejecutar el código en un depurador de Java.