MATLAB es un acrónimo de "matriz de laboratorio " y se refiere a un lenguaje de programación de alto nivel y un entorno de programación desarrollado por técnicos de software MathWorks empresa. OCR es una abreviatura de " reconocimiento óptico de caracteres " y se refiere al proceso de lectura de datos en forma impresa y la identificación de patrones ópticos que corresponden a las letras , números y otros caracteres . OCR
Todos los pasos involucrados en OCR - segmentación, extracción de características y clasificación - se puede implementar utilizando MATLAB. Segmentación , que consiste en comprobar la conectividad de formas , y el etiquetado y el aislamiento de ellos, es la etapa más importante porque permite que el programa de OCR para extraer características de cada carácter individual . Segmentación de texto escrito a mano es particularmente difícil ya que los caracteres escritos a mano tienden a ser conectados entre sí . Extracción de características extrae las características más útiles , en términos de reconocimiento , de cada personaje y clasificación asigna las funciones a las clases de personaje .
Image Capture
Según un documento presentado a un seminario impartido por el Laboratorio de Lasin Synergetics en la Universidad de Ljubljana , OCR puede ser implementado en MATLAB utilizando el Neural Network Toolbox y Procesamiento de Imágenes Herramientas complementos . La primera etapa consiste en la lectura de la imagen en el espacio de trabajo de MATLAB como un archivo de mapa de bits. Este es un tipo de archivo gráfico en el que cada elemento de imagen , o píxel , corresponde a uno o más dígitos binarios , o bits , en la memoria . En el siguiente código se utiliza para esta tarea
I = imread ( ' training.bmp '); . Imshow ( I)
Conversión de imágenes
la siguiente etapa es la de convertir la imagen de color , que se almacena como rojo separada , verde y azul superposiciones , en una imagen de escala de grises , que consiste en tonos discretos de gris . El siguiente código de MATLAB convierte la imagen RGB en una imagen en escala de grises
iGray = rgb2gray (I ) . Imshow ( iGray )
Trilla
Posteriormente , una técnica conocida como " trillar " se utiliza para convertir la imagen en escala de grises en una imagen binaria . La célula de los códigos de MATLAB necesarias para convertir la imagen en escala de grises en una imagen binaria se ve algo como esto:
Ibw = im2bw ( iGray , graythresh ( iGray )); imshow ( PCI)
< br > Detección de bordes
Una vez creada la imagen binaria , caracteres individuales se recortan en sub-imágenes . Estos proporcionan los datos en bruto para la rutina de extracción de características . Las subimágenes deben ser recortadas drásticamente en la frontera de cada carácter , si han de ser de tamaño estándar , por lo que la detección del borde de cada carácter es importante . El borde de la imagen se puede detectar mediante el siguiente código de MATLAB
iedge = borde ( uint8 ( PCI) ) . Imshow ( iedge )
Objetos
.
Todos los objetos de una imagen - y las propiedades de cada objeto -
iLabel [ num ] = bwlabel ( Ifill ) se pueden determinar mediante el siguiente código de MATLAB ; disp ( num) ; Iprops = regionprops ( iLabel ) ; Ibox = [ Iprops.BoundingBox ] ; Ibox = remodelar ( Ibox , [ 4 de 50 ] ) ; imshow ( I)