Puede ser muy frustrante para tratar de extraer el texto de un archivo PDF para su uso en otra aplicación. No es raro que los gráficos para ponerse en el camino o para la presentación del documento para que sea difícil para que la prueba se transfiere en frases con sentido . Aunque no es imposible extraer texto con un enfoque de copiar y pegar , puede llevar mucho tiempo y no se permitirá para el texto del archivo PDF para su exportación como un formato diferente. Hay , sin embargo, algunas formas de extraer texto de un archivo PDF . Cosas que necesitará
PDF file
Adobe Reader cuenta de Gmail
Acrobat ( opcional)
PDF con el software de conversión de texto ( opcional)
Mostrar más instrucciones
Extracto de texto usando Acrobat Reader
1
Abra el archivo en Acrobat Reader. En Windows , seleccione " Archivo -> Exportar documento de texto", nombre del documento y guardarlo
2
Copiar el texto en un Mac o Linux OS accediendo al menú Ver y seleccionando " . continua "o " Continuous - Orientación . " ( El primero le proporcionará el texto en una columna, mientras que el segundo dará formato al texto como páginas lado a lado . ) Vaya a " Editar - > Seleccionar todo " y luego " Editar - > Copiar. "
3
Utilice la herramienta Seleccionar si solo deseas extraer parte del texto . Haga clic en la herramienta "Text Select " y luego elegir la información que desea . En un documento con formato de varias columnas, tendrá que utilizar la "Columna Seleccione" herramienta de primera . Ir a "Editar - . > Copiar "
Convertir PDF a HTML
4
Uso Gmail como un acceso directo . Adjunte el archivo PDF a un correo electrónico y enviarlo a su cuenta de Gmail . Al abrir el correo electrónico , verá una serie de opciones junto al archivo adjunto . Seleccione la opción " Ver como HTML" y guardar el archivo que se abrirá en una ventana separada . Aunque usted no será capaz de ver los gráficos , el archivo HTML se conserva el formato del texto del documento.
5
Extrae y convierte los archivos en la línea de comandos. Los usuarios de Linux pueden utilizar un dominio básico de conversión que va a cambiar un archivo pdf a un archivo txt: . ". Pdftotext filename.pdf . " Asegúrese de cambiar el nombre del archivo con el nombre del archivo PDF .
6
Descarga un PDF con el programa de conversión de texto. Hay una serie de programas gratuitos disponibles, como PDFBox y Easy PDF to Text Converter ( ver Recursos más adelante ) y la fuente abierta. Muchos de estos programas también puede convertir archivos PDF a HTML también.