Ubuntu proporciona herramientas gráficas y de línea de comandos para convertir archivos de documento portátil ( PDF) en formato de texto . La versión de línea de comandos, " pdftotext " , automatiza el proceso al incluir el comando de conversión en un script de shell. De esta manera, varios archivos PDF se pueden cambiar al mismo tiempo. Un número de opciones de línea de comandos se proporcionan con el comando enable acciones específicas ( por ejemplo, sólo la conversión de las primeras páginas ), que tendrá lugar cada vez que se ejecuta . Obtención pdftotext
obtener los paquetes y comandos " pdftotext " de las bibliotecas de Ubuntu a través de comandos apropiadas :
sudo apt- get install poppler -utils
Asegúrese de que el paquete se instala correctamente antes de utilizarlo.
pdftotext Man Página
Aprenda cómo funciona el comando pdftotext y familiarizarse con las opciones de línea de comandos disponibles . Mire la página de manual del comando escribiendo " hombre pdftotext " en la línea shell de comando y presione " Enter" . Las opciones de línea de comandos se componen de letras, precedidos por un guión , por ejemplo " -l" , y todos ellos ofrecen diferentes funciones.
El comando estándar para pdftotext es " pdftotext " (sin comillas) , donde es el nombre del archivo PDF para extraer , por ejemplo " report.pdf " y es el nombre del archivo de salida de texto, como " report.txt " . Puede utilizar cualquier nombre que desee .
Lotes PDF Conversion
prueba el comando intentarlo en unos pocos archivos PDF de forma individual . Si está bien es posible que desee para tratar de usarlo en varios archivos PDF en shell scripts para automatizar el proceso. Un ejemplo de un guión típico se muestra a
for i in * pdf
en
pdftotext $ i $ i.txt
hacer < . br>
Este script toma todos los archivos PDF en el directorio actual y los exporta con el nombre a un archivo de texto , por lo que " report.pdf " se convertiría en " report.pdf.txt "
< br > Archivos PDF protegidos
Algunos archivos PDF están protegidos , ya sea con o contraseñas establecidas para prevenir la exportación de texto del documento . Este es un intento de proteger los derechos de autor y si este es el caso tal vez había reconsiderar mejor la conversión desde una perspectiva legal. Si tiene la contraseña de un archivo PDF , esto puede ser aprobada en las opciones de línea de comandos para " pdftotext "
.