Convertir un archivo HTML en un archivo de texto de Unix no es tan difícil como parece. Un archivo de texto Unix es simplemente un archivo de texto \\ " regular \\ " de Windows con diferentes marcadores de fin de línea . (Unix utiliza el carácter de avance de línea o LF , . Windows utiliza una combinación de retorno de carro y caracteres de avance de línea , o CRLF ) Convertir en un archivo Unix , todo lo que tiene que hacer es cambiar los finales de línea de los correctos . Una conversión no suele ser necesario ya que la mayoría de los programas de forma transparente manejar la conversión , pero en caso de tener que hacer esta conversión, los pasos son sencillos. Instrucciones
desde Windows
1
convertir el archivo HTML en un archivo de texto plano. Los navegadores modernos como Internet Explorer y Firefox pueden guardar archivos HTML como texto sin formato . Abra el archivo en el navegador. Pulse \\ "Guardar como \\ " o \\ " Guardar página como \\ " en el menú archivo. Seleccione \\ " Archivo de texto \\ " en \\ "Guardar como \\ tipo " cuadro de diálogo para convertir el archivo .
2
Convertir el archivo de texto a un archivo de texto Unix . En Windows , utilice un editor de texto avanzado . Abra el archivo en el editor. Busque \\ "Convertir a formato Unix \\ " (o similar) en \\ " Herramientas \\ " o \\ "Opciones \\".
3
Compruebe que el archivo se convirtió . Desde el editor de texto avanzado , seleccione \\ " Mostrar fin de línea \\ " en \\ " View. \\ " Todos los finales de línea deben ser \\ "LF . \\ "
a partir de Unix /Linux
4
Convertir el archivo HTML en un archivo de texto plano. Utilice un navegador o la utilidad de línea de comandos estándar de \\ "lynx . \\ " En un terminal, escriba \\ "lynx -dump URL > filename \\ " para convertir una página web en un archivo de texto plano. < Br > Página 5
convertir el archivo de texto a un archivo de texto Unix utilizando el estándar \\ "tr \\ " de utilidad. Si ha utilizado un programa de Unix /Linux en el Paso 1 para convertir el archivo HTML, no será necesario este paso. En una terminal, teclee \\ "tr -d ' \\ \\ r ' < TEXT_FILE > CONVERTED_FILE . \\ "
6
Compruebe que el archivo se convirtió. Utilice el programa de \\ " gato \\ ", que también es estándar en los sistemas Unix /Linux. En una terminal, teclee \\ "cat - E archivo \\ " para ver el archivo . Todos los finales de línea deben ser el símbolo del dólar ($). ( Si ves una "M ^ \\ " carácter \\ , entonces los finales de línea están en el formato de Windows. )