existen herramientas de análisis de texto para los administradores de sistemas y diseñadores web que necesitan para buscar grandes cantidades de texto para determinar la estructura y organización de la computadora, los scripts del sistema o de los documentos de seguimiento marcar. Guiones rápidos y sucios SED y Perl en torno expresiones regulares son a menudo bastante para trabajos sencillos , pero al analizar los documentos XML complejas exige una herramienta más robusta , como la biblioteca elementtree del lenguaje de programación Python . Cosas que necesitará
Python 2.5 o superior
Ver Más instrucciones
1
iniciar una sesión de terminal o , si lo prefieres , abre el Python entorno de desarrollo integrado , conocido como IDLE, que se puede encontrar en el directorio de Python en la unidad C ( Windows) o la carpeta Aplicaciones ( Mac) . Compruebe su versión de Python escribiendo python- v en la línea de comandos. Elementtree es parte de la biblioteca estándar de Python a partir de Python 2.5 . Si tienes Python 2.4 o anterior, hay que descargarlo desde la página principal de Python.
2
Determinar el tipo de datos codificados en un documento XML mediante la lectura de la etiqueta raíz . En la línea de comandos, carga elementtree y su función de análisis con el siguiente comando :
> de elementtree.ElementTree importación parse
3
Localice el archivo que desea analizar y tomar nota de su trayectoria en relación con la del intérprete de Python, o simplemente mover el archivo a la carpeta Documentos. Establecer una variable para el archivo, leer en la memoria y descubrir el tipo de datos que contiene el archivo con el siguiente comando : > árbol = elementtree ( file = filename) > elem = tree.getroot ()> print elem < br >
Esto revelará el tipo de datos codificados en el documento XML.