El " jsoup " biblioteca de Java contiene una función que elimina una cadena Java de todas las etiquetas HTML y convierte el contenido a texto sin formato . Este módulo es muy útil cuando se desea descargar páginas web y sitio web HTML y evaluar sólo el texto en su programa. El contenido se dejó , así que usted puede guardar el contenido de una base de datos o almacenar el contenido en un archivo en el servidor local. Instrucciones
1
Haga clic en el archivo Java que desea editar y seleccione " Abrir con". Haz clic con el editor applet de Java en la lista de programas para abrir el código.
< Br > 2
Busque la cadena HTML que desea analizar y crear la variable de texto sin formato. El siguiente código crea una variable para almacenar el contenido HTML analizada :
documento de texto plano = null;
3
analizar el HTML a texto sin formato y guardar el resultado a la " ; variable de texto plano " . El código siguiente muestra cómo analizar las etiquetas HTML :
texto plano = Jsoup.parse ( html) ;
Reemplazar "html " con su propia cadena HTML
.