La página Web que aparece en el navegador no muestra todo en la página . Detrás de las escenas, el navegador carga constante de contenido que contiene código HTML críptica . Este código se compone de "etiquetas" como "
. " Esa etiqueta indica al navegador que muestre un párrafo en la página Web. Con C # , el lenguaje de desarrollo de Microsoft que funciona con Visual Studio , puede convertir HTML de cualquier sitio para el texto y eliminar las etiquetas. Instrucciones
1
lanzamiento Microsoft Visual Studio. Haga clic en " Archivo" y luego en " Nuevo proyecto ".
2 Haga clic en " Visual C #" para resaltarlo y haga doble clic en " Aplicación de Windows Forms ". Visual Studio creará un nuevo proyecto y mostrar una forma vacía de la ventana de diseño.
3
Haga clic en " Ver " y luego haga clic en "Caja de herramientas " para abrir la caja de herramientas . Desplácese hacia abajo para el control WebBrowser , y haga doble clic en él. Aparecerá Ese control en el formulario. Nombres de Visual Studio que " webBrowser1 . "
4
Press "F4 ". Se abrirá la ventana " Propiedades" . Busque el icono de "Lightning Bolt " en la parte superior de la ventana. El icono tiene la forma de un rayo. Haga clic en el icono. La ventana de "Propiedades " le mostrará una lista de eventos que se pueden adjuntar al control " webBrowser1 " .
5
Busque el elemento " DocumentCompleted " en la lista y haga doble clic en él. Una ventana de código se abre y muestra el siguiente código: private void
webBrowser1_DocumentCompleted ( object sender, WebBrowserDocumentCompletedEventArgs e)
{
}
Este código se ejecuta cada vez que el control " webBrowser1 " finaliza la carga de una página web
6
modificar el código para que se vea así: .
webBrowser1_DocumentCompleted private void ( object sender , WebBrowserDocumentCompletedEventArgs e)
{
HtmlDocument doc = webBrowser1.Document ;
cadena websiteText = doc.Body.InnerText ;
MessageBox.Show ( websiteText ) ;
< p >}
Después de cargar la página web , el código toma el texto de la página. A continuación, se muestra el texto en un cuadro de mensaje emergente.
7
Haga clic en cualquier lugar en la ventana de código y , a continuación, haga clic en " View Designer. " La forma volverá a aparecer en la ventana de diseño.
8
Haga doble clic en la barra de título de esa forma. Aparecerá otra ventana de código y mostrar método de " carga " del formulario. El código de este método se ejecuta cuando se carga el formulario . El código aparece como se muestra a continuación :
private void Form1_Load ( object sender, EventArgs e) {
}
9
reemplazar ese código con el siguiente código :
private void Form1_Load ( object sender, EventArgs e) {
web string = " http://www.whitehouse.gov " ;
WebBrowser1.Navigate ( sitio web) ;
}
Este código hace que el control " webBrowser1 " para ir a la página web URL almacenada en la variable llamada " página web ". En este ejemplo, la URL es " http://www.whitehouse.gov . "
10
Press "F5 " para ejecutar el código. El formulario se carga y ejecuta el código " Form1_Load " . Este código hace que el control " webBrowser1 " para acceder al sitio web " whitehouse.gov " . El código " DocumentCompleted " se ejecutará después de que el navegador finaliza la carga de ese sitio. Un cuadro de mensaje emergente le mostrará el texto de ese sitio sin las etiquetas HTML.