El lenguaje VB.NET incluye una clase de análisis de HTML que se utiliza para extraer los valores HTML de las páginas Web . Usar los datos analizados para evaluar contenido en un sitio y devolver la información a un usuario o almacenar la información extraída de una base de datos . La clase de análisis de HTML le permite leer el contenido del texto o los valores de los elementos de formulario como cuadros de texto o cuadros desplegables . Instrucciones
1
Abra el software de Visual Studio en el " . Microsoft NET Framework " grupo de programas . Abra el proyecto VB después de cargas de Visual Studio .
2 Haga clic en el nombre del proyecto en el " Solution Explorer" panel y seleccione " Propiedades". Haga clic en el . " NET " ficha , a continuación, haga doble clic en el archivo DLL llamado " Microsoft.mshtml . " Esta DLL incluye las clases va a analizar HTML.
3
Agregar a la biblioteca para el archivo de código VB que desea utilizar para analizar el HTML. Copia y pega el siguiente comunicado VB a la parte superior del archivo de código :
Importaciones mshtml
4
instancia de la clase " HTMLDocument " . Esta clase importa el texto HTML que se importa desde una página Web o una cadena y establece la información para el análisis. Agregue el siguiente código a su función de análisis :
ParseHTML As IHTMLDocument2 = New HTMLDocumentClass () HTMLData As IHTMLElementCollection = parseHTML.body.all
5
recuperar contenido de la cadena HTML . Por ejemplo , el código siguiente recupera el valor de un cuadro de texto HTML de una página Web:
tbData As IHTMLInputElement = allElements.item ( " TextBox1 ") MsgBox "Se trata de los datos en el cuadro de texto : "& tbData.Value