Detección sustantivos en las llamadas de Python para las habilidades de un programador y un lingüista . El propio idioma Inglés pone trampas para el lingüista computacional intrépido con su rica ambigüedad morfológica. Por ejemplo , la palabra " cruces " puede ser un sustantivo plural , o un verbo en tiempo presente en tercera persona . Afortunadamente , los creadores del lenguaje natural Toolkit Módulo Python han desarrollado un etiquetador parte de discurso que da cuenta de estas dificultades y pueden etiquetar las palabras de frases en inglés con sus respectivas partes del habla, incluyendo sustantivos . Cosas que necesitará
Python 2.4 , 2.5 o 2.6 of Natural Language Toolkit Módulo Python
Ver Más instrucciones
1
descargar e instalar el módulo Python Lenguaje Natural Kit de herramientas de la página web del proyecto ntlk.org . Puede que tenga que instalar módulos adicionales para apoyar NLTK .
2
Abra una ventana de terminal y comenzar una sesión de Python Python escribiendo en el indicador de línea de comandos . Cuando Python está en marcha , invoque el módulo NLTK con el NLTK importación de comandos. Los mensajes y los comandos de tener este aspecto en Mac OS X :
My- MacBook -Pro : ~ PNA1 $ python
Python 2.6.1 ( r261 : 67.515 , Jun 24 2010, 21:47 : 49 )
[ GCC 4.2.1 (Apple Inc. build 5646 ) ] en darwin
Escriba " help" , "copyright" , "créditos " o " licencia " para obtener más información.
>>> import NLTK
>>>
3
invocación por parte de etiquetador discurso e introduzca la frase que desea detectar sustantivos escribiendo los siguientes comandos y los datos en el prompt de Python :
>>> text = nltk.word_tokenize ( " el hombre cruza la calle a vender cruces. ") < br >
>>> nltk.pos_tag (texto)
4
Pulse la tecla de retorno después >>> nltk.pos_tag (texto)
[ ,"( ' el ', ' DT ' ) , ( 'hombre' , ' NN ' ) , ( ' cruces ', ' VBZ ' ) , ( ' el ', ' DT ' ) , ( 'street ', ' NN ' ) , ( 'a' , ' a ' ) , ( ' vender ', ' VB ' ) , ( ' cruces ', ' NNS ' ) , ('. ', ' .') ]
>> >
NLTK ha etiquetado correctamente cada palabra de la frase. En particular, se ha detectado los sustantivos y los etiquetados como sustantivos singulares con NN (hombre , calle) y los sustantivos en plural con NNS (cruces) y ha marcado correctamente la primera aparición de cruces como un verbo con el tag VBZ .