| Casa | Hardware | Redes | Programación | software | Criticar | Sistemas |   
software  
  • Adobe Illustrator

  • Software de Animación

  • Antivirus Software

  • Software Audio

  • Copia de seguridad de datos

  • Grabar CDs

  • Grabar DVDs

  • compresión de datos

  • Software de base de datos

  • edición

  • desktop Video

  • Software de vídeo digital

  • Drupal

  • Software Educativo

  • Ingeniería del Software

  • Tipos de extensiones de archivos

  • Software financiero

  • Freeware , Shareware y Abandonware

  • GIMP

  • Graphics Software

  • Software Home Recording

  • Microsoft Access

  • Microsoft Excel

  • Microsoft Publisher

  • Microsoft Word

  • Código abierto

  • Otro Software Informática

  • Juegos de PC

  • Photoshop

  • Formato de Documento Portátil

  • PowerPoint

  • Software para presentaciones

  • Software de Productividad

  • Quicktime

  • Gestión de Escritorio remoto

  • SQL Server

  • Skype

  • Software versiones beta

  • Consultores de Software

  • Las compañías de desarrollo de software

  • Licencias de software

  • Hojas de cálculo

  • Impuestos-Preparación de Software

  • Software de utilidades

  • Web Clip Art

  • Windows Media Player

  • Software de Procesamiento de Texto
  •  
    Conocimientos Informáticos >> software >> Formato de Documento Portátil >> Content
    Cómo indizar y buscar un archivo PDF en Java Con Lucene
    Apache Lucene es un motor de búsqueda de texto de la biblioteca con todas las funciones escritas en Java. Usted puede utilizar Lucene para indexar y buscar cualquier tipo de documento de texto. Para convertir un formato de documento portátil (PDF) en un formato de texto que puede Lucene índice , puede utilizar la clase de código abierto PDFBox que tiene métodos especiales específicamente para Lucene. Sólo es necesario que el nombre del archivo PDF a PDFBox y obtener un objeto del documento Lucene que se puede agregar al índice y buscó al igual que cualquier archivo de texto. Instrucciones
    1

    Seleccione un analizador de Lucene para utilizar en la creación del índice, por ejemplo, " StandardAnalyzer . " Crear un objeto " IndexWriter " para manejar la adición de nuevos elementos en el índice , por ejemplo :

    IndexWriter myWriter = new IndexWriter ( "index" , nuevo StandardAnalyzer () , true) ;
    2 < p > Llamada " LucenePDFDocument " para obtener un objeto de documento Lucene de su archivo PDF . Agregar otros campos clave para el objeto y agregar el objeto con el índice de Lucene. Por ejemplo :

    Documento PDFDoc = LucenePDFDocument.getDoument (filename ) ;

    pdfDoc.add ( nueva Field ( "title" , pdf.getTitle (), Field.Store.YES , Campo . Index.TOKENIZED ));

    pdfDoc.add ( nueva Field ( "autor " , pdf.getAuthor (), Field.Store.YES , Field.Index.TOKENIZED ));

    myWriter . addDocument ( PDFDoc ) ;
    3

    Utilice la clase " buscadores " para buscar el índice de Lucene. " Buscadores " devuelve un objeto Lucene " Hits" con una lista de objetos " Hit " . Por ejemplo :

    buscadores Mysearch = new buscadores ();

    Impactos myHits = mySearch.performSearch ( buscarTexto ) ;

    System.out.println ( " Documentos encontrados: " + myHits.length ());
    4

    Iterar a través de los objetos " éxito" para obtener más información acerca de cada partido . Los objetos " éxito" se ordenan por relevancia en la búsqueda , y también se puede obtener la puntuación de búsqueda en relación con " getScore (). " Por ejemplo :

    Iterator ITR = myHits.iterator ();

    while ( itr.hasNext ()) {

    Hit theHit = itr.next () ;

    documento theDoc = theHit.getDocument ();

    System.out.println ( theDoc.get ( "title" ) + " - " + theHit.getScore ()); < br >

    }

    Previous :

    next :
      Artículos relacionados
    ·Cómo aplicar un contador de visitas a una página PDF 
    ·Cómo hacer una imagen copiada de un archivo PDF 
    ·Cómo extraer los archivos PDF a Word 
    ·Cómo adjuntar una firma PDF 
    ·Cómo Crear Adobe PDF desde Word 
    ·Cómo poner una contraseña en un archivo PDF en Linux 
    ·¿Cómo colocar texto en un PDF 
    ·Cómo agregar texto a un PDF en Vista Previa 
    ·Cómo abrir un archivo PDF en Flash 
    ·Cómo editar archivos PDF en Acrobat 8 
      Artículos destacados
    ·Cómo cerrar Skype en un Mac 
    ·Cómo desactivar la barra de herramientas de ZoneAlarm 
    ·¿Cuál es la extensión de archivo Pwl 
    ·Cómo hacer copia de seguridad de todos los archivos de…
    ·¿Qué programas antivirus Trabaja con Dial -Up 
    ·Cómo solucionar problemas de APC batería de reserva 
    ·Archivo PDF Resolución de problemas 
    ·Cómo restablecer una Inicialización de identidad en M…
    ·Cómo quitar hipervínculos en VBA 
    ·¿Cómo hacer el fuego Texto en Photoshop 
    Copyright © Conocimientos Informáticos http://ordenador.wingwit.com