Tesis profesional presentada por María Fernanda Maldonado Naude

Licenciatura en Ingeniería en Sistemas Computacionales. Departamento de Ingeniería en Sistemas Computacionales. Escuela de Ingeniería, Universidad de las Américas Puebla.

Jurado Calificador

Presidente: Dr. Daniel Vallejo Rodríguez
Vocal y Director: Dr. J. Alfredo Sánchez Huitrón
Secretario: Dra. Ingrid Kirschning Albers

Cholula, Puebla, México a 4 de diciembre de 2002.

Resumen

En este documento se describe a Hermes: un componente de bibliotecas digitales que permite recuperar información relevante mediante el uso de diferentes modelos de recuperación de información; procesadores de texto y consultas; y accesos a colecciones diferentes. Hermes propone una arquitectura con la que se logra la independencia de cada nivel, la cual permite su futura expansión agregando nuevos modelos, procesadores de texto y consultas o colecciones.

Hermes es un servidor que permite la conexión de diferentes aplicaciones, de modo que sus programadores puedan recuperar información de algún modelo y colección ya existente, evitando pérdidas de tiempo en la investigación e implementación de los mismos. Como resultado, las aplicaciones reciben la información sobre documentos considerados relevantes, su grado de similitud con la consulta, así como sus metadatos. Dichos metadatos se basan en el estándar de Dublin Core.

Se implementaron diferentes componentes. Dentro de los modelos de RI implementados encontramos los siguientes: modelo de indexación semántica latente, modelo booleano extendido, modelo de espacios vectoriales. Las colecciones disponibles son: la colección general de libros de la biblioteca de la UDLA, la colección de tesis digitales de U-DL-A y la colección de video de V_U_DL_A. Dentro de los procesadores de consultas y texto tenemos: la eliminación de palabras vacías y la lematización tanto en inglés, como en español.

En los siguientes capítulos se explica la arquitectura, la implementación, así como algunas pruebas realizadas en este proyecto. También se da una breve explicación sobre Recuperación de Información para tener una base teórica y finalizaremos con una serie de sugerencias como trabajo a futuro y conclusiones generales del mismo.

Palabras clave: recuperación de información, servidor, modelos, bibliotecas digitales.

Índice de contenido

Portada (archivo pdf, 32 kb)

Capítulo 1. Introducción (archivo pdf, 195 kb)

  • 1.1 Bibliotecas digitales
  • 1.2 Iniciativa científica del milenio
  • 1.3 U-DL-A (University Digital Libraries for All)
  • 1.4 Objetivos
  • 1.5 Organización del documento

Capítulo 2. Recuperación de Información (archivo pdf, 162 kb)

  • 2.1 Conceptos básicos
  • 2.2 Modelos de Recuperación de Información
  • 2.3 Modelo booleano extendido
  • 2.4 Modelo de indexación semántica latente (LSI)

Capítulo 3. Proyectos Relacionados (archivo pdf, 412 kb)

  • 3.1 Trabajo Previo
  • 3.2 Trabajo relacionado

Capítulo 4. Diseño de Hermes (archivo pdf, 264 kb)

  • 4.1 Componentes y términos
  • 4.2 Arquitectura de Hermes
  • 4.3 Procesos

Capítulo 5. Implementación de Hermes (archivo pdf, 280 kb)

  • 5.1 Programación
  • 5.2 Implementación general de Hermes
  • 5.3 Los procesadores de consultas y texto
  • 5.4 Los modelos de recuperación de información
  • 5.5 Los accesos a colecciones
  • 5.6 Metadatos obtenidos por Hermes
  • 5.7 Comunicación con Hermes

Capítulo 6. Extensión de Hermes (archivo pdf, 133 kb)

  • 6.1 Cómo agregar un procesador de consultas y texto
  • 6.2 Cómo agregar un modelo de recuperación de información
  • 6.3 Cómo agregar un acceso a una colección

Capítulo 7. Evaluación de resultados (archivo pdf, 348 kb)

  • 7.1 Pruebas de eficiencia en el proceso de recuperación de información
  • 7.2 Pruebas de eficiencia en la extensión de Hermes

Capítulo 8. Conclusiones (archivo pdf, 74 kb)

  • 8.1 Limitaciones
  • 8.2 Trabajo a futuro
  • 8.3 Conclusión general

Referencias (archivo pdf, 89 kb)

Apéndice A. Conexión con el IRServer vía RMI (archivo pdf, 83 kb)

Apéndice B. Métodos de Hermes (archivo pdf, 91 kb)

Apéndice C. Clase DocumentData y estándar de metadatos (archivo pdf, 69 kb)

Apéndice D. UML de Hermes (archivo pdf, 788 kb)

Maldonado Naude, M. F. 2002. Hermes: Servidor y biblioteca de modelos de recuperación de información. Tesis Licenciatura. Ingeniería en Sistemas Computacionales. Departamento de Ingeniería en Sistemas Computacionales, Escuela de Ingeniería, Universidad de las Américas Puebla. Diciembre. Derechos Reservados © 2002.