Tesis profesional presentada por Gabriela Marisol Fierro Ayón

Licenciatura en Ingeniería en Sistemas Computacionales. Departamento de Computación, Electrónica y Mecatrónica. Escuela de Ingeniería y Ciencias, Universidad de las Américas Puebla.

Jurado Calificador

Presidente: Dr. José Luis Zechinelli Martini
Vocal y Director: Dr. Oleg Starostenko
Secretario: Dra. Ingrid Kirschning Albers

Cholula, Puebla, México a 16 de enero de 2008.

Resumen

Este trabajo presenta un sistema para generar el resumen automático de una página Web en español, el algoritmo está basado en la técnica de selección, la cual toma las oraciones más relevantes del documento y las presenta como el resumen. Se hizo una comparación entre dos métricas, la primera usa una combinación de palabras clave, términos multipalabra, tipografía y título del documento; la segunda combinación solamente tomó en cuenta las palabras clave y los términos multipalabra del documento.

El sistema utiliza como recursos el archivo que contiene las palabras cerradas del idioma español y el documento del que se desea el resumen.

Índice de contenido

Portada (archivo pdf, 13 kb)

Capítulo 1. Introducción (archivo pdf, 24 kb)

  • 1.1 Antecedentes
  • 1.2 Definición del problema
  • 1.3 Objetivo General
  • 1.4 Objetivos Específicos
  • 1.5 Alcances
  • 1.6 Limitaciones
  • 1.7 Organización del documento

Capítulo 2. Marco Teórico (archivo pdf, 76 kb)

  • 2.1 Métodos para la Generación del Resumen Automático
  • 2.2 Técnica del Punto de Transición
  • 2.3 Términos Multipalabra
  • 2.4 Uso del paquete javax.swing.text.html

Capítulo 3. Diseño del Sistema (archivo pdf, 43 kb)

  • 3.1 Algoritmo para la generación automática del extracto
  • 3.2 Estructuras de Datos
  • 3.3 Módulos
  • 3.4 Archivos

Capítulo 4. Implementación del Sistema (archivo pdf, 25 kb)

Capítulo 5. Pruebas y Evaluación (archivo pdf, 129 kb)

Capítulo 6. Conclusiones y Trabajos a Futuro (archivo pdf, 12 kb)

  • 6.1 Conclusiones
  • 6.2 Trabajos a Futuro

Referencias (archivo pdf, 14 kb)

Anexo A. Ejemplo de documento (archivo pdf, 15 kb)

Anexo B. Documento con sus términos multipalabra (archivo pdf, 17 kb)

Anexo C. Documentos usados en las pruebas (archivo pdf, 26 kb)

Anexo D. Manual del Usuario (archivo pdf, 19 kb)

Anexo E. Palabras Cerradas (archivo pdf, 26 kb)

Fierro Ayón, G. M. 2008. Generación Automática del Resumen para Páginas Web en Español. Tesis Licenciatura. Ingeniería en Sistemas Computacionales. Departamento de Computación, Electrónica y Mecatrónica, Escuela de Ingeniería y Ciencias, Universidad de las Américas Puebla. Enero. Derechos Reservados © 2008.