Tesis profesional presentada por Omar Castillo Condado

Licenciatura en Ingeniería en Sistemas Computacionales. Departamento de Ingeniería en Sistemas Computacionales. Escuela de Ingeniería, Universidad de las Américas Puebla.

Jurado Calificador

Presidente: Dr. Mauricio Javier Osorio Galindo
Vocal y Director: Dr. Oleg Starostenko
Secretario: Dra. Ingrid Kirschning Albers

Cholula, Puebla, México a 8 de diciembre de 1999.

Resumen

Este trabajo muestra la evaluación del desempeño de un reconocedor fonético para el español hablado en México. Un reconocedor fonético tiene la función de reconocer pero sin la influencia de restricciones léxicas y sintácticas.El experimento base aquí presentado fue hecho en base a modelos independientes del contexto. Después se mejoró el experimento base modificando los límites de duraciones y empleando modelos dependientes del contexto. Si los modelos fonéticos son mejores, el sistema entero tendrá un mejor desempeño en cualquier aplicación y con cualquier vocabulario. Los resultados aquí presentados proveen un punto de partida para medir mejoras obtenidas con otros métodos o técnicas.

Índice de contenido

Índices (archivo pdf, 58 kb)

Glosario (archivo pdf, 38 kb)

Introducción (archivo pdf, 44 kb)

  • 1 Reconocimiento fonético
  • 2 Características del reconocimiento fonético
  • 3 Planteamiento del problema
  • 4 Objetivo general
  • 5 Objetivos específicos

Capítulo 1. El reconocimiento de voz (archivo pdf, 276 kb)

  • 1.1 Antecedentes
  • 1.2 Características Acústicas
  • 1.3 Componentes básicos de un reconocedor
  • 1.4 Tipos de reconocedores
  • 1.5 Aplicaciones
  • 1.6 Representaciones de la señal de voz

Capítulo 2. El CSLU toolkit (archivo pdf, 132 kb)

  • 2.1 Arquitectura del CSLU toolkit
  • 2.2 El proceso de reconocimiento basado en frames
  • 2.3 Modelado dependiente del contexto
  • 2.4 División del fonema en partes
  • 2.5 Redes neuronales y el CSLU toolkit
  • 2.6 Entrenamiento de una red neuronal

Capítulo 3. El corpus de voz (archivo pdf, 190 kb)

  • 3.1 Tlatoa Common Questions Corpus
  • 3.2 Condiciones de grabación
  • 3.3 División del corpus
  • 3.4 Protocolo de etiquetado
  • 3.5 Formato y estructura de los archivos

Capítulo 4. Experimento base (archivo pdf, 116 kb)

  • 4.1 Conjunto de fonemas del vocabulario
  • 4.2 Distribución de los datos
  • 4.3 Otras investigaciones similares
  • 4.5 Fase de entrenamiento
  • 4.6 Fase de desarrollo
  • 4.7 Resultados con CSLU toolkit
  • 4.8 Nist
  • 4.9 Resultados finales (con NIST)

Capítulo 5. Mejoras y prueba final (archivo pdf, 380 kb)

  • 5.1 Experimentos independientes del contexto
  • 5.2 Categorías dependientes del contexto
  • 5.3 Número de partes
  • 5.4 Experimentos dependientes del contexto
  • 5.5 Fase de prueba final
  • 5.6 Prueba a nivel palabras

Capítulo 6. Conclusiones y trabajo a futuro (archivo pdf, 41 kb)

Referencias (archivo pdf, 39 kb)

Apéndice A. Archivos definidos para entrenamiento (archivo pdf, 53 kb)

Apéndice B. Convierte.tcl (archivo pdf, 57 kb)

Castillo Condado, O. 1999. Evaluación de un reconocedor fonético para el español hablado en México. Tesis Licenciatura. Ingeniería en Sistemas Computacionales. Departamento de Ingeniería en Sistemas Computacionales, Escuela de Ingeniería, Universidad de las Américas Puebla. Diciembre. Derechos Reservados © 1999.