Tesis profesional presentada por
Licenciatura en Ingeniería en Sistemas Computacionales. Departamento de Ingeniería en Sistemas Computacionales. Escuela de Ingeniería, Universidad de las Américas Puebla.
Jurado Calificador
Presidente: Dr. J. Alfredo Sánchez
Huitrón
Vocal y Director: Dra. Ingrid Kirschning
Albers
Secretario: Mtra. Carolina Yolanda
Castañeda Roldán
Cholula, Puebla, México a 11 de diciembre de 2001.
El objetivo principal de los sistemas de reconocimiento de voz es proveer una forma más natural de interacción humano-computadora.
En la actualidad existen diversos laboratorios de investigación que han desarrollado distintos trabajos en el área de reconocimiento de voz. El objetivo principal de estas investigaciones es crear sistemas de reconocimiento del lenguaje hablado capaces de reconocer voz con las menores restricciones posibles. Uno de estos laboratorios es el Center for Spoken Language Understanding (CSLU) del Oregon Graduate Institute (OGI), el cual ha desarrollado un conjunto de herramientas llamada CSLU Toolkit, en el cual se cuenta con utilerías para la investigación, desarrollo y transferencia de tecnología de sistemas de reconocimiento de voz. Estas herramientas apoyan a varias actividades involucradas en la creación de sistemas de reconocimiento tales como: procesamiento de señales, colección de datos de voz, reconocimiento del lenguaje hablado y desarrollo de aplicaciones, entre otras
El objetivo de esta investigación es diseñar e implementar un Sistema Tutor Animado para la enseñanza del lenguaje hablado en México usando el CSLU Toolkit. Para tal efecto es necesario entrenar un reconocedor de voces de niños, que es a quien va dirigido el proyecto. Dicho reconocedor será una primera versión que servirá de base para futuras investigaciones.
Capítulo 1. Introducción (archivo pdf, 54 kb)
Capítulo 2. Los sistemas tutores y el reconocimiento y síntesis de voz (archivo pdf, 346 kb)
Capítulo 3. Utilización del CSLU Toolkit en un prototipo de sistema tutor (archivo pdf, 455 kb)
Capítulo 4. Desarrollo de un corpus de voz de niños (archivo pdf, 330 kb)
Capítulo 6. Implementación del Sistema Tutor Animado (archivo pdf, 219 kb)
Capítulo 7. Resultados y Conclusiones (archivo pdf, 64 kb)
Referencias (archivo pdf, 46 kb)
Apéndice A. Protocolos del corpus de voz (archivo pdf, 52 kb)
Apéndice B. Estadísticas de las grabaciones (archivo pdf, 435 kb)
Luna Moreno, T. 2001. Diseño e Implementación de un Sistema Tutorial basado en Tecnologías de Voz para la Enseñanza de Vocabulario. Tesis Licenciatura. Ingeniería en Sistemas Computacionales. Departamento de Ingeniería en Sistemas Computacionales, Escuela de Ingeniería, Universidad de las Américas Puebla. Diciembre. Derechos Reservados © 2001.