Luna Moreno, Tsuneyuki

Tesis profesional presentada por Tsuneyuki Luna Moreno

Licenciatura en Ingeniería en Sistemas Computacionales. Departamento de Ingeniería en Sistemas Computacionales. Escuela de Ingeniería, Universidad de las Américas Puebla.

Jurado Calificador

Presidente: Dr. J. Alfredo Sánchez Huitrón
Vocal y Director: Dra. Ingrid Kirschning Albers
Secretario: Mtra. Carolina Yolanda Castañeda Roldán

Cholula, Puebla, México a 11 de diciembre de 2001.

Resumen

El objetivo principal de los sistemas de reconocimiento de voz es proveer una forma más natural de interacción humano-computadora.

En la actualidad existen diversos laboratorios de investigación que han desarrollado distintos trabajos en el área de reconocimiento de voz. El objetivo principal de estas investigaciones es crear sistemas de reconocimiento del lenguaje hablado capaces de reconocer voz con las menores restricciones posibles. Uno de estos laboratorios es el Center for Spoken Language Understanding (CSLU) del Oregon Graduate Institute (OGI), el cual ha desarrollado un conjunto de herramientas llamada CSLU Toolkit, en el cual se cuenta con utilerías para la investigación, desarrollo y transferencia de tecnología de sistemas de reconocimiento de voz. Estas herramientas apoyan a varias actividades involucradas en la creación de sistemas de reconocimiento tales como: procesamiento de señales, colección de datos de voz, reconocimiento del lenguaje hablado y desarrollo de aplicaciones, entre otras

El objetivo de esta investigación es diseñar e implementar un Sistema Tutor Animado para la enseñanza del lenguaje hablado en México usando el CSLU Toolkit. Para tal efecto es necesario entrenar un reconocedor de voces de niños, que es a quien va dirigido el proyecto. Dicho reconocedor será una primera versión que servirá de base para futuras investigaciones.

Índice de contenido

Índices (archivo pdf, 60 kb)

Prefacio (archivo pdf, 41 kb)

Capítulo 1. Introducción (archivo pdf, 54 kb)

1.1 Antecedentes
1.2 Importancia del trabajo
1.3 Planteamiento del problema
1.4 Objetivos

Capítulo 2. Los sistemas tutores y el reconocimiento y síntesis de voz (archivo pdf, 346 kb)

2.1 Empleo, alcances y limitaciones de los sistemas tutores
2.2 Nuevas tecnologías en el ámbito educativo
2.3 Algunos aspectos de diseño del software educativo
2.4 Reconocimiento y síntesis de voz

Capítulo 3. Utilización del CSLU Toolkit en un prototipo de sistema tutor (archivo pdf, 455 kb)

3.1 Arquitectura del CSLU Toolkit
3.2 Prototipo de un sistema tutor utilizando el CSLU Toolkit

Capítulo 4. Desarrollo de un corpus de voz de niños (archivo pdf, 330 kb)

4.1 Corpora de Voz
4.2 Diseño del corpus
4.3 Transcripción del corpus de voz
4.4 Órganos Articulatorios
4.5 Ejemplo de una herramienta para generar las transcripciones y las etiquetas (CSLU Toolkit)
4.6 Consideraciones especiales de etiquetado a nivel de texto
4.7 Acerca de la conexión de etiquetas especiales

Capítulo 5. Reconocimiento de voz usando redes neuronales artificiales del CSLU (archivo pdf, 290 kb)

5.1 El proceso de Reconocimiento
5.2 Modelado dependiente del contexto
5.3 Redes Neuronales
5.4 Búsqueda Viterbi
5.5 Desarrollo del reconocedor usando redes neuronales y el CSLU Toolkit

Capítulo 6. Implementación del Sistema Tutor Animado (archivo pdf, 219 kb)

6.1 El sistema de reconocimiento de voz
6.2 La herramienta de desarrollo
6.3 Descripción de los módulos que componen la aplicación
6.4 Integración del reconocedor al RAD

Capítulo 7. Resultados y Conclusiones (archivo pdf, 64 kb)

7.1 Resultados Obtenidos
7.2 Conclusiones y trabajos a futuro
7.3 Trabajos a futuro

Referencias (archivo pdf, 46 kb)

Apéndice A. Protocolos del corpus de voz (archivo pdf, 52 kb)

Apéndice B. Estadísticas de las grabaciones (archivo pdf, 435 kb)

Apéndice C. Redes Neuronales (archivo pdf, 44 kb)

Luna Moreno, T. 2001. Diseño e Implementación de un Sistema Tutorial basado en Tecnologías de Voz para la Enseñanza de Vocabulario. Tesis Licenciatura. Ingeniería en Sistemas Computacionales. Departamento de Ingeniería en Sistemas Computacionales, Escuela de Ingeniería, Universidad de las Américas Puebla. Diciembre. Derechos Reservados © 2001.

Universidad de las Américas Puebla

Dirección de Bibliotecas

Colección de Tesis Digitales

Diseño e Implementación de un Sistema Tutorial basado en Tecnologías de Voz para la Enseñanza de Vocabulario

Resumen

Índice de contenido