Tesis profesional presentada por Jorge Andrés Franco Galván

Licenciatura en Ingeniería en Electrónica y Computadoras. Departamento de Ingeniería Electrónica. Escuela de Ingeniería, Universidad de las Américas Puebla.

Jurado Calificador

Presidente: Dr. José Luis Vázquez González
Secretario y Director: Dr. José Miguel David Báez López
Vocal: Dr. Roberto Rosas Romero

Cholula, Puebla, México a 15 de diciembre de 2004.

Resumen

Durante años se ha llevado a cabo investigación en el rubro del reconocimiento de voz. Existen diferentes enfoques en esta área y dentro de la misma podemos mencionar el reconocimiento de patrones, la cual es un área de investigación que estudia la operación y diseño de sistemas que reconocen características semejantes en la información. Engloba numerosas subdisciplinas como análisis discriminativo, extracción de características, estimación de error, e inferencia gramatical entre otros. Entre las más importantes áreas de aplicación se encuentran el análisis de imagen, reconocimiento de caracteres, diagnósticos médicos en humanos y de funcionamiento en máquinas, identificación de personas, inspección industrial y análisis del habla que es la que principalmente concierne al presente trabajo de tesis.

El presente reporte, explica la investigación que se llevó a cabo en el desarrollo de un algoritmo de reconocimiento para 5 niños con trastorno en el habla. El objetivo de la presente tesis fue el desarrollo de un programa informático de reconocimiento digital de voz utilizando MatLab® que nos permitiera identificar un sonido emitido por un niño con discapacidad en el habla.

Para llevar a cabo dicho programa se trabajó con niños que padecen parálisis cerebral, tomando muestras de su voz para después aplicarles un procesado digital de señales y posteriormente buscar un patrón en las muestras de voz.

En nuestro país una parte considerable de la población se encuentra marginada debido a diferentes discapacidades. En la sociedad mexicana se carece de una cultura de aprobación, entendimiento y apoyo a este tipo de personas, no contando con instalaciones propiamente acondicionadas para este tipo de personas. El presente trabajo se desarrolla con la finalidad de ayudar a un minúsculo sector de esta población, a los niños con parálisis cerebral que presentan una dificultad para comunicarse.

El reconocimiento de patrones de voz puede ayudar a personas con discapacidad del habla a externar sus sentimientos, pensamientos y opiniones, lo cual nos indica el importante valor humano de realizar investigación en este sentido.

El desarrollo del presente trabajo se llevó a cabo en varias etapas. Primeramente se investigó acerca del reconocimiento de patrones y las diferentes técnicas que existen en esta área. Posteriormente se consiguió la autorización para poder trabajar en una institución donde trabajen con niños con parálisis cerebral, esto para poder tomar las muestras de voz y crear la base de datos.

Por último se diseñó un programa en Matlab que una vez digitalizadas cada una de las muestras de voz, se realiza un procesado digital de las mismas y se analiza en el dominio de la frecuencia para hallar las características de su espectro. En esta misma etapa podemos mencionar que se creo el programa que reconoce los fonemas analizados.

Las etapas arriba mencionadas son cubiertas meticulosamente en cada uno de los diferentes capítulos que integran la presente tesis. A manera de introducción se puede decir que fue gracias al trabajo arriba mencionado que se pudo llevar a cabo la realización del presente trabajo.

El uso de ayuda electrónica como la que se presenta en este proyecto puede permitir que la gente que no habla y las personas con severas discapacidades físicas aumenten su participación en la discusión del pensamiento.

Índice de contenido

Capítulo 1. Introducción y Parálisis Cerebral Infantil (archivo pdf, 65 kb)

  • 1.1 Parálisis Cerebral Infantil
  • 1.2 Tipos de Parálisis Cerebral
  • 1.3 Causas de la parálisis cerebral
  • 1.4 Problemas comunes del lenguaje en la parálisis cerebral
  • 1.5 Casa de Ángeles

Capítulo 2. Acerca de la producción y estudio de la voz (archivo pdf, 95 kb)

  • 2.1 Lenguaje y comunicación de la voz
  • 2.2 Producción de la voz humana
  • 2.3 Fonética
  • 2.4 Fonología

Capítulo 3. Propuesta de solución al problema (archivo pdf, 22 kb)

Capítulo 4. Reconocimiento de patrones (archivo pdf, 113 kb)

  • 4.1 Reconocimiento de patrones como un campo de estudios
  • 4.2 Enfoques al problema de reconocimiento del habla
  • 4.3 Extracción de características
  • 4.4 Criterios de selección de características
  • 4.5 El clasificador

Capítulo 5. Transformada de Fourier (archivo pdf, 122 kb)

  • 5.1 Introducción
  • 5.2 Conceptos básicos
  • 5.3 Propiedades Fundamentales de la Transformada de Fourier
  • 5.4 Transformada discreta de Fourier
  • 5.5 Transformada rápida de Fourier (FFT)

Capítulo 6. Pruebas preliminares (archivo pdf, 296 kb)

  • 6.1 Programa RecALL Pro®
  • 6.2 El formato WAV
  • 6.3 Breve explicación de Matlab®

Capítulo 7. Sistema de reconocimiento de Voz (archivo pdf, 253 kb)

  • 7.1 Creación del sistema de reconocimiento de voz
  • 7.2 Bandas de operación
  • 7.3 Operación del Sistema
  • 7.4 Interfaz Gráfica (GUI)

Capítulo 8. Pruebas y Resultados (archivo pdf, 88 kb)

  • 8.1 Conclusiones

Referencias (archivo pdf, 14 kb)

Apéndice A. Programas (archivo pdf, 50 kb)

Apéndice B. Código Fuente de la Interfaz Gráfica (archivo pdf, 77 kb)

Franco Galván, J. A. 2004. Reconocimiento de Voz para Niños con Discapacidad en el Habla. Tesis Licenciatura. Ingeniería en Electrónica y Computadoras. Departamento de Ingeniería Electrónica, Escuela de Ingeniería, Universidad de las Américas Puebla. Diciembre. Derechos Reservados © 2004.