Proyecto Final presentado por Emilio Ramírez Aldama [emilio.ramirezaa@udlap.mx]

Licenciatura en Ingeniería Mecatrónica. Departamento de Computación, Electrónica y Mecatrónica. Escuela de Ingeniería, Universidad de las Américas Puebla.

Jurado Calificador

Presidente: Dr. Roberto Rosas Romero
Secretario y Director: Dr. Gibran Etcheverry Doger
Vocal: Dr. Oleg Starostenko

Cholula, Puebla, México a 19 de junio de 2015.

Resumen

Este trabajo es un proyecto orientado a una aplicación de reconocimiento de personas mediante la voz empleando herramientas de procesamiento de audio, enfocado a la extracción de características de voz mediante la transformada Wavelet. Éste trabajo se enfoca también a la implementación de esta aplicación en el área de domótica, seguridad y automatización. Éste proyecto se realiza bajo el lenguaje de programación Python, ya que se planea que a futuro se desarrolle en una plataforma como la RaspberryPi dadas sus características que nos brindan versatilidad. En la actualidad existe una gran variedad de dispositivos en el mercado para el reconocimiento de voz enfocados a domótica para automatizar algunos aspectos dentro de las casas y aumentar la seguridad de las viviendas, sin embargo, la mayoría de ellos son demasiado costosos para la implementación dentro de un hogar convencional. En éste trabajo se buscará realizar mediante la transformada Wavelet un algoritmo que nos permita extraer las características propias de un hablante para poder autentificar al usuario a través de un dispositivo capaz de procesar y analizar la señal de voz que se recuperará del hablante. El enfoque que se le dará a este trabajo será el de seguridad y el de desarrollo de automatismos en un hogar.

Palabras clave: Wavelet reconocimiento del hablante Python.

Índice de contenido

Índices (archivo pdf, 203 kb)

Capítulo 1. Reconocimiento de voz (archivo pdf, 641 kb)

  • 1.1 Introducción
  • 1.2 Planteamiento del Problema
  • 1.3 Marco Teórico
  • 1.4 Metodología

Capítulo 2. Metodología de Trabajo y Herramientas (archivo pdf, 570 kb)

  • 2.1 Desarrollo
  • 2.2 Selección del Material
  • 2.3 Herramientas

Capítulo 3. Mezcla de Gaussianas para clasificación (archivo pdf, 460 kb)

  • 3.1 Modelos de Mezcla
  • 3.2 Árboles de dependencia
  • 3.3 Algoritmo Expectation Maximization (EM)
  • 3.4 Clustering

Capítulo 4. Resultados (archivo pdf, 1015 kb)

  • 4.1 Pruebas

Capítulo 5. Conclusiones y Trabajo Futuro (archivo pdf, 205 kb)

  • 5.1 Conclusiones
  • 5.2 Trabajo a Futuro

Referencias (archivo pdf, 286 kb)

Anexo 1. Programas (archivo pdf, 223 kb)

Ramírez Aldama, E. 2015. Reconocimiento del hablante mediante extracción de características empleando la transformada Wavelet. Proyecto Final Licenciatura. Ingeniería Mecatrónica. Departamento de Computación, Electrónica y Mecatrónica, Escuela de Ingeniería, Universidad de las Américas Puebla. Junio. Derechos Reservados © 2015.