Tesis profesional presentada por
Licenciatura en Ingeniería en Sistemas Computacionales. Departamento de Computación, Electrónica y Mecatrónica. Escuela de Ingeniería y Ciencias, Universidad de las Américas Puebla.
Jurado Calificador
Presidente: Lic. Renán Contreras
Gómez
Secretario y Director: Dr. Oleg Starostenko
Vocal: Dra. Ingrid Kirschning Albers
Cholula, Puebla, México a 23 de junio de 2008.
Esta tesis propone la creación de un sistema domótico basado en dos tecnologías. El reconocimiento de voz y el Reconocimiento de imágenes.
En la actualidad es muy importante que la tecnología facilite la vida de las personas para que estas alcancen una mejor calidad de vida es por eso que la domótica se preocupa por el control de dispositivos dentro de la casa para que las personas puedan tener un mejor control sobre ella y se puedan prevenir accidentes ò un posible robo ya que nos proporciona un total control de dispositivos a distancia y vigilancia continua las veinticuatro horas.
Al agregar el reconocimiento de voz a la domótica nos facilita la forma de comunicarnos con nuestro sistema domótico ya que ahora podemos controlar los comandos mediante la voz pero estos se empiezan a volver demasiados cuando instalamos varios dispositivos parecidos dentro de la casa y el comando de voz necesita cambiar para que se pueda entender a cual dispositivo se está controlando, es decir, si tenemos diez focos y necesitamos encender el foco número nueve que es foco de la sala, tenemos que decirle mediante comando de voz ¨Enciende foco 10¨ pero si empezamos a analizar el vector de imagen, esto nos empieza a facilitar la vida ya que para poder controlar el foco solo tendremos que decir ¨enciende¨ y mirar el foco.
Esta tesis trata sobre la unión de estas dos tecnologías. Para el manejo de voz se utilizó la herramienta RAD de CSLU ToolKit por otro lado se utilizó el VeriLook SDK para poder analizar las imágenes y poder ver si realmente la persona que emitía la instrucción realmente estaba mirando al dispositivo que se refería.
Se hizo un prototipo trabajando en Delphi como lenguaje de programación y CSLU.
Capítulo 1. Introducción (archivo pdf, 905 kb)
Capítulo 2. Marco Teórico (archivo pdf, 1 mb)
Capítulo 3. Elementos Usados para Generar el Software (archivo pdf, 2 mb)
Capítulo 4. Diseño e Implementación de Sistema (archivo pdf, 3 mb)
Capítulo 6. Resultados y Conclusiones (archivo pdf, 117 kb)
Referencias (archivo pdf, 68 kb)
Apéndice A. Formato de evaluación práctica realizada a los usuarios (archivo pdf, 34 kb)
Apéndice B. Formato de cuestionario realizado a los usuarios (archivo pdf, 55 kb)
Apéndice C. Resultados del cuestionario de usabilidad de los usuarios (archivo pdf, 80 kb)
Apéndice D. Manual de instalación de Delphi (archivo pdf, 29 kb)
Apéndice E. Manual de instalación de CSLU Toolkit (archivo pdf, 1 mb)
Apéndice F. Manual de instalación de Verilook SDK (archivo pdf, 177 kb)
Hernández Bautista, A. 2008. Meiv: Sistema de reconocimiento de voz e imágenes en aplicaciones de control de dispositivos inteligentes. Tesis Licenciatura. Ingeniería en Sistemas Computacionales. Departamento de Computación, Electrónica y Mecatrónica, Escuela de Ingeniería y Ciencias, Universidad de las Américas Puebla. Junio. Derechos Reservados © 2008.