Tesis profesional presentada por Alejandro Hernández Bautista

Licenciatura en Ingeniería en Sistemas Computacionales. Departamento de Computación, Electrónica y Mecatrónica. Escuela de Ingeniería y Ciencias, Universidad de las Américas Puebla.

Jurado Calificador

Presidente: Lic. Renán Contreras Gómez
Secretario y Director: Dr. Oleg Starostenko
Vocal: Dra. Ingrid Kirschning Albers

Cholula, Puebla, México a 23 de junio de 2008.

Resumen

Esta tesis propone la creación de un sistema domótico basado en dos tecnologías. El reconocimiento de voz y el Reconocimiento de imágenes.

En la actualidad es muy importante que la tecnología facilite la vida de las personas para que estas alcancen una mejor calidad de vida es por eso que la domótica se preocupa por el control de dispositivos dentro de la casa para que las personas puedan tener un mejor control sobre ella y se puedan prevenir accidentes ò un posible robo ya que nos proporciona un total control de dispositivos a distancia y vigilancia continua las veinticuatro horas.

Al agregar el reconocimiento de voz a la domótica nos facilita la forma de comunicarnos con nuestro sistema domótico ya que ahora podemos controlar los comandos mediante la voz pero estos se empiezan a volver demasiados cuando instalamos varios dispositivos parecidos dentro de la casa y el comando de voz necesita cambiar para que se pueda entender a cual dispositivo se está controlando, es decir, si tenemos diez focos y necesitamos encender el foco número nueve que es foco de la sala, tenemos que decirle mediante comando de voz ¨Enciende foco 10¨ pero si empezamos a analizar el vector de imagen, esto nos empieza a facilitar la vida ya que para poder controlar el foco solo tendremos que decir ¨enciende¨ y mirar el foco.

Esta tesis trata sobre la unión de estas dos tecnologías. Para el manejo de voz se utilizó la herramienta RAD de CSLU ToolKit por otro lado se utilizó el VeriLook SDK para poder analizar las imágenes y poder ver si realmente la persona que emitía la instrucción realmente estaba mirando al dispositivo que se refería.

Se hizo un prototipo trabajando en Delphi como lenguaje de programación y CSLU.

Índice de contenido

Portada (archivo pdf, 55 kb)

Índices (archivo pdf, 66 kb)

Capítulo 1. Introducción (archivo pdf, 905 kb)

  • 1.1 Actualidad y definición del problema
  • 1.2 Objetivo general
  • 1.3 Objetivos específicos
  • 1.4 Alcances y limitaciones
  • 1.5 Hardware y Software a utilizar
  • 1.6 Estado del problema
  • 1.7 Conclusiones

Capítulo 2. Marco Teórico (archivo pdf, 1 mb)

  • 2.1 Definiciones
  • 2.2 Sistema de control de dispositivos eléctricos en una casa inteligente a través de voz
  • 2.3 Protocolo X10
  • 2.4 Jini
  • 2.5 Universal Plug and Play
  • 2.6 Salutation
  • 2.7 Análisis de ojos

Capítulo 3. Elementos Usados para Generar el Software (archivo pdf, 2 mb)

  • 3.1 Tecnología de reconocimiento del rostro y ojos mediante el algoritmo Verilook
  • 3.2 Tecnología de reconocimiento de voz con CSLU Toolkit
  • 3.3 Conexión con los dispositivos X10
  • 3.4 Ambiente de programación Delphi

Capítulo 4. Diseño e Implementación de Sistema (archivo pdf, 3 mb)

  • 4.1 Descripción del sistema
  • 4.2 Modelo conceptual del sistema
  • 4.3 Arquitectura del sistema
  • 4.4 Casos de uso
  • 4.5 Conclusiones

Capítulo 6. Resultados y Conclusiones (archivo pdf, 117 kb)

  • 6.1 Resultados de las pruebas realizadas por el desarrollador
  • 6.2 Resultados de evaluaciones y encuestas
  • 6.3 Ventajas y Desventajas
  • 6.4 Trabajo a futuro
  • 6.5 Conclusiones

Referencias (archivo pdf, 68 kb)

Apéndice A. Formato de evaluación práctica realizada a los usuarios (archivo pdf, 34 kb)

Apéndice B. Formato de cuestionario realizado a los usuarios (archivo pdf, 55 kb)

Apéndice C. Resultados del cuestionario de usabilidad de los usuarios (archivo pdf, 80 kb)

Apéndice D. Manual de instalación de Delphi (archivo pdf, 29 kb)

Apéndice E. Manual de instalación de CSLU Toolkit (archivo pdf, 1 mb)

Apéndice F. Manual de instalación de Verilook SDK (archivo pdf, 177 kb)

Apéndice G. Manual de Usuario (archivo pdf, 1 mb)

Apéndice H. Pruebas a usuarios (archivo pdf, 55 kb)

Hernández Bautista, A. 2008. Meiv: Sistema de reconocimiento de voz e imágenes en aplicaciones de control de dispositivos inteligentes. Tesis Licenciatura. Ingeniería en Sistemas Computacionales. Departamento de Computación, Electrónica y Mecatrónica, Escuela de Ingeniería y Ciencias, Universidad de las Américas Puebla. Junio. Derechos Reservados © 2008.