Tesis profesional presentada por
Licenciatura en Ingeniería en Sistemas Computacionales. Departamento de Computación, Electrónica y Mecatrónica. Escuela de Ingeniería y Ciencias, Universidad de las Américas Puebla.
Jurado Calificador
Presidente: Dr. J. Alfredo Sánchez
Huitrón
Vocal y Director: Dra. Ingrid Kirschning
Albers
Secretario: Dr. Oleg Starostenko
Cholula, Puebla, México a 12 de mayo de 2008.
La presente tesis tiene como objetivo la creación de un corpus de voz y video en español (México) etiquetado que sirva como apoyo para la detección de emociones (nerviosismo, alegría y enojo) y de mentiras.
A lo largo de este trabajo se definen a detalle las emociones a detectar, así como un análisis de las mismas. De igual manera se da una explicación de la mentira y sus principales variantes. Se habla de la detección de emociones, así como también de algunos de los sistemas existentes relacionados con la detección y análisis de las emociones, como el conocido detector de mentiras (Polígrafo), el análisis de estrés en la voz (VSA) y el Sistema de Codificación de Acciones Faciales (FACS). Posteriormente, se define lo que es un corpus, su importancia y su relación con tecnologías de reconocimiento de voz. Se hace una breve descripción de algunos corpora actuales, conjuntamente con sus especificaciones técnicas y estructurales. Una vez conocido lo anterior, se define la metodología para generar el corpus y se describe el protocolo para realizar las grabaciones, en donde se habla de los ángulos a considerar, el proceso a seguir, así como los datos técnicos necesarios. Consecuentemente, se establecen las etiquetas necesarias para el proceso de etiquetado de audio y video mediante herramientas como SpeechViewer (CSLU Toolkit) y Sony Vegas 7.0. Se describen los pasos a seguir para el correcto etiquetado del corpus. Finalmente se presentan las conclusiones con respecto a las grabaciones, y los posibles trabajos a futuro en donde se puede ocupar este corpus.
Agradecimientos (archivo pdf, 247 kb)
Capítulo 1. Introducción (archivo pdf, 73 kb)
Capítulo 2. Emociones y Mentira (archivo pdf, 329 kb)
Capítulo 3. Detección de emociones (archivo pdf, 297 kb)
Capítulo 4. Etiquetado del Corpus (archivo pdf, 1 mb)
Capítulo 5. Conclusiones y trabajos a futuro (archivo pdf, 34 kb)
Referencias (archivo pdf, 38 kb)
Anexo 1. Cuestionario Mujeres (archivo pdf, 75 kb)
Macías Kempe, R. 2008. Corpus de voz y video para apoyar la detección de mentiras, enojo y nerviosismo. Tesis Licenciatura. Ingeniería en Sistemas Computacionales. Departamento de Computación, Electrónica y Mecatrónica, Escuela de Ingeniería y Ciencias, Universidad de las Américas Puebla. Mayo. Derechos Reservados © 2008.