Tesis profesional presentada por Robin Macías Kempe

Licenciatura en Ingeniería en Sistemas Computacionales. Departamento de Computación, Electrónica y Mecatrónica. Escuela de Ingeniería y Ciencias, Universidad de las Américas Puebla.

Jurado Calificador

Presidente: Dr. J. Alfredo Sánchez Huitrón
Vocal y Director: Dra. Ingrid Kirschning Albers
Secretario: Dr. Oleg Starostenko

Cholula, Puebla, México a 12 de mayo de 2008.

Resumen

La presente tesis tiene como objetivo la creación de un corpus de voz y video en español (México) etiquetado que sirva como apoyo para la detección de emociones (nerviosismo, alegría y enojo) y de mentiras.

A lo largo de este trabajo se definen a detalle las emociones a detectar, así como un análisis de las mismas. De igual manera se da una explicación de la mentira y sus principales variantes. Se habla de la detección de emociones, así como también de algunos de los sistemas existentes relacionados con la detección y análisis de las emociones, como el conocido detector de mentiras (Polígrafo), el análisis de estrés en la voz (VSA) y el Sistema de Codificación de Acciones Faciales (FACS). Posteriormente, se define lo que es un corpus, su importancia y su relación con tecnologías de reconocimiento de voz. Se hace una breve descripción de algunos corpora actuales, conjuntamente con sus especificaciones técnicas y estructurales. Una vez conocido lo anterior, se define la metodología para generar el corpus y se describe el protocolo para realizar las grabaciones, en donde se habla de los ángulos a considerar, el proceso a seguir, así como los datos técnicos necesarios. Consecuentemente, se establecen las etiquetas necesarias para el proceso de etiquetado de audio y video mediante herramientas como SpeechViewer (CSLU Toolkit) y Sony Vegas 7.0. Se describen los pasos a seguir para el correcto etiquetado del corpus. Finalmente se presentan las conclusiones con respecto a las grabaciones, y los posibles trabajos a futuro en donde se puede ocupar este corpus.

Índice de contenido

Portada (archivo pdf, 33 kb)

Agradecimientos (archivo pdf, 247 kb)

Capítulo 1. Introducción (archivo pdf, 73 kb)

  • 1.1 Planteamiento del Problema
  • 1.2 Objetivo General
  • 1.3 Objetivos Específicos
  • 1.4 Alcances
  • 1.5 Limitaciones

Capítulo 2. Emociones y Mentira (archivo pdf, 329 kb)

  • 2.1 Emociones
  • 2.2 Nerviosismo
  • 2.3 Miedo
  • 2.4 Enojo
  • 2.5 Alegría
  • 2.6 Mentira

Capítulo 3. Detección de emociones (archivo pdf, 297 kb)

  • 3.1 Detección de emociones
  • 3.2 Polígrafo
  • 3.3 Tecnología VSA
  • 3.4 Sistema de Codificación de Acciones Faciales (FACS)

Capítulo 4. Etiquetado del Corpus (archivo pdf, 1 mb)

  • 4.1 Definición de Corpora
  • 4.2 Corpora actuales
  • 4.3 Protocolo de grabación
  • 4.4 Etiquetar un Corpus
  • 4.5 Resumen y Ficha técnica del corpus

Capítulo 5. Conclusiones y trabajos a futuro (archivo pdf, 34 kb)

  • 5.1 Conclusiones
  • 5.2 Trabajos a futuro

Referencias (archivo pdf, 38 kb)

Anexo 1. Cuestionario Mujeres (archivo pdf, 75 kb)

Anexo 2. Cuestionario Hombres (archivo pdf, 75 kb)

Anexo 3. Carta de Consentimiento (archivo pdf, 54 kb)

Macías Kempe, R. 2008. Corpus de voz y video para apoyar la detección de mentiras, enojo y nerviosismo. Tesis Licenciatura. Ingeniería en Sistemas Computacionales. Departamento de Computación, Electrónica y Mecatrónica, Escuela de Ingeniería y Ciencias, Universidad de las Américas Puebla. Mayo. Derechos Reservados © 2008.