Tesis profesional presentada por Tatiana Yevguenievna Kuzina

Licenciatura en Ingeniería en Sistemas Computacionales. Departamento de Ingeniería en Sistemas Computacionales. Escuela de Ingeniería, Universidad de las Américas Puebla.

Jurado Calificador

Presidente: Dra. María del Pilar Gómez Gil
Vocal y Director: Dr. Oleg Starostenko
Secretario: Dr. Fernando Antonio Aguilera Ramírez

Cholula, Puebla, México a 18 de mayo de 2000.

Resumen

La tesis abarca el tema de visión dinámica por computadora que empieza a tener más interés de los investigadores a desarrollar los nuevos algoritmos más y más sofisticados. Como en el mundo real el objeto puede estar principalmente en tres movimientos: giratorio, lateral y longitudinal [Zhou, 1992], las técnicas tratan de encontrar la solución para los tres acercándose así a las imágenes naturales. Aparte del problema de procesar los tres movimientos existen otros de ruido, oclusión y replicación que contiene la imagen real.

Para estimar el movimiento de la secuencia de imágenes hay dos grupos principales de técnicas: basado en gradiente y en correspondencias que construyen el campo de flujo óptico. Este campo es útil porque sólo tiene la información necesaria sobre el movimiento sin consumir mucho espacio. Los dos grupos se describen en la tesis. Por otra parte existen técnicas alternativas que obtienen los bordes de objetos móviles reduciendo así la cantidad de información, a procesar y sacando las propiedades cualitativas de la secuencia de imágenes. En la tesis se describen y implementan dos métodos de este tipo. En el primero se multiplican dos gradientes: espacial y temporal para obtener los bordes de objetos en movimiento. En el otro se aplica el algoritmo SUSAN que encuentra las esquinas (puntos) significativas de la imagen. Después dos arreglos de esquinas de dos imágenes de secuencia se sobreponen y si hay movimiento los puntos de las imágenes no estarán en el mismo lugar. Este algoritmo puede ser útil para después construir el campo de flujo óptico donde la cantidad de datos es reducida en comparación con el campo completo que normalmente se obtiene. Otros enfoques al problema de estimación de movimiento son de redes neuronales artificiales y de fases obtenidas por los filtros de frecuencias que también se describen en la tesis.

La necesidad del mundo real a aplicar el campo de visión dinámica por computadora genera toda la diversidad de técnicas mencionadas anteriormente. Para el día de hoy ya existen diferentes aplicaciones del área. Unas de ellas son del vehículo de autoconducción, clasificación de objetos por las imágenes, búsqueda de los tubos en el lecho marino y detección de la orientación de la vista del ojo humano. Todas estas aplicaciones adaptan unos métodos de visión dinámica a sus necesidades. Estos métodos específicos están descritos en la tesis junto con sus aplicaciones. En base de análisis de las aproximaciones también se proponen otras soluciones para las mismas situaciones.

El punto principal de la tesis es, basándose en investigación y análisis de las aproximaciones existentes del área, escoger dos de la utilidad posterior, ya sea implementación junto con otras aproximaciones o a parte para alguna aplicación que lo requiera. Los dos métodos escogidos se basan en gradiente [Jain ,1995] y en algoritmo SUSAN [Smith, 1997].

Índice de contenido

Índices (archivo pdf, 45 kb)

Capítulo 1. Introducción (archivo pdf, 50 kb)

  • 1.1 Objetivos, alcances y limitaciones

Capítulo 2. Modelos de aproximación (archivo pdf, 154 kb)

  • 2.1 Algoritmos basados en gradiente
  • 2.2 Algoritmos de correspondencias
  • 2.3 Métodos de filtración espacio temporal
  • 2.4 Métodos basados en redes neuronales artificiales

Capítulo 3. Aplicaciones (archivo pdf, 89 kb)

  • 3.1 Aplicaciones automovilísticas
  • 3.2 Sistema de clasificación de imágenes de objetos motivado en biología
  • 3.3 Sistema de visión bajo el agua aplicada a detección de tubos
  • 3.4 Detección de la orientación de la vista del ojo humano

Capítulo 4. Implementación y pruebas (archivo pdf, 820 kb)

  • 4.1 Paquete Halcon
  • 4.2 Método basado en gradiente
  • 4.3 Método basado en algoritmo SUSAN

Capítulo 5. Conclusión (archivo pdf, 42 kb)

Referencias (archivo pdf, 43 kb)

Apéndice A. Pseudocódigo de la función "user_setgray" (archivo pdf, 42 kb)

Apéndice B. Pseudocódigos de las funciones "brightness", "user_cornerq" (archivo pdf, 51 kb)

Apéndice C. Definiciones utilizadas en la tesis (archivo pdf, 40 kb)

Kuzina, T. Y. 2000. Investigación e implementación de los algoritmos del campo de visión dinámica por computadora. Tesis Licenciatura. Ingeniería en Sistemas Computacionales. Departamento de Ingeniería en Sistemas Computacionales, Escuela de Ingeniería, Universidad de las Américas Puebla. Mayo. Derechos Reservados © 2000.