Investigación
Filosofía de investigación
On peut avoir trois principaux objets dans l'étude de la vérité: l'un, de la découvrir quand on la cherche; l'autre, de la démontrer quand on la possède; le dernier, de la discerner d'avec le faux quand on l'examine." Blaise Pascal.
La visión por computadora consiste en dotar a una máquina de capacidades visuales similares a las humanas. Para ello, se utiliza una cámara fotográfica, que detecta y captura datos, y una unidad de procesamiento de información. Se dice que la cámara fotográfica es un dispositivo proyectivo, ya que las imágenes se forman por la transformación perspectiva del mundo 3D al plano bidimensional de la imagen. Por lo tanto, la geometría se encuentra en el corazón de los problemas de visión por computadora. Mi investigación se centra en aplicar propiedades y conceptos geométricos en el diseño de algoritmos de visión por computadora. Una característica distintiva de mi investigación es el uso del álgebra geométrica como herramienta para modelar e implementar conceptos, principios y algoritmos.
Mi programa de investigación está dedicado a reivindicar el uso de principios geométricos en el desarrollo de algoritmos de visión por computadora, mostrar cómo se pueden usar para mejorar los métodos del estado del arte y ejemplificar cómo el álgebra geométrica simplifica el modelado, cómputo y aplicación de tales principios.
Projectos
Se propone un nuevo algoritmo de votación para extracción de características en imágenes. En particular, nuestro algoritmo combina el uso de funciones de prominencia perceptual y banderas geométricas con una técnica de agrupamiento, todo dentro del marco matemático del modelo conforme del álgebra geométrica. El esquema de votación propuesto permite representar configuraciones complejas de datos visuales que queremos detectar; además, este algoritmo se puede utilizar como bloques de construcción para diseñar arquitecturas jerárquicas complejas. Los resultados experimentales muestran su capacidad para extraer pares de puntos, líneas, círculos y ejes de simetría de imágenes sintéticas y reales.
Mapas perceptuales geométricos basados en el concepto de torque.
En este proyecto, se utiliza álgebra geométrica para redefinir el operador de torque sobre imágenes, propuesto por Nishigaki et. al (2012). Nuestra definición generaliza este operador a altas dimensiones y permite el uso de momentos de alto orden. Así, proponemos un algoritmo que implementa el principio de agrupación por cerradura, de la teoría del Gestalt, para construir mapas de prominencia a partir de datos n-dimensionales.
Redes neuronales convolucionales cuaterniónicas.
Este estudio establece las bases teóricas y los detalles de implementación de redes neuronales convolucionales que utilizan representación de cuaterniones. En particular, se propone: el modelo básico de capas de convolución cuaterniónica, capas de submuestreo cuaterniónica, el mecanismo de retropropagación y la conexión entre la convolución y transformada de Fourier cuaterniónicas.
Este trabajo propone un método geométríco para calcular la posición de una cámara dentro de un sistema no calibrado. La solución se formaliza usando el álgebra de Grassmann-Cayley.
Arquitectura abierta de tiempo real para el robot Mitsubishi RV-M1.
Se propone una arquitectura de sistema abierto en tiempo real, basada en Linux RTAI, para un robot industrial de 6DOF. Nuestro sistema permite implementar diferentes algoritmos de control, integrar diferentes tipos de sensores al sistema (cámara de video, sensores de fuerza, etc.) e implementar tareas a ejecutarse en tiempo real.