Publication

Abstract

El siguiente documento presenta un método robusto y eficiente para estimar la pose de una cámara. El método propuesto asume el conocimiento previo de un modelo 3D del entorno, y compara una nueva imagen de entrada únicamente con un conjunto pequeño de imágenes similares seleccionadas previamente por un algoritmo de "Bag of Visual Words". De esta forma se evita el alto coste computacional de calcular la correspondencia de los puntos 2D de la imagen de entrada contra todos los puntos 3D de un modelo complejo, que en nuestro caso contiene más de 100,000 puntos. La estimación de la pose se lleva a cabo a partir de estas correspondencias 2D-3D utilizando un novedoso algoritmo de PnP que realiza la eliminación de valores atípicos (outliers) sin necesidad de utilizar RANSAC, y que es entre 10 y 100 veces más rápido que los métodos que lo utilizan.

- Premio Infaimon a mejor artículo de visión.

Categories

computer vision, pattern classification, pattern matching.

Author keywords

efficient matching, complex 3D models, PnP, deep learning

Scientific reference

A. Rubio, M. Villamizar, L. Ferraz, A. Penate-Sanchez, A. Sanfeliu and F. Moreno-Noguer. Estimación monocular y eficiente de la pose usando modelos 3D complejos, XXXV Jornadas de Automática, 2014, Valencia, Spain.