Image recognition using general regression networks and the TVS technique (in Spanish: Reconocimiento de Imágenes Empleando Redes de Regresion General y la tecnica TVS)
R.García-Herrera, W.W. Mayol-Cuevas, Image recognition using general regression networks and the TVS technique (in Spanish: Reconocimiento de Imágenes Empleando Redes de Regresion General y la tecnica TVS). Iberoamerican Congress of Artificial Intelligence IBERAMIA. November 1996. PDF, 403 Kbytes.Abstract
(abstract partially translated from original, provided for a historical perspective) In this work we present the development of a new technique named transformation to the symmetry vector which consists in mapping a 2D image to a feature vector. The method applies successive rotations around the centre of mass and computes the euclidean distance against the original image mapped to polar coordinates. The level of description increases with the number of rotations. The resulting vector contains the amount of self correlation through partial and total symmetries (these last ones will show a cero in the location of the TVS vector). TVS is invariant to rotation and scale. We test the system with a number of images and using the GRNN classification technique allowing this to work with big stimulous (250x200 pixels by 256 colours).
En este trabajo se presenta el desarrollo de una nueva técnica que denominamos Transformación al Vector de Simetrías (TVS), la cual en términos generales, mapea una entrada en 2-D a un vector de características. El método consiste en aplicar rotaciones a la imagen mapeada a coordenadas polares, teniendo como eje el centro de masa y comparando cada rotación con la imagen original, mediante una métrica euclidiana. El número de rotaciones y su espaciamiento determina la eficiencia del vector de simetrías para representar la imagen, mejorando a medida que se aumenta la cantidad de rotaciones. El vector se conforma de números que representan simetrías parciales y totales de la imagen -considerando que las últimas dejan invariante la figura, i.e. el valor en el vector es cero-. TVS es invariante a rotación, escala y traslación y su cálculo es muy rápido comparado con las técnicas convencionales como Momentos y DFT. Se procesan imágenes reales de objetos de oficina con alto grado de ruido y los vectores obtenidos son empleados para entrenar un modelo de reconocimiento coneccionista del tipo GRNN, con ello se comprueba la eficiencia de la técnica propuesta para representar información, así como se permite a una red de este tipo (que requiere gran cantidad de memoria), trabajar con estímulos grandes (250x200 por 256 colores).

