Los métodos de reconocimiento de personas basados en biometría se han explorado ampliamente para diversas aplicaciones, como control de acceso, vigilancia y análisis forense. La verificación biométrica implica cualquier medio por el cual una persona puede ser identificada de manera única a través de rasgos biológicos como rasgos faciales, huellas dactilares, manogeometría y marcha, que es la forma de caminar de una persona.
La marcha es un rasgo práctico para la vigilancia y el análisis forense basado en video porque se puede capturar a distancia en video. De hecho, el reconocimiento de la marcha ya se ha utilizado en casos prácticos en investigaciones penales. Sin embargo, el reconocimiento de la marcha es susceptible avariaciones de los sujetos, como el ángulo de visión, la ropa, la velocidad al caminar, los zapatos y el estado del transporte. Tales factores obstaculizadores han llevado a muchos investigadores a explorar nuevos enfoques con respecto a estas variaciones.
La investigación que aprovecha las capacidades de los marcos de aprendizaje profundo para mejorar los métodos de reconocimiento de la marcha se ha orientado a los marcos de redes neuronales convolucionales CNN, que tienen en cuenta la visión por computadora, el reconocimiento de patrones y la biometría. Una señal convolucional significa combinar cualquiera de estas dos señalespara formar un tercero que proporcione más información.
Una ventaja de un enfoque basado en CNN es que las arquitecturas de red pueden diseñarse fácilmente para un mejor rendimiento al cambiar las entradas, salidas y funciones de pérdida. Sin embargo, un equipo de investigadores centrados en la Universidad de Osaka notó que la visión cruzada existente basada en CNNel reconocimiento de la marcha no aborda dos aspectos importantes.
"Los enfoques actuales basados en CNN no tienen en cuenta los aspectos de verificación versus identificación, y la compensación entre el desplazamiento espacial, es decir, cuando el sujeto se mueve de un lugar a otro", explica la autora principal del estudio, Noriko Takemura.
Teniendo en cuenta estos dos aspectos, los investigadores diseñaron arquitecturas de entrada / salida para el reconocimiento de marcha de vista cruzada basado en CNN. Emplearon una red siamesa para verificación, donde una entrada es un par de características de marcha para la coincidencia, y una salida es genuina probabilidad de los mismos sujetos o impostores sujetos diferentes.
Notablemente, las arquitecturas de red siamesas son insensibles al desplazamiento espacial, ya que la diferencia entre un par coincidente se calcula en la última capa después de pasar por las capas de convolución y agrupación máxima, lo que reduce la dimensionalidad de la imagen de la marcha y permite hacer suposicionessobre características ocultas. Por lo tanto, se puede esperar que tengan un mayor rendimiento bajo diferencias de visión considerables. Los investigadores también utilizaron arquitecturas CNN donde la diferencia entre un par coincidente se calcula a nivel de entrada para hacerlos más sensibles al desplazamiento espacial.
"Realizamos experimentos para el reconocimiento transversal de la marcha y confirmamos que las arquitecturas propuestas superaron los puntos de referencia de vanguardia de acuerdo con sus situaciones adecuadas de tareas de verificación / identificación y diferencias de vista", dice el coautor Yasushi Makihara.
Como el desplazamiento espacial es causado no solo por la diferencia de vista, sino también por la diferencia de velocidad de caminata, la diferencia de estado de carga, la diferencia de ropa y otros factores, los investigadores planean evaluar aún más su método propuesto para el reconocimiento de la marcha con desplazamiento espacial causado por otras covariables.
Fuente de la historia :
Materiales proporcionado por Universidad de Osaka . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :