Los informáticos de la Universidad de Nottingham y la Universidad de Kingston han resuelto un problema complejo que, hasta ahora, ha derrotado a los expertos en investigación visual y gráfica. Han desarrollado tecnología capaz de producir la reconstrucción facial 3D a partir de una sola imagen 2D: la 3Dselfie
Su nueva aplicación web permite que las personas carguen una sola imagen en color y reciban, en unos segundos, un modelo 3D que muestra la forma de su cara. Las personas están haciendo cola para probarlo y hasta ahora, más de 400,000 usuarios han tenidovaya. Puede hacerlo usted mismo tomando una selfie y cargándola en su sitio web.
La investigación - 'Reconstrucción de la cara 3D de pose grande a partir de una sola imagen a través de la regresión volumétrica directa de CNN' - fue dirigida por el estudiante de doctorado Aaron Jackson y se llevó a cabo con su compañero estudiante de doctorado Adrian Bulat, ambos basados en el Laboratorio de Visión por Computadora de la Escuelade Ciencias de la Computación. Ambos estudiantes son supervisados por Georgios Yorgos Tzimiropoulos, Profesor Asistente de la Facultad de Ciencias de la Computación. El trabajo se realizó en colaboración con el Dr. Vasileios Argyriou de la Facultad de Ciencias de la Computación y Matemáticas de la Universidad de Kingston.
Los resultados se presentarán en la Conferencia Internacional sobre Visión por Computadora ICCV 2017 en Venecia el próximo mes.
Tecnología en una etapa muy temprana
La técnica está lejos de ser perfecta, pero este es el avance que los científicos informáticos han estado buscando.
Se ha desarrollado utilizando una Red neuronal convolucional CNN, un área de inteligencia artificial IA que utiliza el aprendizaje automático para dar a las computadoras la capacidad de aprender sin ser programado explícitamente.
El equipo de investigación, supervisado por el Dr. Yorgos Tzimiropoulos, entrenó a una CNN en un gran conjunto de datos de imágenes 2D y modelos faciales 3D. Con toda esta información, su CNN puede reconstruir la geometría facial 3D a partir de una sola imagen 2D. También puede tomaruna buena suposición en las partes no visibles de la cara.
idea simple problema complejo
El Dr. Tzimiropoulos dijo: "La principal novedad está en la simplicidad de nuestro enfoque que evita las tuberías complejas típicamente utilizadas por otras técnicas. En su lugar, surgió la idea de entrenar una gran red neuronal en 80,000 caras para aprender directamente a emitir elGeometría facial 3D a partir de una sola imagen 2D ".
Este es un problema de dificultad extraordinaria. Los sistemas actuales requieren múltiples imágenes faciales y enfrentan varios desafíos, como correspondencias densas a través de grandes poses faciales, expresiones e iluminación no uniforme.
Aaron Jackson dijo: "Nuestra CNN usa una sola imagen facial 2D y funciona para posturas faciales arbitrarias por ejemplo, imágenes frontales o de perfil y expresiones faciales por ejemplo, sonreír".
Adrian Bulat dijo: "El método puede usarse para reconstruir toda la geometría facial 3D, incluidas las partes no visibles de la cara".
Su técnica demuestra algunos de los avances posibles a través del aprendizaje profundo, una forma de aprendizaje automático que utiliza redes neuronales artificiales para imitar la forma en que el cerebro hace conexiones entre piezas de información.
El Dr. Vasileios Argyriou, de la Facultad de Ciencias, Ingeniería y Computación de la Universidad de Kingston, dijo: "Lo realmente impresionante de esta técnica es cómo ha hecho que el proceso de creación de un modelo facial 3D sea tan simple".
¿Cuáles podrían ser las aplicaciones?
Además de las aplicaciones más estándar, como el reconocimiento de rostro y emoción, esta tecnología podría usarse para personalizar juegos de computadora, mejorar la realidad aumentada y permitir que las personas prueben accesorios en línea como anteojos.
También podría tener aplicaciones médicas, como simular los resultados de la cirugía plástica o ayudar a comprender afecciones médicas como el autismo y la depresión.
El doctorado de Aaron está financiado por la Universidad de Nottingham. Su investigación se centra en el aprendizaje profundo aplicado al rostro humano. Esto incluye la reconstrucción en 3D y la segmentación aplicada al rostro y al cuerpo humano.
Adrian Bulat es estudiante de doctorado en Computer Vision Lab. Sus principales intereses de investigación están en el área de análisis de rostros, estimación de pose humana y cuantificación / binarización de redes neuronales.
Fuente de la historia :
Materiales proporcionado por Universidad de Nottingham . Nota: El contenido puede ser editado por estilo y longitud.
Cita esta página :