Aportaciones del aprendizaje automático a la detección, seguimiento y reconocimiento de personas en robots de servicio
- Álvarez Aparicio, Claudia
- Vicente Matellán Olivera Director
- Ángel Manuel Guerrero Higueras Director
- Francisco Javier Rodríguez Lera Director
Universidad de defensa: Universidad de León
Fecha de defensa: 22 de diciembre de 2022
- Roberto Iglesias Rodríguez Presidente/a
- Lidia Sánchez González Secretaria
- Luis Jesús Manso Fernández-Argüelles Vocal
Tipo: Tesis
Resumen
Los robots sociales, tienen como objetivo interactuar con las personas en todo tipo de entornos. Esta interacción puede desarrollarse en diferentes escenarios, desde que el robot proporcione información, hasta que resuelva una tarea concreta. Los robots asistenciales son un subconjunto de los robots sociales, cuya finalidad es ayudar a las personas en entornos de restauración, domésticos, hospitalarios, etc. Las tareas que deben afrontar los robots asistenciales añaden a la complejidad de la robótica general, la necesidad de interactuar con los humanos, que esperan que su rendimiento sea similar al que realizaría un humano en un entorno doméstico o de atención al cliente. Además, estos robots deben funcionar de forma autónoma, es decir, deben tener la capacidad de tomar sus propias decisiones por sí mismos en el entorno en el que estén desplegados. Dentro de los problemas clásicos de la robótica de servicios se encuentra la ”navegación”, es decir, la habilidad para desplazarse por el entorno de forma autónoma y sin dañar objetos o personas que se encuentren en su trayectoria. Es habitual que las soluciones de navegación traten de la misma forma a personas y objetos a la hora de desplazarse por el entorno, lo cual no es apropiado en el caso de robots asistenciales. Al problema específico de la navegación de robots autónomos en entornos con personas se le denomina ”navegación social”, que es el problema que se aborda en esta tesis. La navegación social no solo hace referencia a evitar colisionar con las personas u objetos que haya en la trayectoria y el cálculo de la misma, también tiene que ver con la capacidad del robot para aproximarse a una persona, caminar junto a ella, seguirla, etc. Dichas capacidades, están estrechamente relacionados con tres habilidades esenciales: la detección, el seguimiento y el reconocimiento de personas. El objetivo de esta tesis doctoral se puede resumir en el desarrollar de métodos que permitan la creación de un pipeline de detección, seguimiento y reconocimiento de personas que se pueda integrar en sistemas de navegación social, lo que fomentará la interacción persona-robot y facilitará la aceptación de estos robots en todo tipo de entornos. Para ello, en el desarrollo de la tesis se han propuesto y evaluado una serie de métodos que se han integrado en dos sistemas. En primer lugar, el sistema que hemos denominado People Tracking (PeTra), que permite llevar a cabo la detección y seguimiento de las personas en las inmediaciones del robot. En segundo lugar, Biometric RecognITion Through gAit aNalYsis (BRITTANY) permite llevar a cabo el reconocimiento de las personas por su forma de caminar. Ambos sistemas se basan únicamente en la información contenida en rejillas de ocupación que pueden proporcionar diferentes sensores. PeTra se basa en el uso de una Convolutional Neural Network (CNN) de segmentación, que mediante el procesamiento de un mapa de ocupación, permite determina aquellos puntos de la rejilla de ocupación que corresponden con una persona presente en la escena. A partir de esa información, mediante el post-procesamiento de los datos, se puede realizar el seguimiento de las personas. Para ello se plantean dos posibles aproximaciones: el cálculo de distancias euclídeas y el uso de filtros de Kalman. PeTra ha sido comparado con Leg Detector (LD), la solución por defecto presente en Robot Operating System (ROS), basada en Random Trees para determinar la ubicación de las personas. El sistema final, ha reportado mejores resultados en materia de detección que LD. Y en materia de seguimiento, la aproximación mediante filtros de Kalman también ha reportado mejores resultados que la implementación mediante el cálculo de distancias euclídeas. BRITTANY se basa en el uso de una CNN de clasificación, que mediante el procesamiento de un mapa de ocupación agregado, permite determinar que usuario se encuentra caminando delante del robot. El mapa de ocupación agregado se crea mediante la concatenación de varios mapas de ocupación que solo contienen aquellos puntos del sensor que forman parte de una persona. Mediante la concatenación de estos mapas, se consigue representar la acción de caminar de una persona. BRITTANY propone una nueva arquitectura de CNN que se ha comparado con arquitecturas de clasificación conocidas como LeNet o AlexNet. El sistema final desarrollado es robusto incluso ante usuarios externos al sistema.