Design of computer vision systems for process automation

  1. Riego del Castillo, Virginia
Dirigida por:
  1. Lidia Sánchez González Directora
  2. Nicola Strisciuglio Director/a

Universidad de defensa: Universidad de León

Fecha de defensa: 07 de octubre de 2022

Tribunal:
  1. Vicente Matellán Olivera Presidente
  2. Estefanía Talavera Martínez Secretario/a
  3. Jesús Martínez Gómez Vocal

Tipo: Tesis

Teseo: 750474 DIALNET

Resumen

La visión por computador permite que un ordenador extraiga información de una imagen, al igual que las personas utilzamos la vista para obtener información del entorno. Así que podemos utilizarla para saber cuantas personas hay en un lugar o para saber si un semáforo está en verde o rojo. Su versatilidad ha hecho que se aplique a todo tipo de procesos como puede ser la medicina, industria o agricultura. Junto con su bajo coste, ya que la mayoría de las veces sólo hace falta una cámara para adquirir la información y no se necesita equipamiento extra. Las principales líneas de investigación de esta tesis han venido dadas por los proyectos y colaboraciones existentes con otras entidades. Por una parte, un proyecto del Ministerio de Economia, Industria y Competitividad ha dado lugar a la línea de investigación centrada en el estudio de la calidad en procesos de fabricación. Por otro lado, la colaboración con la Universidad de Zaragoza a partir de varios Art. 83 ha generado una línea de investigación en la campo de ganadería de precisión y bienestar animal. Durante esta tesis se han generado datasets nuevos que han sido publicados, así como experimentos publicados a través de congresos y revistas científicas. Para el primero de los problemas considerados -el estudio de la calidad de la superficie de las piezas mecanizadas-, se han considerado dos enfoques diferentes: técnicas de visión tradicional basadas en descriptores de textura (alcanzando una precisión del 96.2 %) y técnicas de aprendizaje profundo aplicando transfer learning (con una precisión del 93.22 %). La segunda aplicación, sistemas de formación de rebabas, se ha desarrollado con regresión lineal para estudiar la pendiente que forma el borde de la pieza; también se ha utilizado la información del contorno para clasificar las rebabas con un 90,34 % de precisión; finalmente, se delinea el borde de la pieza y se binariza con RUSTICO logrando un 93.20 % de precisión. Centrándonos en la detección de rotura de rebabas, se ha diseñado una red optimizada con el mínimo número posible de parámetros de entrenamiento consiguiendo una precisión del 90.23 %, incluyendo la explicación visual del modelo final con Grad-CAM. En el último de los problemas considerados en este campo, la monitorización del estado de la herramienta, se ha segmentado la zona de desgaste de la para supervisar su estado con un 92 % de precisión. La línea de investigación relacionada con la ganadería se centra en la ganadería de precisión y en la búsqueda del máximo bienestar animal. Por un lado, se ha planteado la estimación del peso de los corderos mediante sistemas de visión , ya que reduce la interacción del ganadero con el animal y, por tanto, el estrés causado. Por otro lado, permite el seguimiento del peso para identificar el momento óptimo que resulta útil para los productores de carne. El enfoque propuesto proporciona un sistema basado en la visión con bajos requisitos de hardware, sólo un dispositivo móvil o electrónico con una cámara, en lugar de costosas infraestructuras como el pesaje a pie (WOW). Por otro lado, otro sistema propuesto se ocupa de ayudar a la ganadería basada en los pastos mediante la detección de especies peligrosas. Para ello, se determina la presencia de especies como el lobo ibérico en entornos naturales o lugares de difícil acceso. Así, se pueden reducir los ataques al ganado evitando aquellos lugares donde se encuentran los depredadores. El sistema propuesto puede desplegarse en cámaras fijas cercanas a las zonas de pastoreo o incluso en robots. Los experimentos de estimación del peso de corderos de raza Rasa Aragonesa, obteniendo una precisión de 0.1 kilos de MAE y 0.98 de R2 utilizando caracterísitcas extraidas del contorno del animal. Además, usando transfer learning se ha conseguido un MAE de 0.59 kilos y un R2 de 0.96. Por último, se ha desarrollado un módulo de visión para el pastoreo con un perro robot (VISORED) ha sido desarrollado para detectar lobos y perros en imágenes -siendo posible adaptarlo a otras especies-; este sistema utiliza YOLOv5 para detectar las especies consideradas con una precisión del 99.17 %. En conclusión, se han propuesto técnicas de visión por computador tradicionales y otras más recientes basadas en Redes Neuronales Convolucionales que se han aplicado a diferentes campos para resolver diversos problemas existentes. Los resultados obtenidos muestran que permiten automatizar tareas con gran precisión, cumpliendo los requisitos establecidos. A lo largo de esta tesis se han generado nuevos conjuntos de datos que están disponibles públicamente. Además, algunos de los métodos propuestos han sido publicados a través de congresos internacionales y revistas científicas, mientras que otros trabajos presentados están aún a la espera de respuesta.