Data-efficient deep learningage, expression, pornography, and sexual activity detection for crime prevention

  1. Kumar, Abhishek Gangwar
Dirigida por:
  1. Víctor González Castro Director
  2. Enrique Alegre Gutiérrez Director

Universidad de defensa: Universidad de León

Fecha de defensa: 03 de febrero de 2022

Tribunal:
  1. Laura Fernández Robles Presidenta
  2. Ana Lucila Sandoval Orozco Secretario/a
  3. Sandra Eliza Fontes de Ávila Vocal

Tipo: Tesis

Resumen

El creciente número de casos relacionados con la posesión y distribución de material de abuso sexual de menores (ASM) supone un reto importante para las fuerzas del orden. Del mismo modo, la detección de contenido pornográfico es también un área activa de investigación. En esta Tesis, proponemos diferentes métodos novedosos para el reconocimiento de ASM y material pornográfico. Nuestra estrategia consiste en dividir el problema de la detección automática de ASM en dos más simples: (i) la detección de contenido pornográfico y (ii) la clasificación de una persona por grupos de edad: como menor de edad o adulto. Este enfoque no solo simplifica el problema, sino que también hace posible la creación de conjuntos de datos etiquetados masivos, especialmente para entrenar redes neuronales profundas. Teniendo en cuenta este objetivo, en primer lugar, hemos propuesto una arquitectura de red neuronal convolucional profunda (CNN) con un novedoso mecanismo de atención y aprendizaje métrico, denotada AttM-CNN, para estas tareas. Además, las redes de detección de pornografía y de clasificación por grupos de edad se combinaron para la detección de ASM utilizando dos estrategias diferentes: fusión a nivel de decisión, para la clasificación binaria de ASM, y fusión a nivel de puntuación, para la ordenación de las imágenes en función de cuán sospechosas resultan. También presentamos dos nuevos conjuntos de datos: (i) Pornographic-2M, que contiene dos millones de imágenes pornográficas, y (ii) Juvenile-80k, que incluye unas 80.000 imágenes etiquetadas manualmente con edad facial aparente. Nuestro enfoque proporcionó mejores resultados que otros métodos del estado de la técnica en un conjunto de datos de prueba compuesto por un millón de imágenes pornográficas de adultos, un millón de imágenes no pornográficas y 5.000 imágenes reales de ASM que nos proporcionaron las fuerzas policiales.