Detecting Textual Information in Images from Onion Domains Using Text Spotting
- Pablo Blanco 1
- Eduardo Fidalgo 1
- Enrique Alegre 1
- Mhd Wesam Al-Nabki 1
-
1
Universidad de León
info
- Inés Tejado Balsera (coord.)
- Emiliano Pérez Hernández (coord.)
- Antonio José Calderón Godoy (coord.)
- Isaías González Pérez (coord.)
- Pilar Merchán García (coord.)
- Jesús Lozano Rogado (coord.)
- Santiago Salamanca Miño (coord.)
- Blas M. Vinagre Jara (coord.)
Editorial: Universidad de Extremadura
ISBN: 978-84-9749-756-5, 978-84-09-04460-3
Año de publicación: 2018
Páginas: 975-982
Congreso: Jornadas de Automática (39. 2018. Badajoz)
Tipo: Aportación congreso
Resumen
Debido a los esfuerzos de diferentes autoridades en la lucha contra las actividades ilegales en las redes Tor, los comerciantes han desarrollado nuevas formas de eludir las herramientas de monitoreo utilizadas para obtener evidencia de dichas actividades. En particular, la incorporación de contenido textual en objetos gráficos evita que el análisis de texto, utilizando algoritmos de Procesamiento de Lenguaje Natural (NLP), se pueda usar para ver dichos contenidos web de cebolla. En este documento, presentamos un marco de Text Spotting dedicado a detectar y reconocer información textual en imágenes alojadas en dominios de cebolla. Encontramos que la Red de propuestas de texto conexionista y la Red neuronal recurrente convolucional alcanzan 0.57 F-Measure cuando se ejecuta la tubería combinada en un subconjunto de 100 imágenes etiquetadas manualmente obtenidas del conjunto de datos TOIC. También identificamos los parámetros que tienen una influencia crítica en los resultados de Text Spotting. La técnica propuesta podría apoyar herramientas para ayudar a las autoridades a detectar estas actividades.