Compartir
Título
Data-efficient deep learning: age, expression, pornography, and sexual activity detection for crime prevention
Autor
Director/es
Facultad/Centro
Área de conocimiento
Cita Bibliográfica
Kumar, A. G. (2022). Data-efficient deep learning: age, expression, pornography, and sexual activity detection for crime prevention. [Tesis doctoral, Universidad de León]
Fecha
2022-01-29
Resumen
[ES] El creciente número de casos relacionados con la posesión y distribución de material
de abuso sexual de menores (ASM) supone un reto importante para las fuerzas del orden.
Del mismo modo, la detección de contenido pornográfico es también un área activa de
investigación. En esta Tesis, proponemos diferentes métodos novedosos para el recono-
cimiento de ASM y material pornográfico.
Nuestra estrategia consiste en dividir el problema de la detección automática de ASM
en dos más simples: (i) la detección de contenido pornográfico y (ii) la clasificación de
una persona por grupos de edad: como menor de edad o adulto. Este enfoque no solo
simplifica el problema, sino que también hace posible la creación de conjuntos de datos
etiquetados masivos, especialmente para entrenar redes neuronales profundas. Teniendo
en cuenta este objetivo, en primer lugar, hemos propuesto una arquitectura de red neu-
ronal convolucional profunda (CNN) con un novedoso mecanismo de atención y apren-
dizaje métrico, denotada AttM-CNN, para estas tareas. Además, las redes de detección
de pornografía y de clasificación por grupos de edad se combinaron para la detección
de ASM utilizando dos estrategias diferentes: fusión a nivel de decisión, para la clasifica-
ción binaria de ASM, y fusión a nivel de puntuación, para la ordenación de las imágenes
en función de cuán sospechosas resultan. También presentamos dos nuevos conjuntos
de datos: (i) Pornographic-2M, que contiene dos millones de imágenes pornográficas, y
(ii) Juvenile-80k, que incluye unas 80.000 imágenes etiquetadas manualmente con edad
facial aparente. Nuestro enfoque proporcionó mejores resultados que otros métodos del
estado de la técnica en un conjunto de datos de prueba compuesto por un millón de
imágenes pornográficas de adultos, un millón de imágenes no pornográficas y 5.000 imá-
genes reales de ASM que nos proporcionaron las fuerzas policiales [EN] The growing number of cases of possession and distribution of Child Sexual Abuse
(CSA) material poses a significant challenge for Law Enforcement Agencies (LEAs). Simil-
arly, pornographic content detection is also an active area of research. In this Thesis, we
propose different novel methods for CSA and pornographic material recognition.
Our strategy lies in dividing the problem of automatically detecting CSA into two sim-
pler ones: (i) pornographic content detection and (ii) age-group classification of a person
as a minor or an adult. This approach not only simplifies the problem but also makes
it feasible to create massive labelled datasets, especially to train deep neural networks.
With this goal in mind, first, we proposed a deep Convolutional Neural Network (CNN)
architecture with a novel attention mechanism and metric learning, denoted as AttM-
CNN, for these tasks. Furthermore, pornography detection and the age-group classifica-
tion networks were combined for CSA detection using two different strategies: decision
level fusion for binary CSA classification and score level fusion for the re-arrangement of
the suspicious images. We also introduced two new datasets: (i) Pornographic-2M, which
contains two million pornographic images, and (ii) Juvenile-80k, including 80k manually
labelled images with apparent facial age. Our approach provided better results than other
state-of-the-art methods on a test dataset comprising one million adult pornographic im-
ages, one million non-pornographic images, and 5,000 real CSA images provided to us by
Police Forces.
The methods and datasets introduced in this Thesis are useful for the research com-
munity and our work extended the state-of-the-art in pornography detection, age estim-
ation, and CSA detection. All these methods can help LEAs in the task of automatic CSA
detection more accurately
Materia
Palabras clave
URI
DOI
Aparece en las colecciones
- Tesis [1353]
Ficheros en el ítem
Nombre:
Data_efficient_deep_learning.pdfEmbargado hasta: 2025-12-31
Tamaño:
7.505
xmlui.dri2xhtml.METS-1.0.size-megabytes
Formato:
Adobe PDF