SlideShare a Scribd company logo
1 of 38
Download to read offline
Detección Automática de Misoginia en
MEMES Mediante Técnicas de Deep
Learning
Trabajo de Fin de Grado
Pablo Cordón Hidalgo
ÍNDICE
INTRODUCCIÓN
❖ Objetivos
❖ Definición de misoginia
❖ Definición de “meme”
COMPETICIÓN SEMEVAL-2022
PROPUESTAS DE MEJORA
01 02
03
CONCLUSIONES
04
❖ Descripción de la tarea a
resolver
❖ Tecnologías utilizadas
❖ Análisis del conjunto de datos
❖ Soluciones propuestas y
resultados
❖ Marco de experimentación
❖ Optimización de
hiperparámetros
❖ Ensembles
❖ Conclusión
❖ Trabajo futuro
2
Introducción
3
1.1 Objetivos
❖ Participación tarea 5 de
SemEval-2022: detección de misoginia
en memes en inglés
❖ Implementación modelos Machine
Learning y Deep Learning
❖ Publicación de un paper científico
4
1.2 ¿Qué es la misoginia?
M I S O G I N I A
5
“Misos”
odio
“Gyné”
mujer
Sufijo “-ia”
referido a
Del griego misogynía, aversión, desprecio u odio a
las mujeres
1.2 ¿Qué es un meme?
6
❖ Imagen con texto superpuesto a posteriori
con un significado conjunto
❖ Objetivo: ser divertido y/o irónico
❖ Gran valor como manifestación cultural
❖ Amplia difusión en entornos digitales
1.2 ¿Qué es un meme?
7
¿Cómo sabemos cuando un meme es
misógino?
- Aunque en ocasiones hay características que
nos dan pistas, no siempre es tan sencillo
NECESIDAD: Automatizar la detección de memes
misóginos de la forma más precisa posible
Competición
SemEval-2022
8
2.1 Descripción
de la tarea a
resolver
9
Subtarea A de la tarea 5 de
SemEval2022
Clasificación binaria una sola etiqueta
Cada meme será misógino (1) o no
misógino (0)
2.2 Tecnologías utilizadas
10
PYTHON COLAB TENSORFLOW
HUGGINGFACE NUDENET
2.3 Análisis del conjunto de
datos
11
Conjuntos de train y test
Misógino
No Misógino
Total
Train Test
5.000
5.000
10.000
500
500
1.000
Fecha de publicación
● Conjunto de train (periodo de
entrenamiento)
1 de octubre de 2021
● Conjunto de test sin etiquetar
(periodo de evaluación)
10 de enero de 2022
● Conjunto de test etiquetado
(post-evaluación)
2 de Febrero de 2022
12
2.3 Análisis del conjunto de
datos
file_name misogynous shaming stereotype objetification violence
Text
Transcription
10.jpg 1 0 0 0 1
ROSES ARE
RED, VIOLETS
ARE BLUE IF
YOU DON'T SAY
YES, I'LL JUST
RAPE YOU
quickmeme.com
13
2.3 Análisis del conjunto de
datos
file_name misogynous shaming stereotype objetification violence
Text
Transcription
1.jpg 0 0 0 0 0 Milk Milk.zip
14
2.3 Análisis del conjunto de
datos
Palabras Frecuentes
Clase 1 Clase 0
15
2.4 Soluciones Propuestas
Métricas utilizadas
Predicción
Negativo Positivo
Valor real
Negativo
True
Negative
(TN)
False
Positive
(FP)
Positivo
False
Negative
(FN)
True
Positive
(TP)
Matriz de confusión
f1-score
precisión
recall
accuracy
2.4 Soluciones Propuestas
16
Preprocesamiento del texto
V1 V2 V3
❖ Caracteres a minúsculas
❖ Eliminación de páginas web
❖ signos de puntuación
❖ números.
❖ palabras < 2 caracteres
❖ stopwords
❖ Funcionalidades V1
❖ Eliminación de usuarios (@...)
❖ Hashtags (#...)
❖ Enlaces
❖ Específico para modelos
Transformer
❖ Funcionalidades V2 excepto:
❖ NO se eliminan stopwords
❖ NO se eliminan caracteres
menores a cierta longitud
2.4 Soluciones Propuestas
17
Nudenet
file_name misogynous Text Transcription Unsafe
10.jpg 1 roses are red… 0.0005
1002.jpg 1 Its super rare… 0.691
10029.jpg 0 just call me harry… 0.003
10039.jpg 0 valentines days coming… 0.102
Umbral de inseguridad: 0.45
2.4 Soluciones Propuestas
18
Transformers
Técnica más usada actualmente
para NLP
Modelos de Deep Learning que
hacen uso de capas de atención
BERT es el modelo pre-entrenado
más famoso, se desarrollan los
modelos BERT-based
2.4 Soluciones Propuestas
19
Transformers
2.4 Soluciones Propuestas
20
Transformers
Modelo accuracy precision recall F1-score
BiLSTM BERT embedding +
nudenet
0.670 0.66 0.65 0.665
BiLSTM BERT embedding 0.662 0.65 0.64 0.652
Clasificador BERT Fine-tuning
+ nudenet
0.658 0.69 0.66 0.649
Clasificador BERT Fine-tuning 0.654 0.67 0.65 0.645
Conv1D BERT embedding +
nudenet
0.641 0.69 0.64 0.639
Conv1D BERT embedding 0.635 0.68 0.62 0.630
2.4 Soluciones Propuestas
21
Transformers
Posición 43 de 83 participantes
Modelo accuracy precision recall F1-score
BiLSTM BERT embedding +
nudenet
0.670 0.66 0.65 0.665
Propuestas
de mejora
22
3.1 Marco de Experimentación
23
3.2 Optimización de hiperparámetros
24
Parámetros elegidos
Parámetro Valores
número de épocas [2, 3, 4]
batch size [16, 32]
learning rate [4e-5, 3e-5, 2e-5]
3.2 Optimización de hiperparámetros
25
Modelos elegidos
bert-base-uncased bert-large-uncased xlnet-base-cased
roberta-base roberta-large-misogyny distilbert-base-uncased
3.2 Optimización de hiperparámetros
26
Mejores Resultados
Modelo Num
epochs
Batch
size
Learning
rate
Acc
nudenet
F1 Score
nudenet
Acc F1 Score
roberta-
misogyny
3 32 3e-05 0.692 0.680 0.681 0.673
roberta-
misogyny
4 32 4e-05 0.684 0.672 0.670 0.662
roberta-
misogyny
3 16 3e-05 0.679 0.668 0.665 0.658
bert-base
-uncased
3 32 2e-05 0.678 0.667 0.67 0.663
roberta-
misogyny
4 16 4e-05 0.680 0.665 0.669 0.659
3.2 Optimización de hiperparámetros
27
Mejores Resultados
Modelo Num
epochs
Batch
size
Learning
rate
Acc
nudenet
F1 Score
nudenet
Acc F1 Score
roberta-
misogyny
3 32 3e-05 0.692 0.680 0.681 0.673
Mejora 2.26% Posición 38
(+ 5)
3.2 Optimización de hiperparámetros
28
Peores Resultados
Modelo Num
epochs
Batch size Learning
rate
Acc
nudenet
F1 Score
nudenet
Acc F1 Score
bert-large 2 16 4e-05 0.500 0.333 0.500 0.333
bert-large 2 32 4e-05 0.563 0.524 0.549 0.517
distilbert 2 16 3e-05 0.638 0.617 0.630 0.615
xlnet 2 32 4e-05 0.638 0.621 0.627 0.616
bert-large 2 16 3e-05 0.643 0.622 0.637 0.622
3.3 Ensembles
29
Hard voting Soft voting
3.3 Ensembles
30
1ª aproximación - Mejores modelos etapa de evaluación
BiLSTM BERT
embedding
Conv 1D BERT
embedding
BERT classifier
Modelo accuracy F1-score
Hard Voting 0.674 0.667
Soft Voting + nudenet 0.659 0.645
Soft Voting 0.651 0.642
0.665 0.639 0.658
3.3 Ensembles
31
2ª aproximación - F1-scores complementarias
BiLSTM RoBERTa
misogyny
RoBERTa misogyny
fine-tuning
RoBERTa misogyny
puro
Modelo accuracy F1-score
Soft Voting +
nudenet
0.717 0.717
Hard Voting 0.709 0.710
Soft Voting 0.674 0.669
F1 media - 0.69 F1 clase 1 - 0.74 F1 clase 0 - 0.72
3.3 Ensembles
32
2ª aproximación
F1-scores complementarias
Modelo accuracy F1-score
Soft Voting + nudenet 0.717 0.717
Mejora 5.44% Posición 22
(+ 21)
Conclusiones
33
4.1 Conclusiones
34
Competición Mejoras
F1-score media 0.665 0.717
MEJORA DEL 7.82%
Posición 22
Paper científico
Eficacia de los transformers
Recursos accesibles
4.1 Conclusiones
35
Paper científico
Eficacia de los transformers
Recursos accesibles
4.2 Trabajo Futuro
36
Experimentos con datasets
desbalanceados
Uso de BD externas
Exploración de nuevas arquitecturas
(Multimodales)
37
GRACIAS
Dudas y preguntas
Pablo Cordón Hidalgo
pablo.cordon113@alu.uhu.es
38
GRACIAS
Dudas y preguntas
Pablo Cordón Hidalgo
pablo.cordon113@alu.uhu.es

More Related Content

Featured

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

Featured (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Presentación TFG Pablo Cordon.pdf

  • 1. Detección Automática de Misoginia en MEMES Mediante Técnicas de Deep Learning Trabajo de Fin de Grado Pablo Cordón Hidalgo
  • 2. ÍNDICE INTRODUCCIÓN ❖ Objetivos ❖ Definición de misoginia ❖ Definición de “meme” COMPETICIÓN SEMEVAL-2022 PROPUESTAS DE MEJORA 01 02 03 CONCLUSIONES 04 ❖ Descripción de la tarea a resolver ❖ Tecnologías utilizadas ❖ Análisis del conjunto de datos ❖ Soluciones propuestas y resultados ❖ Marco de experimentación ❖ Optimización de hiperparámetros ❖ Ensembles ❖ Conclusión ❖ Trabajo futuro 2
  • 4. 1.1 Objetivos ❖ Participación tarea 5 de SemEval-2022: detección de misoginia en memes en inglés ❖ Implementación modelos Machine Learning y Deep Learning ❖ Publicación de un paper científico 4
  • 5. 1.2 ¿Qué es la misoginia? M I S O G I N I A 5 “Misos” odio “Gyné” mujer Sufijo “-ia” referido a Del griego misogynía, aversión, desprecio u odio a las mujeres
  • 6. 1.2 ¿Qué es un meme? 6 ❖ Imagen con texto superpuesto a posteriori con un significado conjunto ❖ Objetivo: ser divertido y/o irónico ❖ Gran valor como manifestación cultural ❖ Amplia difusión en entornos digitales
  • 7. 1.2 ¿Qué es un meme? 7 ¿Cómo sabemos cuando un meme es misógino? - Aunque en ocasiones hay características que nos dan pistas, no siempre es tan sencillo NECESIDAD: Automatizar la detección de memes misóginos de la forma más precisa posible
  • 9. 2.1 Descripción de la tarea a resolver 9 Subtarea A de la tarea 5 de SemEval2022 Clasificación binaria una sola etiqueta Cada meme será misógino (1) o no misógino (0)
  • 10. 2.2 Tecnologías utilizadas 10 PYTHON COLAB TENSORFLOW HUGGINGFACE NUDENET
  • 11. 2.3 Análisis del conjunto de datos 11 Conjuntos de train y test Misógino No Misógino Total Train Test 5.000 5.000 10.000 500 500 1.000 Fecha de publicación ● Conjunto de train (periodo de entrenamiento) 1 de octubre de 2021 ● Conjunto de test sin etiquetar (periodo de evaluación) 10 de enero de 2022 ● Conjunto de test etiquetado (post-evaluación) 2 de Febrero de 2022
  • 12. 12 2.3 Análisis del conjunto de datos file_name misogynous shaming stereotype objetification violence Text Transcription 10.jpg 1 0 0 0 1 ROSES ARE RED, VIOLETS ARE BLUE IF YOU DON'T SAY YES, I'LL JUST RAPE YOU quickmeme.com
  • 13. 13 2.3 Análisis del conjunto de datos file_name misogynous shaming stereotype objetification violence Text Transcription 1.jpg 0 0 0 0 0 Milk Milk.zip
  • 14. 14 2.3 Análisis del conjunto de datos Palabras Frecuentes Clase 1 Clase 0
  • 15. 15 2.4 Soluciones Propuestas Métricas utilizadas Predicción Negativo Positivo Valor real Negativo True Negative (TN) False Positive (FP) Positivo False Negative (FN) True Positive (TP) Matriz de confusión f1-score precisión recall accuracy
  • 16. 2.4 Soluciones Propuestas 16 Preprocesamiento del texto V1 V2 V3 ❖ Caracteres a minúsculas ❖ Eliminación de páginas web ❖ signos de puntuación ❖ números. ❖ palabras < 2 caracteres ❖ stopwords ❖ Funcionalidades V1 ❖ Eliminación de usuarios (@...) ❖ Hashtags (#...) ❖ Enlaces ❖ Específico para modelos Transformer ❖ Funcionalidades V2 excepto: ❖ NO se eliminan stopwords ❖ NO se eliminan caracteres menores a cierta longitud
  • 17. 2.4 Soluciones Propuestas 17 Nudenet file_name misogynous Text Transcription Unsafe 10.jpg 1 roses are red… 0.0005 1002.jpg 1 Its super rare… 0.691 10029.jpg 0 just call me harry… 0.003 10039.jpg 0 valentines days coming… 0.102 Umbral de inseguridad: 0.45
  • 18. 2.4 Soluciones Propuestas 18 Transformers Técnica más usada actualmente para NLP Modelos de Deep Learning que hacen uso de capas de atención BERT es el modelo pre-entrenado más famoso, se desarrollan los modelos BERT-based
  • 20. 2.4 Soluciones Propuestas 20 Transformers Modelo accuracy precision recall F1-score BiLSTM BERT embedding + nudenet 0.670 0.66 0.65 0.665 BiLSTM BERT embedding 0.662 0.65 0.64 0.652 Clasificador BERT Fine-tuning + nudenet 0.658 0.69 0.66 0.649 Clasificador BERT Fine-tuning 0.654 0.67 0.65 0.645 Conv1D BERT embedding + nudenet 0.641 0.69 0.64 0.639 Conv1D BERT embedding 0.635 0.68 0.62 0.630
  • 21. 2.4 Soluciones Propuestas 21 Transformers Posición 43 de 83 participantes Modelo accuracy precision recall F1-score BiLSTM BERT embedding + nudenet 0.670 0.66 0.65 0.665
  • 23. 3.1 Marco de Experimentación 23
  • 24. 3.2 Optimización de hiperparámetros 24 Parámetros elegidos Parámetro Valores número de épocas [2, 3, 4] batch size [16, 32] learning rate [4e-5, 3e-5, 2e-5]
  • 25. 3.2 Optimización de hiperparámetros 25 Modelos elegidos bert-base-uncased bert-large-uncased xlnet-base-cased roberta-base roberta-large-misogyny distilbert-base-uncased
  • 26. 3.2 Optimización de hiperparámetros 26 Mejores Resultados Modelo Num epochs Batch size Learning rate Acc nudenet F1 Score nudenet Acc F1 Score roberta- misogyny 3 32 3e-05 0.692 0.680 0.681 0.673 roberta- misogyny 4 32 4e-05 0.684 0.672 0.670 0.662 roberta- misogyny 3 16 3e-05 0.679 0.668 0.665 0.658 bert-base -uncased 3 32 2e-05 0.678 0.667 0.67 0.663 roberta- misogyny 4 16 4e-05 0.680 0.665 0.669 0.659
  • 27. 3.2 Optimización de hiperparámetros 27 Mejores Resultados Modelo Num epochs Batch size Learning rate Acc nudenet F1 Score nudenet Acc F1 Score roberta- misogyny 3 32 3e-05 0.692 0.680 0.681 0.673 Mejora 2.26% Posición 38 (+ 5)
  • 28. 3.2 Optimización de hiperparámetros 28 Peores Resultados Modelo Num epochs Batch size Learning rate Acc nudenet F1 Score nudenet Acc F1 Score bert-large 2 16 4e-05 0.500 0.333 0.500 0.333 bert-large 2 32 4e-05 0.563 0.524 0.549 0.517 distilbert 2 16 3e-05 0.638 0.617 0.630 0.615 xlnet 2 32 4e-05 0.638 0.621 0.627 0.616 bert-large 2 16 3e-05 0.643 0.622 0.637 0.622
  • 30. 3.3 Ensembles 30 1ª aproximación - Mejores modelos etapa de evaluación BiLSTM BERT embedding Conv 1D BERT embedding BERT classifier Modelo accuracy F1-score Hard Voting 0.674 0.667 Soft Voting + nudenet 0.659 0.645 Soft Voting 0.651 0.642 0.665 0.639 0.658
  • 31. 3.3 Ensembles 31 2ª aproximación - F1-scores complementarias BiLSTM RoBERTa misogyny RoBERTa misogyny fine-tuning RoBERTa misogyny puro Modelo accuracy F1-score Soft Voting + nudenet 0.717 0.717 Hard Voting 0.709 0.710 Soft Voting 0.674 0.669 F1 media - 0.69 F1 clase 1 - 0.74 F1 clase 0 - 0.72
  • 32. 3.3 Ensembles 32 2ª aproximación F1-scores complementarias Modelo accuracy F1-score Soft Voting + nudenet 0.717 0.717 Mejora 5.44% Posición 22 (+ 21)
  • 34. 4.1 Conclusiones 34 Competición Mejoras F1-score media 0.665 0.717 MEJORA DEL 7.82% Posición 22 Paper científico Eficacia de los transformers Recursos accesibles
  • 35. 4.1 Conclusiones 35 Paper científico Eficacia de los transformers Recursos accesibles
  • 36. 4.2 Trabajo Futuro 36 Experimentos con datasets desbalanceados Uso de BD externas Exploración de nuevas arquitecturas (Multimodales)
  • 37. 37 GRACIAS Dudas y preguntas Pablo Cordón Hidalgo pablo.cordon113@alu.uhu.es
  • 38. 38 GRACIAS Dudas y preguntas Pablo Cordón Hidalgo pablo.cordon113@alu.uhu.es