Un sistema automatico in grado di identificare tweet con contenuti misogini e aggressivi. Lo ha messo a punto un team dell’Università di Bologna, ottenendo la migliore performance nella sezione “Automatic Misogyny Identification” dell’ultima edizione di EVALITA, iniziativa dedicata allo sviluppo di sistemi NLP (Natural Language Processing, ovvero di elaborazione del linguaggio naturale) per la lingua italiana.
Il sistema è stato realizzato da Arianna Muti, studentessa del corso di laurea magistrale Language, Society and Communication (supervisionata dal professor Fabio Tamburini), insieme ad Alberto Barrón-Cedeño, ricercatore al Dipartimento di Interpretazione e Traduzione.
"Twitter fa affidamento sulle segnalazioni degli utenti per identificare e rimuovere tweet con contenuti violenti e offensivi, ma in molti casi questo tipo di contenuti non viene intercettato", spiega Arianna Muti. "Per questo è importante trovare soluzioni che in automatico siano in grado di riconoscere tweet in cui compaiono discorsi d’odio, in particolare nei confronti delle donne: una delle categorie più colpite dall’uso del linguaggio offensivo sui social media".
Basandosi su un algoritmo di analisi della lingua italiana addestrato a partire da un database di 5.000 tweet, il sistema è in grado di individuare in automatico tweet che contengono messaggi misogini e aggressivi nei confronti delle donne. I tweet vengono letti e analizzati dall’algoritmo e in seguito classificati in tre categorie: non misogino, misogino e non aggressivo, misogino e aggressivo.