I dati sono stati raccolti utilizzando lo strumento
YouTube Data Tools, con l'uso delle seguenti query di ricerca:
Per ciascuna query, sono stati raccolti i primi 200
video.
Dalla raccolta di video, sono stati eliminati:
→ I video duplicati;
→ I
video in lingue diverse dall'italiano;
→
I video che non menzionavano esplicitamente l'ambiente urbano o una
città specifica;
→ I video
che non menzionavano esplicitamente la biodiversità nel titolo o
nella descrizione.
Il transcript di ciascun video è stato generato mediante l'utilizzo
dello strumento di riconoscimento vocale
VOSK Models.
Le menzioni degli animali sono state contate con
l'ausilio di
Videogrep.
Lo stesso tool è stato utlizzato per generare i Supercut.
La
lista delle menzioni degli animali è stata poi uniformata seguendo i
seguenti criteri:
→ I plurali
e i singolari sono stati resi al singolare;
→
Parole come 'etti' e 'ini' sono rimaste invariate, ad esempio
'tartarughine' e 'passerotto';
→
I nomi al femminile e al maschile sono rimasti separati;
→
Le forme contratte come 'all'aquila' e 'dell'aquila' sono state
uniformate in 'aquila';
→ Le
forme contratte come 'un'ape', 'dell'ape' e 'l'ape' sono state
uniformate in 'ape';
→ Le
forme al femminile come 'gallina' e 'gallinella' sono rimaste
separate.