166932 — Zahid Mehdi
24/06/2025 — Università degli Studi di Udine
Data Science Project - Mehdi Zahid - UNIUD 2025
Questo progetto analizza l'engagement dei politici italiani su TikTok durante le elezioni politiche del 2022. L'obiettivo è valutare il potenziale predittivo delle metriche social rispetto ai risultati elettorali ufficiali.
Lo studio è stato ispirato da casi reali di microtargeting politico tramite social media, in particolare lo scandalo Cambridge Analytica durante la campagna di Donald Trump (2016). L'obiettivo era indagare se anche in Italia esistano segnali di relazione tra attività social e performance elettorale.
Facebook_Tiktok_metadata.csv
Per correttezza: “Dati elettorali da un progetto di onData”
Domande guida del progetto
Categoria | Valore |
---|---|
Video Totali Analizzati | 1,744 |
Video Utilizzabili (Finale) | 220 (12.6%) |
Video Scartati (Fuzzy Matching) | 1,524 (87.4%) |
Efficienza Pipeline | 12.6% |
Pipeline di Fuzzy Matching → Politici riconosciuti correttamente
La maggior parte dei video (87.4%) non hanno match validi, dovuta a:
Pipeline di Fuzzy Matching → Politici riconosciuti correttamente
Analisi delle curve di densità (KDE) per comprendere la forma e la simmetria delle principali variabili quantitative:
Distribuzioni KDE per identificare skew, outlier e tendenze
Analisi delle performance su quattro metriche chiave per identificare i partiti più efficaci su TikTok:
Per ogni metrica viene mostrata la top 8 dei partiti più performanti. Il formato abbreviato (K
, M
) facilita la lettura dei volumi.
Come arrivare al risultato:
Variabile | Pearson | Spearman | Kendall | P-Pearson | P-Spearman | P-Kendall |
---|---|---|---|---|---|---|
Numero Post | 0.839 | 0.905 | 0.786 | 0.009 | 0.002 | 0.006 |
Views Totali | 0.541 | 0.833 | 0.714 | 0.166 | 0.010 | 0.014 |
Engagement Totale | 0.174 | 0.714 | 0.571 | 0.680 | 0.047 | 0.061 |
Confronto tra coefficienti di correlazione per ogni metrica TikTok
Tra tutte le metriche analizzate, il numero di post TikTok mostra:
Views ed Engagement mostrano buoni valori ma con significatività più debole.
Confronto tra coefficienti di correlazione per ogni metrica TikTok
Come arrivare al risultato:
Metrica | Valore |
---|---|
R² (Varianza spiegata) | 0.703 → 70.3% |
MAE (Errore Medio Assoluto) | 941,922 voti (31.0%) |
RMSE (Errore Quadratico Medio) | 1,158,744 voti (38.2%) |
Valutazione delle prestazioni del modello di regressione lineare
Conclusione: modello buono. Adatto a stime generali, meno a previsioni precise per partiti minori.
Valutazione delle prestazioni del modello di regressione lineare
Data Science Project - Mehdi Zahid - UNIUD 2025