E’ stato uno degli argomenti trainanti dell’estate: la devastante ondata di calore che ha colpito la Russia e, in particolare, la zona dei raccolti, con siccità e incendi. Il climatologo Joe Wheatley ha condotto un interessante studio grazie al software statistico R (che utilizziamo anche qui su CM). Lo scienziato ha recuperato i dati NCEP consolidati, e dopo un lavoro di standardizzazione e spazializzazione dei dati, li ha rappresentati tramite la funzione smoothScatter (qui la documentazione).
Devo precisare di non aver mai utilizzato questa funzione ma, visti i risultati raggiunti da Wheatley, la ritengo di estremo interesse e prima o poi ne affronteremo una qualche applicazione pratica anche qui su CM.
Come emerge dal grafico, il mese di Giugno è un vero e proprio outlier, Luglio lo è in misura minore. Nel grafico troviamo rappresentati i dati del periodo 1948-2010.
Direi proprio di no.
Letto con interesse, non sapevo cosa fosse un ‘Outlier’ (il mio esame di probabilità e statistica non era così completo), ed allora mi sono documentato qui:
http://it.wikipedia.org/w/index.php?title=Outlier&action=submit
dal quale scopro essere un dato ‘aberrante’ in una serie di dati campionari che spesso va eliminato, filtrato, corretto…
Torna allora in mente il famoso ‘hockey stick’ in cui, nell’infinita polemica condotta anche su questo portale, si era detto di tutto dell’eliminazione di dati troppo discordanti dai trend generali ad opera di Mann & Company e che avrebbe ‘falsato’ il famoso grafico…
Ma allora, visti cosa sono gli outlier, le cose non stavano proprio nei termini di quella polemica, giusto Sig.Gravina?