Le anomalie di temperatura media mondiale scaricabili da qui sono state aggiornate con i dati relativi al mese di marzo 2012. Ho descritto l’aggiornamento di febbraio 2012 su CM, qui. Le differenze di temperatura tra novembre 2011 e marzo 2012 mostrano una piccola sorpresa: sono praticamente identiche (plot in basso e pdf) a quelle di febbraio ma più smussate tra gli anni 1930-1960 e sistematicamente appena più alte dal 1940 ad oggi.
A causa della forte somiglianza, il confronto con l’aggiornamento dello scorso mese si apprezza meglio nel grafico dedicato ai soli due ultimi mesi, sotto e qui.
I valori numerici delle differenze novembre11-marzo12 sono disponibili qui. Vorrei ricordare che i dati originali sono forniti in forma di anno, mese, anomalia e che io li trasformo in anno.mese/12. Questa trasformazione implica che l’anomalia media mensile si riferisce alla fine del mese, non al 15 come viene fatto in altre situazioni. La ragione è che voglio una media di anomalie (o di temperature) e non una media temporale: la media delle temperature la calcolo solo quando ho tutti i dati, cioè a fine mese. Risulterà quindi che dicembre di un certo anno viene calcolato come (anno+1).0 (ad es: dicembre 1992=1993.0).
I dati continuano ad oscillare tra dicembre 2011 (linea rossa prima immagine) per gli anni all’inizio della serie e gennaio 2012 (linea verde prima immagine) per la parte finale. La parte centrale- tra il 1920 e il 1950 – è mediamente simile ma con ampie differenze nei singoli profili; in particolare, marzo mostra uno smussamento rispetto a febbraio.
Da questo mese avevo avuto la tentazione di rovesciare i grafici calcolando i (singoli mesi meno novembre 2011) invece di (nov11-singoli mesi) come è ora. In questo modo la lettura dei plot sarebbe stata simile a quella delle anomalie di temperatura, e di comprensione più immediata. Almeno apparentemente. Infatti un’anomalia è la differenza tra una serie temporale e un valore costante e quindi mantiene la forma della serie dei dati che interessano.
In questo caso il “valore di riferimento” non è un numero ma un’altra serie e quindi la forma dei dati cambia. Per evitare di scambiare per anomalia qualcosa che non lo è e quindi generare confusione, preferisco mantenere il segno originale dei dati.
Quindi continua a cambiare sempre tutto per non cambiare niente? Sembra di si, anche se continuo a non capire perché sia necessario modificare i dati storici del 1880 ogni volta che si aggiunge un dato alla serie.
[…] i dati relativi al mese di aprile 2012. Ho descritto l’aggiornamento precedente (marzo 2012) qui. Le differenze di temperature (novembre 2011-aprile 2012) si presentano così […]
E’ vero. I dati meteorologici possono dare più di una perplessità, in particolare quelli ottenuti come medie mondiali, combinazioni terra+oceano e correzioni per la varianza, ma sarei molto cauto nell’affermare che sono “numeri del lotto” o qualcosa del genere. Tutti i gruppi di ricerca che si occupano di elaborare i dati grezzi delle stazioni meteo mettono molta attenzione nella precisione delle misure che rendono disponibili alla comunità scientifica: e questi risultati sono sottoposti al vaglio di molti (direi tutti) altri gruppi che quei dati usano per gli scopi più vari. Non sono un climatologo, ma direi che i differenti gruppi di ricerca sono tutt’altro che omogenei e che dati sbagliati o non condivisi significa essere azzannati alla gola dai “rivali”.
Un’altra cosa da sottolineare è che i dati NON sono indipendenti (ad esempio i dati interpolati dipendono dalla stazioni usate per l’interpolazione) e questo fatto complica in modo tutt’altro che banale il calcolo degli errori.
I dati CRU (ad esempio CRUTEM4 con le sue varianti di dati emisferici e globali) vengono pubblicati con tre cifre decimali per permettere, esplicitamente, il calcolo dei valori emisferici con la precisione di due cifre decimali (+-0.01°C).
Sempre per i dati CRU, viene detto che l’aggiunta di un nuovo mese può portare variazioni fino a 2-3 anni prima.
Non ho trovato commenti simili per i dati noaa ma non mi aspetto cose molto diverse per la precisione e non mi sarei aspettato cose diverse anche per l’influenza dei nuovi dati aggiunti.
Invece questa diversità c’è, e senza una spiegazione (o non l’ho trovata o ancora, se c’è e l’ho trovata, non l’ho capita).
Può darsi, come scrive Donato, che queste fluttuazioni siano casuali (non ci credo molto, ma quando avrò più dati calcolerò la loro distribuzione di frequenza e vedremo).
Franco
A questo punto ho l’impressione che l’andamento delle anomalie stia assumendo la forma di una specie di rumore casuale. Fermo restanti le sistematicità evidenziate negli altri post, dai grafici emerge un andamento imprevedibile delle anomalie. Quelle di marzo12 vs novembre11, per esempio, sono in alcuni casi maggiori di quelle di febbraio12 e minori di gennaio12, in altri maggiori di gennaio12 e minori di febbraio12. Probabilmente si arriverà ad una stabilizzazione (come sembra essere già avenuto per il periodo immediatamente successivo al 1880), ma resterà sempre il mistero circa il perché di questi dati ballerini che si traducono in anomalie diverse da un mese all’altro, per temperature che dovrebbero essere considerate un dato di fatto non più modificabile (quelle relative ad anni passati). Chissà che razza di algoritmo di omogeneizzazione utilizzano.
Ciao, Donato.
“Continuo a non capire perché sia necessario modificare i dati storici del 1880 ogni volta che si aggiunge un dato alla serie”.
Chiedo scusa, sono un semplice lettore del vostro blog, non sono uno specialista. Vorrei però capire l’ultima frase dell’articolo, quella che ho riportato. Da profano, trovo difficile capire come un dato del 2012 possa influenzare un dato del 1880. Comunque immagino che ci siano serie ragioni scientifiche se questo succede e che chi ha scritto l’articolo le conosca, pur senza condividerle. Potreste spiegarle anche a me, con parole comprensibili a un profano? Grazie in anticipo e complimenti per il vostro blog, che trovo molto interessante.
I dati NOAA (il cui nome ufficiale è GHCN-M 3.1.0, cioè Global
Historical Climatology Network-Monthly) da novembre 2011 hanno subito una
correzione per i cambiamenti apportati alle stazioni meteorologiche
(spostamenti, modifica degli orari di osservazione e/o di strumenti, ecc.) e una miglioria software per aumentare l’efficienza del sistema (sono state usate matrici dette
Skyline). La descrizione di quanto è stato fatto si trova nel rapporto tecnico reperibile al sito NOAA NCDC (nell’area iniziale definita da Note:).
Le modifiche descritte sono condivisibili, necessarie e possono
senz’altro aver cambiato anche i dati dal 1880. Non dimentichiamo che i
valori numerici del dataset (le anomalie) derivano da temperature medie
mondiali e che quindi sono il risultato di una serie piuttosto lunga, e in alcuni
passaggi complessa, di operazioni di media sulle misure di tutte
le fasce di longitudine e per ogni fascia su tutte le latitudini
– da 90° sud a 90° nord – per di più interpolate (cioè coprendo le zone senza stazioni
meteorologiche con dati derivati dalle stazioni attorno). Quindi è
possibile avere dati modificati fin dall’inizio. Però, a mio parere,
solo la prima volta, quando viene fatta la correzione. Ogni volta che si aggiunge un
nuovo dato (cioè un nuovo mese) mi aspetto certamente che possa
modificare alcuni (o magari anche molti) dati precedenti proprio
perché ogni dato è il frutto di calcoli che includono altri
valori. Ma non mi spiego perché debbano essere (ogni mese!) cambiati
i dati storici. E nel rapporto tecnico non ho trovato nulla: anzi, nei
grafici che gli autori presentano (fanno riferimento solo agli Stati Uniti)
non sono mostrate variazioni di temperatura prima del 1910.
Non mi stancherò mai di sottolineare che le variazioni mostrate
nel post sono molto piccole, di millesimi e centesimi di grado centigrado, e
che quindi non influenzano nulla, ma che:
1) le anomalie rese pubbliche da NOAA hanno 4 cifre decimali, il che fa
pensare ad un’incertezza di misura (nel nostro caso, di elaborazione) del
decimillesimo di grado e che quindi i millesimi e centesimi di cui sopra
possano essere significativi (personalmente non ci credo, ma non conosco i
dettagli delle elaborazioni).
2) le differenze sono sistematiche: nel post precedente,
ultimo paragrafo, mostro il confronto tra novembre 2011 e febbraio 2012 da
cui si vede che i valori di febbraio, prima di una certa data (grosso modo
il 1930), sono tutti più alti di quelli di novembre e, dopo un periodo
di sostanziale uguaglianza, sono sempre più bassi. Questo comporta
una diminuzione di pendenza delle curve.
Non so il perché di queste differenze ed è per questo che
continuo a monitorare la situazione. Se lo sapessi, d’accordo
o meno, me ne farei una ragione e smetterei di salvare i file ogni mese per
evitare che si perda il ricordo, visto che i nuovi dati hanno lo stesso nome
dei vecchi e che quindi li sovrascrivono.
Franco
Grazie della spiegazione, ho capito un po’ più di prima. Comunque, sempre da uomo della strada, mi chiedo che valore fisico abbiano serie di dati approssimati a 0,001°C, quando i dati stessi sono soggetti a così pesanti interpolazioni. La matematica è una cosa, ma il senso fisico è altra cosa. O no?
Non essendo esperto del settore non rispondo direttamente sui dati in questione, ma l’osservazione è assolutamente corretta. Una delle prime cose che si insegnano a chi fa un corso di fisica sperimentale è relativa alla risoluzione delle misurazioni e il valore delle cifre decimali. Come tu dici correttamente, un calcolo matematico può tornare anche un gran numero di cifre decimali, ma poi queste vanno troncate in funzione della precisione, che deve essere nota. Come dicevo, non sono un esperto di climatologia o meteorologia, ma posso testimoniare che nel mio campo (ingegneria del software) vedo in continuazione report con cinque cifre decimali assolutamente fuori luogo, a dimostrazione che un sacco di gente quella lezione di fisica sperimentale non l’ha mai fatta o l’ha completamente dimenticata. Cosa tristissima in un mondo che poi si pretenderebbe guidato dalla scienza.