Gli strumenti statistici più diffusi possono produrre previsioni errate

40

Un nuovo studio evidenzia un potenziale difetto negli strumenti software ampiamente utilizzati che si basano su una tecnica di modellazione statistica comune chiamata ARIMA, sollevando preoccupazioni sull’accuratezza delle previsioni in campi che vanno dalla finanza all’ecologia. Jesse Wheeler, assistente professore presso l’Idaho State University, e il suo coautore, Edward Ionides, hanno scoperto che gli algoritmi che alimentano i modelli ARIMA in due ambienti software popolari potrebbero produrre stime inaffidabili, portando potenzialmente a previsioni e decisioni errate.

Comprendere i modelli ARIMA e la loro importanza

I modelli ARIMA (Autoregressive Integrated Moving Average) sono una pietra angolare dell’analisi delle serie temporali, un metodo utilizzato per analizzare i dati raccolti nel tempo. Funzionano mettendo in relazione il valore attuale di un parametro – come il prezzo delle uova o la popolazione di orsi in una foresta – con i suoi valori passati, consentendo ai ricercatori di identificare modelli, tendenze e, in definitiva, prevedere valori futuri.

Perché ARIMA è così comune

I modelli ARIMA sono spesso il primo metodo di serie temporale insegnato agli studenti e fungono da confronto di base durante lo sviluppo di nuovi algoritmi statistici e di apprendimento automatico. La loro versatilità li ha resi strumenti essenziali in varie discipline, tra cui:
Economia: Previsione delle tendenze del mercato e degli indicatori economici
Assistenza sanitaria: analisi dei dati dei pazienti e previsione delle epidemie
Meteo: previsione dell’andamento della temperatura e delle precipitazioni
Ecologia: Modellazione delle popolazioni animali e dei cambiamenti ambientali

La scoperta: un potenziale problema con la stima dei parametri

La ricerca di Wheeler e Ionides si è concentrata su un aspetto critico dei modelli ARIMA: la stima dei parametri. Le stime dei parametri utilizzano i dati campione raccolti per dedurre le caratteristiche di una popolazione più ampia. I ricercatori hanno riscontrato un potenziale problema di ottimizzazione all’interno dell’algoritmo di stima della massima verosimiglianza – un processo utilizzato per adattare modelli statistici – nel software utilizzato per implementare i modelli ARIMA.

“È come avere una calcolatrice che afferma di sommare correttamente due più due, ma a volte restituisce una risposta errata, ad esempio due più due fa tre”, spiega Wheeler. “Spesso ci affidiamo a software statistici come facciamo con una calcolatrice, quindi, se la calcolatrice ti dice che ti sta fornendo una stima di un parametro specifico, è meglio farlo con una sicurezza molto elevata.”

La portata del problema

I ricercatori hanno scoperto che le stime di massima verosimiglianza del software non erano completamente ottimizzate in un numero sorprendentemente elevato di casi, fino al 60% dei casi, a seconda dei dati e del modello. Ciò significa che gli algoritmi, nonostante pretendessero di massimizzare la verosimiglianza del modello, spesso non sono riusciti a farlo. Stime dei parametri inferiori agli standard, a loro volta, possono compromettere l’accuratezza delle previsioni e l’affidabilità di altre analisi statistiche.

Affrontare il problema e la via da seguire

Fondamentalmente, Wheeler e Ionides non si sono limitati a identificare il problema; hanno proposto un nuovo algoritmo per correggerlo e ne hanno dimostrato l’efficacia utilizzando il linguaggio di programmazione R. Ciò offre una soluzione pratica per ricercatori e professionisti che utilizzano modelli ARIMA.

“I modelli ARIMA vengono utilizzati ogni giorno da ricercatori e professionisti del settore per previsioni e analisi scientifiche in molti campi… Se il software che stima questi modelli presenta difetti, può potenzialmente portare a risultati inaspettati o decisioni sbagliate.”

Affrontando questi difetti nell’approccio della massima verosimiglianza, questa ricerca migliora l’affidabilità dei modelli ARIMA e contribuisce a un processo decisionale più informato in un’ampia gamma di campi, migliorando in definitiva sia la comprensione scientifica che le applicazioni pratiche. Anche piccoli miglioramenti nell’accuratezza della stima possono produrre conseguenze significative nel mondo reale

Попередня статтяIl principe William annuncia a Rio i vincitori del premio Earthshot 2025
Наступна статтяSbloccare la storia del ghiaccio artico: la polvere cosmica rivela 30.000 anni di cambiamenti del ghiaccio marino