Ferramentas estatísticas populares podem produzir previsões falhas

53

Um novo estudo destaca uma falha potencial em ferramentas de software amplamente utilizadas que dependem de uma técnica comum de modelagem estatística chamada ARIMA, levantando preocupações sobre a precisão das previsões em áreas que vão das finanças à ecologia. Jesse Wheeler, professor assistente da Idaho State University, e seu coautor, Edward Ionides, descobriram que os algoritmos que alimentam os modelos ARIMA em dois ambientes de software populares podem estar produzindo estimativas não confiáveis, levando potencialmente a previsões e decisões erradas.

Compreendendo os modelos ARIMA e sua importância

Os modelos ARIMA (média móvel integrada autoregressiva) são a base da análise de séries temporais – um método usado para analisar dados coletados ao longo do tempo. Funcionam relacionando o valor atual de uma métrica – como o preço dos ovos ou a população de ursos numa floresta – aos seus valores passados, permitindo aos investigadores identificar padrões, tendências e, em última análise, prever valores futuros.

Por que ARIMA é tão comum

Os modelos ARIMA são frequentemente o primeiro método de série temporal ensinado aos alunos e servem como uma comparação básica no desenvolvimento de novos algoritmos estatísticos e de aprendizado de máquina. Sua versatilidade os tornou ferramentas essenciais em diversas disciplinas, incluindo:
Economia: Previsão de tendências de mercado e indicadores econômicos
Saúde: análise de dados de pacientes e previsão de surtos de doenças
Clima: Previsão de padrões de temperatura e precipitação
Ecologia: Modelagem de populações animais e mudanças ambientais

A descoberta: um problema potencial com estimativa de parâmetros

A pesquisa de Wheeler e Ionides concentrou-se em um aspecto crítico dos modelos ARIMA: estimativa de parâmetros. As estimativas de parâmetros usam dados amostrais coletados para inferir características de uma população maior. Os pesquisadores encontraram um possível problema de otimização no algoritmo de estimativa de máxima verossimilhança – um processo usado para ajustar modelos estatísticos – no software usado para implementar modelos ARIMA.

“É como ter uma calculadora que afirma somar dois mais dois corretamente, mas às vezes retorna uma resposta incorreta, como dois mais dois é igual a três”, explica Wheeler. “Muitas vezes confiamos em software estatístico como fazemos com uma calculadora, então, se a calculadora lhe disser que está fornecendo uma estimativa de parâmetro específico, é melhor fazê-lo com muita confiança.”

O escopo do problema

Os investigadores descobriram que as estimativas de máxima verossimilhança do software não foram totalmente otimizadas num número surpreendentemente grande de casos – até 60% das vezes, dependendo dos dados e do modelo. Isto significa que os algoritmos, apesar de alegarem maximizar a probabilidade do modelo, frequentemente falharam em fazê-lo. Estimativas de parâmetros abaixo do padrão, por sua vez, podem comprometer a precisão das previsões e a confiabilidade de outras análises estatísticas.

Abordando o problema e o caminho a seguir

Crucialmente, Wheeler e Ionides não apenas identificaram o problema; eles propuseram um novo algoritmo para corrigi-lo e demonstraram sua eficácia usando a linguagem de programação R. Isto oferece uma solução prática para pesquisadores e profissionais que utilizam modelos ARIMA.

“Os modelos ARIMA são usados ​​todos os dias por pesquisadores e profissionais da indústria para previsões e análises científicas em muitos campos… Se o software que estima esses modelos tiver falhas, isso poderá levar a resultados inesperados ou decisões equivocadas.”

Ao abordar estas falhas na abordagem de máxima verossimilhança, esta investigação aumenta a fiabilidade dos modelos ARIMA e contribui para uma tomada de decisão mais informada numa vasta gama de campos, melhorando, em última análise, tanto a compreensão científica como as aplicações práticas. Mesmo pequenas melhorias na precisão das estimativas podem produzir consequências significativas no mundo real