Las herramientas estadísticas populares pueden producir pronósticos erróneos

54

Un nuevo estudio destaca una falla potencial en herramientas de software ampliamente utilizadas que se basan en una técnica de modelado estadístico común llamada ARIMA, lo que genera preocupaciones sobre la precisión de los pronósticos en campos que van desde las finanzas hasta la ecología. Jesse Wheeler, profesor asistente en la Universidad Estatal de Idaho, y su coautor, Edward Ionides, descubrieron que los algoritmos que impulsan los modelos ARIMA en dos entornos de software populares pueden estar produciendo estimaciones poco confiables, lo que podría conducir a predicciones y decisiones erróneas.

Comprender los modelos ARIMA y su importancia

Los modelos ARIMA (media móvil integrada autorregresiva) son la piedra angular del análisis de series temporales, un método utilizado para analizar los datos recopilados a lo largo del tiempo. Trabajan relacionando el valor actual de una métrica (como el precio de los huevos o la población de osos en un bosque) con sus valores pasados, lo que permite a los investigadores identificar patrones, tendencias y, en última instancia, pronosticar valores futuros.

Por qué ARIMA es tan común

Los modelos ARIMA son con frecuencia el primer método de series temporales que se enseña a los estudiantes y sirven como comparación de referencia al desarrollar nuevos algoritmos estadísticos y de aprendizaje automático. Su versatilidad los ha convertido en herramientas esenciales en diversas disciplinas, entre ellas:
Economía: Previsión de tendencias del mercado e indicadores económicos.
Cuidado de la salud: Análisis de datos de pacientes y predicción de brotes de enfermedades.
Clima: Predicción de patrones de temperatura y precipitación.
Ecología: Modelado de poblaciones animales y cambios ambientales.

El descubrimiento: un problema potencial con la estimación de parámetros

La investigación de Wheeler e Ionides se centró en un aspecto crítico de los modelos ARIMA: la estimación de parámetros. Las estimaciones de parámetros utilizan datos de muestra recopilados para inferir características de una población más grande. Los investigadores encontraron un posible problema de optimización dentro del algoritmo de estimación de máxima verosimilitud (un proceso utilizado para ajustar modelos estadísticos) en el software utilizado para implementar modelos ARIMA.

“Esto es como tener una calculadora que dice sumar dos más dos correctamente, pero a veces arroja una respuesta incorrecta, como dos más dos es igual a tres”, explica Wheeler. “A menudo dependemos del software estadístico como lo hacemos con una calculadora, por lo que, si la calculadora le dice que le está dando una estimación de un parámetro específico, es mejor que lo haga con un nivel de confianza muy alto”.

El alcance del problema

Los investigadores descubrieron que las estimaciones de máxima verosimilitud del software no estaban completamente optimizadas en un número sorprendentemente grande de casos, hasta el 60% de las veces, según los datos y el modelo. Esto significa que los algoritmos, a pesar de pretender maximizar la probabilidad del modelo, con frecuencia no lo lograron. Las estimaciones de parámetros deficientes, a su vez, pueden comprometer la precisión de los pronósticos y la confiabilidad de otros análisis estadísticos.

Abordar el problema y el camino a seguir

Fundamentalmente, Wheeler e Ionides no se limitaron a identificar el problema; propusieron un nuevo algoritmo para corregirlo y demostraron su eficacia utilizando el lenguaje de programación R. Esto ofrece una solución práctica para investigadores y profesionales que utilizan modelos ARIMA.

“Los investigadores y profesionales de la industria utilizan todos los días los modelos ARIMA para realizar pronósticos y análisis científicos en muchos campos… Si el software que estima estos modelos tiene fallas, puede generar resultados inesperados o decisiones equivocadas”.

Al abordar estos defectos en el enfoque de máxima verosimilitud, esta investigación mejora la confiabilidad de los modelos ARIMA y contribuye a una toma de decisiones más informada en una amplia gama de campos, mejorando en última instancia tanto la comprensión científica como las aplicaciones prácticas. Incluso pequeñas mejoras en la precisión de las estimaciones pueden generar importantes consecuencias en el mundo real.