Sebuah studi baru menyoroti potensi kelemahan perangkat lunak yang banyak digunakan dan mengandalkan teknik pemodelan statistik umum yang disebut ARIMA, sehingga meningkatkan kekhawatiran tentang keakuratan perkiraan di berbagai bidang mulai dari keuangan hingga ekologi. Jesse Wheeler, asisten profesor di Idaho State University, dan rekan penulisnya, Edward Ionides, menemukan bahwa algoritme yang mendukung model ARIMA di dua lingkungan perangkat lunak populer mungkin menghasilkan perkiraan yang tidak dapat diandalkan, yang berpotensi menyebabkan prediksi dan keputusan yang salah.
Memahami Model ARIMA dan Pentingnya Mereka
Model ARIMA (Autoregressive Integrated Moving Average) adalah landasan analisis deret waktu—metode yang digunakan untuk menganalisis data yang dikumpulkan dari waktu ke waktu. Mereka bekerja dengan menghubungkan nilai metrik saat ini – seperti harga telur atau populasi beruang di hutan – dengan nilai-nilai di masa lalu, sehingga memungkinkan para peneliti untuk mengidentifikasi pola, tren, dan pada akhirnya memperkirakan nilai-nilai di masa depan.
Mengapa ARIMA Begitu Umum
Model ARIMA sering kali merupakan metode deret waktu yang pertama kali diajarkan kepada siswa dan berfungsi sebagai perbandingan dasar ketika mengembangkan algoritma statistik dan pembelajaran mesin baru. Keserbagunaannya menjadikannya alat penting dalam berbagai disiplin ilmu, termasuk:
– Ekonomi: Memperkirakan tren pasar dan indikator ekonomi
– Layanan Kesehatan: Menganalisis data pasien dan memprediksi wabah penyakit
– Cuaca: Memprediksi pola suhu dan curah hujan
– Ekologi: Pemodelan populasi hewan dan perubahan lingkungan
Penemuan: Potensi Masalah pada Estimasi Parameter
Penelitian Wheeler dan Ionides berfokus pada aspek penting model ARIMA: estimasi parameter. Estimasi parameter menggunakan data sampel yang dikumpulkan untuk menyimpulkan karakteristik populasi yang lebih besar. Para peneliti menemukan potensi masalah optimasi dalam algoritma estimasi kemungkinan maksimum—sebuah proses yang digunakan untuk menyesuaikan model statistik—dalam perangkat lunak yang digunakan untuk mengimplementasikan model ARIMA.
“Ini seperti memiliki kalkulator yang mengklaim dapat menjumlahkan dua tambah dua dengan benar, namun terkadang memberikan jawaban yang salah, seperti dua tambah dua sama dengan tiga,” jelas Wheeler. “Kita sering mengandalkan perangkat lunak statistik seperti yang kita lakukan pada kalkulator, jadi, jika kalkulator memberi tahu Anda bahwa ia memberi Anda perkiraan parameter tertentu, sebaiknya lakukan itu dengan keyakinan yang sangat tinggi.”
Ruang Lingkup Masalah
Para peneliti menemukan bahwa perkiraan kemungkinan maksimum perangkat lunak tidak sepenuhnya dioptimalkan dalam sejumlah besar kasus – hingga 60%, bergantung pada data dan model. Ini berarti bahwa algoritme, meskipun mengklaim dapat memaksimalkan kemungkinan model, sering kali gagal melakukannya. Estimasi parameter di bawah standar, pada gilirannya, dapat membahayakan keakuratan perkiraan dan keandalan analisis statistik lainnya.
Mengatasi Masalah dan Langkah ke Depan
Yang terpenting, Wheeler dan Ionides tidak hanya mengidentifikasi masalahnya; mereka mengusulkan algoritma baru untuk memperbaikinya dan menunjukkan efektivitasnya menggunakan bahasa pemrograman R. Ini menawarkan solusi praktis bagi para peneliti dan profesional yang menggunakan model ARIMA.
“Model ARIMA digunakan setiap hari oleh para peneliti dan profesional industri untuk peramalan dan analisis ilmiah di banyak bidang… Jika perangkat lunak yang memperkirakan model ini memiliki kekurangan, hal ini berpotensi menimbulkan hasil yang tidak diharapkan atau keputusan yang salah.”
Dengan mengatasi kekurangan dalam pendekatan kemungkinan maksimum, penelitian ini meningkatkan keandalan model ARIMA dan berkontribusi terhadap pengambilan keputusan yang lebih tepat di berbagai bidang, yang pada akhirnya meningkatkan pemahaman ilmiah dan penerapan praktis. Bahkan peningkatan kecil dalam akurasi estimasi dapat menghasilkan konsekuensi nyata yang signifikan
