Imputación de datos faltantes de una serie de tiempo basados en los valores conocidos de la predicción, y su aplicación a datos de infección respiratoria aguda en Bogotá

No Thumbnail Available
Date
2024-01-31
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Industrial de Santander
Abstract
Objetivos: Imputar datos faltantes de los años 2020 y 2021 del histórico de los casos de morbilidad por infección respiratoria aguda en Bogotá utilizando series de tiempo estacionales. Metodología: Usar la prueba de Dickey-Fuller aumentada para estudiar la estacionariedad de la serie temporal, luego diferenciar la serie a fin de volverla estacionaria, escoger 5 modelos ARIMA multiplicativos usando el criterio de Akaike y usar el estimador MSE para escoger cual de estos se ajusta mejor a los datos disponibles del año 2022. Conclusiones: Los datos faltantes de la variable infectados de los años 2020 y 2021 pudieron ser imputados a través del modelo ARIMA(p,d,q)×(2,3,1)_50 el cual tuvo el mejor ajuste a los datos disponibles del 2022 según el estimador MSE. No siempre los métodos para crear modelos ARIMA(p,d,q)×(P,D,Q)_s van a converger: Esto puede ocurrir debido a que la función usada para estimar los parámetros del modelo ARIMA está basada en la función optim que hace uso de métodos numéricos, como lo es el método de Brent para el cual no siempre se tiene garantizada la existencia de los valores que optimicen la función. Tener un buen ajuste de los datos históricos no necesariamente implica que se realicé una mejor predicción: aunque los modelos ARIMA(5,1,5)×(4,2,4)_50 y ARIMA(5,1,5)×(2,3,4)_50 presentaron un mejor valor AIC que el modelo ARIMA(5,1,5)×(2,3,1)_50, este tiene mejor ajuste para el año 2022 según el MSE. El modelo predice que aproximadamente cada año (casi 52 semanas) se tendrá un pico de contagios por infección respiratoria aguda. Por otro lado, ya que la predicción no tiene comportamiento monótono, se concluye que el modelo no dio alerta de un aumento precipitado del número de casos por infección respiratoria aguda para el año 2022 y por lo tanto no dio alerta de una posible pandemia para ese año como realmente ocurrió.
Description
Keywords
Imputación de datos faltantes, Series de tiempo estacionales, Modelos ARIMA multiplicativos, Estimador MSE
Citation