Imputación de datos faltantes de una serie de tiempo basados en los valores conocidos de la predicción, y su aplicación a datos de infección respiratoria aguda en Bogotá

dc.contributor.advisorRíos Gutiérrez, Andrés Sebastián
dc.contributor.authorReyes Rojas, Diego Johann
dc.contributor.evaluatorRangel Quiñónez, Henry Sebastián
dc.date.accessioned2024-03-13T15:38:52Z
dc.date.available2024-03-13T15:38:52Z
dc.date.created2024-01-31
dc.date.issued2024-01-31
dc.description.abstractObjetivos: Imputar datos faltantes de los años 2020 y 2021 del histórico de los casos de morbilidad por infección respiratoria aguda en Bogotá utilizando series de tiempo estacionales. Metodología: Usar la prueba de Dickey-Fuller aumentada para estudiar la estacionariedad de la serie temporal, luego diferenciar la serie a fin de volverla estacionaria, escoger 5 modelos ARIMA multiplicativos usando el criterio de Akaike y usar el estimador MSE para escoger cual de estos se ajusta mejor a los datos disponibles del año 2022. Conclusiones: Los datos faltantes de la variable infectados de los años 2020 y 2021 pudieron ser imputados a través del modelo ARIMA(p,d,q)×(2,3,1)_50 el cual tuvo el mejor ajuste a los datos disponibles del 2022 según el estimador MSE. No siempre los métodos para crear modelos ARIMA(p,d,q)×(P,D,Q)_s van a converger: Esto puede ocurrir debido a que la función usada para estimar los parámetros del modelo ARIMA está basada en la función optim que hace uso de métodos numéricos, como lo es el método de Brent para el cual no siempre se tiene garantizada la existencia de los valores que optimicen la función. Tener un buen ajuste de los datos históricos no necesariamente implica que se realicé una mejor predicción: aunque los modelos ARIMA(5,1,5)×(4,2,4)_50 y ARIMA(5,1,5)×(2,3,4)_50 presentaron un mejor valor AIC que el modelo ARIMA(5,1,5)×(2,3,1)_50, este tiene mejor ajuste para el año 2022 según el MSE. El modelo predice que aproximadamente cada año (casi 52 semanas) se tendrá un pico de contagios por infección respiratoria aguda. Por otro lado, ya que la predicción no tiene comportamiento monótono, se concluye que el modelo no dio alerta de un aumento precipitado del número de casos por infección respiratoria aguda para el año 2022 y por lo tanto no dio alerta de una posible pandemia para ese año como realmente ocurrió.
dc.description.abstractenglishObjectives: To impute missing data from the years 2020 and 2021 of the history of morbidity cases due to acute respiratory infection in Bogotá using seasonal time series. Methodology: Use the augmented Dickey-Fuller test to study the stationarity of the time series, then differentiate the series in order to make it stationary, choose 5 multiplicative ARIMA models using the Akaike criterion and use the MSE estimator to choose which of these is suitable. best fits the available data for the year 2022. Conclusions: The missing data of the infected variable for the year 2020 and 2021 could be imputed through the ARIMA(p,d,q)×(2,3,1)_50 model which had the best fit to the available 2022 data according to the MSE estimator. The methods for creating ARIMA(p,d,q)×(P,D,Q)_s models will not always converge: This may occur because the function used to estimate the parameters of the ARIMA model is based on the optimal function that makes use of numerical methods, such as the Brent method for which the existence of the values that optimize the function is not always guaranteed. Having a good fit of the historical data does not necessarily imply that a better prediction was made: although the ARIMA(5,1,5)×(4,2,4)_50 and ARIMA(5,1,5)×(2,3,4)_50 presented a better AIC value than the ARIMA(p,d,q)×(2,3,1)_50 model, this has a better fit for the year 2022 according to the MSE. The model predicts that approximately every year (almost 52 weeks) there will be a peak in infections due to acute respiratory infection. On the other hand, since the prediction does not have monotonic behavior, it is concluded that the model did not warn of a precipitous increase in the number of cases due to acute respiratory infection for the year 2022 and therefore did not warn of a possible pandemic for that year as it really happened.
dc.description.degreelevelEspecialización
dc.description.degreenameEspecialista en Estadística
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/42258
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ciencias
dc.publisher.programEspecialización en Estadística
dc.publisher.schoolEscuela de Matemáticas
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAtribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectImputación de datos faltantes
dc.subjectSeries de tiempo estacionales
dc.subjectModelos ARIMA multiplicativos
dc.subjectEstimador MSE
dc.subject.keywordImputation of Missing Data
dc.subject.keywordSeasonal Time Series
dc.subject.keywordMultiplicative ARIMA models
dc.subject.keywordMSE estimator
dc.titleImputación de datos faltantes de una serie de tiempo basados en los valores conocidos de la predicción, y su aplicación a datos de infección respiratoria aguda en Bogotá
dc.title.englishImputation of missing data in a time series based on known values of prediction, and its application to acute respiratory infection data in Bogotá
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.hasversionhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.localTesis/Trabajo de grado - Monografía - Especialización
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
134.92 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
942.77 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
482.53 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.18 KB
Format:
Item-specific license agreed to upon submission
Description: