Imputación de datos faltantes de una serie de tiempo basados en los valores conocidos de la predicción, y su aplicación a datos de infección respiratoria aguda en Bogotá
dc.contributor.advisor | Ríos Gutiérrez, Andrés Sebastián | |
dc.contributor.author | Reyes Rojas, Diego Johann | |
dc.contributor.evaluator | Rangel Quiñónez, Henry Sebastián | |
dc.date.accessioned | 2024-03-13T15:38:52Z | |
dc.date.available | 2024-03-13T15:38:52Z | |
dc.date.created | 2024-01-31 | |
dc.date.issued | 2024-01-31 | |
dc.description.abstract | Objetivos: Imputar datos faltantes de los años 2020 y 2021 del histórico de los casos de morbilidad por infección respiratoria aguda en Bogotá utilizando series de tiempo estacionales. Metodología: Usar la prueba de Dickey-Fuller aumentada para estudiar la estacionariedad de la serie temporal, luego diferenciar la serie a fin de volverla estacionaria, escoger 5 modelos ARIMA multiplicativos usando el criterio de Akaike y usar el estimador MSE para escoger cual de estos se ajusta mejor a los datos disponibles del año 2022. Conclusiones: Los datos faltantes de la variable infectados de los años 2020 y 2021 pudieron ser imputados a través del modelo ARIMA(p,d,q)×(2,3,1)_50 el cual tuvo el mejor ajuste a los datos disponibles del 2022 según el estimador MSE. No siempre los métodos para crear modelos ARIMA(p,d,q)×(P,D,Q)_s van a converger: Esto puede ocurrir debido a que la función usada para estimar los parámetros del modelo ARIMA está basada en la función optim que hace uso de métodos numéricos, como lo es el método de Brent para el cual no siempre se tiene garantizada la existencia de los valores que optimicen la función. Tener un buen ajuste de los datos históricos no necesariamente implica que se realicé una mejor predicción: aunque los modelos ARIMA(5,1,5)×(4,2,4)_50 y ARIMA(5,1,5)×(2,3,4)_50 presentaron un mejor valor AIC que el modelo ARIMA(5,1,5)×(2,3,1)_50, este tiene mejor ajuste para el año 2022 según el MSE. El modelo predice que aproximadamente cada año (casi 52 semanas) se tendrá un pico de contagios por infección respiratoria aguda. Por otro lado, ya que la predicción no tiene comportamiento monótono, se concluye que el modelo no dio alerta de un aumento precipitado del número de casos por infección respiratoria aguda para el año 2022 y por lo tanto no dio alerta de una posible pandemia para ese año como realmente ocurrió. | |
dc.description.abstractenglish | Objectives: To impute missing data from the years 2020 and 2021 of the history of morbidity cases due to acute respiratory infection in Bogotá using seasonal time series. Methodology: Use the augmented Dickey-Fuller test to study the stationarity of the time series, then differentiate the series in order to make it stationary, choose 5 multiplicative ARIMA models using the Akaike criterion and use the MSE estimator to choose which of these is suitable. best fits the available data for the year 2022. Conclusions: The missing data of the infected variable for the year 2020 and 2021 could be imputed through the ARIMA(p,d,q)×(2,3,1)_50 model which had the best fit to the available 2022 data according to the MSE estimator. The methods for creating ARIMA(p,d,q)×(P,D,Q)_s models will not always converge: This may occur because the function used to estimate the parameters of the ARIMA model is based on the optimal function that makes use of numerical methods, such as the Brent method for which the existence of the values that optimize the function is not always guaranteed. Having a good fit of the historical data does not necessarily imply that a better prediction was made: although the ARIMA(5,1,5)×(4,2,4)_50 and ARIMA(5,1,5)×(2,3,4)_50 presented a better AIC value than the ARIMA(p,d,q)×(2,3,1)_50 model, this has a better fit for the year 2022 according to the MSE. The model predicts that approximately every year (almost 52 weeks) there will be a peak in infections due to acute respiratory infection. On the other hand, since the prediction does not have monotonic behavior, it is concluded that the model did not warn of a precipitous increase in the number of cases due to acute respiratory infection for the year 2022 and therefore did not warn of a possible pandemic for that year as it really happened. | |
dc.description.degreelevel | Especialización | |
dc.description.degreename | Especialista en Estadística | |
dc.format.mimetype | application/pdf | |
dc.identifier.instname | Universidad Industrial de Santander | |
dc.identifier.reponame | Universidad Industrial de Santander | |
dc.identifier.repourl | https://noesis.uis.edu.co | |
dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/42258 | |
dc.language.iso | spa | |
dc.publisher | Universidad Industrial de Santander | |
dc.publisher.faculty | Facultad de Ciencias | |
dc.publisher.program | Especialización en Estadística | |
dc.publisher.school | Escuela de Matemáticas | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
dc.rights.license | Atribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO) | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Imputación de datos faltantes | |
dc.subject | Series de tiempo estacionales | |
dc.subject | Modelos ARIMA multiplicativos | |
dc.subject | Estimador MSE | |
dc.subject.keyword | Imputation of Missing Data | |
dc.subject.keyword | Seasonal Time Series | |
dc.subject.keyword | Multiplicative ARIMA models | |
dc.subject.keyword | MSE estimator | |
dc.title | Imputación de datos faltantes de una serie de tiempo basados en los valores conocidos de la predicción, y su aplicación a datos de infección respiratoria aguda en Bogotá | |
dc.title.english | Imputation of missing data in a time series based on known values of prediction, and its application to acute respiratory infection data in Bogotá | |
dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
dc.type.hasversion | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
dc.type.local | Tesis/Trabajo de grado - Monografía - Especialización |
Files
Original bundle
1 - 3 of 3
No Thumbnail Available
- Name:
- Carta de autorización.pdf
- Size:
- 134.92 KB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Nota de proyecto.pdf
- Size:
- 942.77 KB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Documento.pdf
- Size:
- 482.53 KB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 2.18 KB
- Format:
- Item-specific license agreed to upon submission
- Description: