Implementación de algoritmos de entrenamiento de modelos probabilísticos para predecir el rendimiento de celdas solares de perovskita con datos incompletos
dc.contributor.advisor | Sepúlveda Sepúlveda, Franklin Alexander | |
dc.contributor.author | Cerro Ramos, Daniel Andres | |
dc.contributor.author | Velasquez Meneses, Yan Carlos | |
dc.contributor.evaluator | Pertuz Arroyo, Said David | |
dc.contributor.evaluator | Botero Londoño, Monica Andrea | |
dc.date.accessioned | 2024-11-07T16:28:51Z | |
dc.date.available | 2024-11-07T16:28:51Z | |
dc.date.created | 2024-11-06 | |
dc.date.embargoEnd | 2025-12-01 | |
dc.date.issued | 2024-11-06 | |
dc.description.abstract | La calidad de los datos utilizados para implementar modelos de aprendizaje automático es crucial para su funcionamiento óptimo. Sin embargo, en numerosos estudios de investigación, la recopilación de datos de múltiples fuentes con diferentes estructuras resulta en datos con valores faltantes o erróneos. Este problema está presente y afecta la base de datos existente para el diseño de celdas de perovskita, dificultando la aplicación de métodos de aprendizaje automático. En este proyecto, se abordó este problema en los datos faltantes de una base de datos de celdas solares de perovskita mediante la implementación de Modelos de Mezcla Gaussiana Conscientes de Faltantes (MGMM). Estos métodos permiten entrenar modelos probabilísticos directamente sobre datos incompletos. Para evaluar el desempeño de los MGMM, se compararon sus resultados con aquellos obtenidos al utilizar datos imputados mediante los algoritmos imputaciones múltiples mediante ecuaciones encadenadas (MICE) y El algoritmo de Redes de imputación generativas adversarias (GAIN). La evaluación del rendimiento de los algoritmos de imputación demostró un mejor desempeño del modelo MICE y se evidenció que el número de muestras y parámetros puede influir en el rendimiento de los algoritmos. Posteriormente, se utilizaron los datos imputados por cada modelo para evaluar las predicciones de los modelos de mezcla gaussiana (GMM) con las métricas error cuadrático medio (RMSE) y error porcentual medio absoluto (MAPE). Los resultados mostraron que el modelo GMM con datos imputados por MICE tuvo mejores predicciones en comparación con GAIN. La implementación del modelo MGMM con la base de datos de menor tamaño demostró que la distribución de los datos seleccionados impacta en el rendimiento del modelo, obteniendo resultados inferiores a medida que aumenta el porcentaje de valores faltantes. Este estudio demuestra que datos de celdas solares de perovskita pueden ser tratados eficazmente con modelos de imputación como MICE y GAIN, considerando la naturaleza y características de los datos. | |
dc.description.abstractenglish | The quality of the data used to implement machine learning models is crucial for their optimal performance. However, in numerous research studies, collecting data from multiple sources with different structures results in data with missing or erroneous values. This problem is present and affects the existing database for perovskite cell design, making it difficult to apply machine learning methods. In this project, this problem was addressed in the missing data of a perovskite solar cell database by implementing Gaussian Mixture Models Aware of Missing Values (MGMM). These methods allow training probabilistic models directly on incomplete data. To evaluate the performance of the MGMMs, their results were compared with those obtained when using data imputed using the Multiple Imputations via Chained Equations (MICE) and the Generative Adversarial Imputation Networks (GAIN) algorithms. The evaluation of the performance of the imputation algorithms showed a better performance of the MICE model and it was evidenced that the number of samples and parameters can influence the performance of the algorithms. Subsequently, the data imputed by each model were used to evaluate the predictions of the Gaussian mixture models (GMM) with the metrics root mean square error (RMSE) and mean absolute percentage error (MAPE). The results showed that the GMM model with MICE imputed data had better predictions compared to GAIN. Implementation of the MGMM model with the smaller database size showed that the distribution of the selected data impacts the model performance, obtaining lower results as the percentage of missing values increases. This study demonstrates that perovskite solar cell data can be effectively treated with imputation models such as MICE and GAIN, considering the nature and characteristics of the data. | |
dc.description.degreelevel | Pregrado | |
dc.description.degreename | Ingeniero Electrónico | |
dc.format.mimetype | application/pdf | |
dc.identifier.instname | Universidad Industrial de Santander | |
dc.identifier.reponame | Universidad Industrial de Santander | |
dc.identifier.repourl | https://noesis.uis.edu.co | |
dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/44520 | |
dc.language.iso | spa | |
dc.publisher | Universidad Industrial de Santander | |
dc.publisher.faculty | Facultad de Ingeníerias Fisicomecánicas | |
dc.publisher.program | Ingeniería Electrónica | |
dc.publisher.school | Escuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones | |
dc.rights | info:eu-repo/semantics/embargoedAccess | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.coar | http://purl.org/coar/access_right/c_f1cf | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
dc.rights.license | Atribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO) | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Modelos probabilísticos | |
dc.subject | Celdas solares de perovskita | |
dc.subject | Predicción | |
dc.subject | Aprendizaje automático | |
dc.subject | Modelos de imputación | |
dc.subject.keyword | Probabilistic models | |
dc.subject.keyword | Perovskite solar cells | |
dc.subject.keyword | Prediction | |
dc.subject.keyword | Machine learning | |
dc.subject.keyword | Imputation models | |
dc.title | Implementación de algoritmos de entrenamiento de modelos probabilísticos para predecir el rendimiento de celdas solares de perovskita con datos incompletos | |
dc.title.english | Implementation of probabilistic model training algorithms for predicting Perovskite solar cell performance with incomplete data | |
dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
dc.type.hasversion | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado |
Files
Original bundle
1 - 4 of 4
No Thumbnail Available
- Name:
- Nota de proyecto.pdf
- Size:
- 203.95 KB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Carta de autorización.pdf
- Size:
- 131.38 KB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Carta de confidencialidad.pdf
- Size:
- 157.98 KB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 2.18 KB
- Format:
- Item-specific license agreed to upon submission
- Description: