Implementación de algoritmos de entrenamiento de modelos probabilísticos para predecir el rendimiento de celdas solares de perovskita con datos incompletos

dc.contributor.advisorSepúlveda Sepúlveda, Franklin Alexander
dc.contributor.authorCerro Ramos, Daniel Andres
dc.contributor.authorVelasquez Meneses, Yan Carlos
dc.contributor.evaluatorPertuz Arroyo, Said David
dc.contributor.evaluatorBotero Londoño, Monica Andrea
dc.date.accessioned2024-11-07T16:28:51Z
dc.date.available2024-11-07T16:28:51Z
dc.date.created2024-11-06
dc.date.embargoEnd2025-12-01
dc.date.issued2024-11-06
dc.description.abstractLa calidad de los datos utilizados para implementar modelos de aprendizaje automático es crucial para su funcionamiento óptimo. Sin embargo, en numerosos estudios de investigación, la recopilación de datos de múltiples fuentes con diferentes estructuras resulta en datos con valores faltantes o erróneos. Este problema está presente y afecta la base de datos existente para el diseño de celdas de perovskita, dificultando la aplicación de métodos de aprendizaje automático. En este proyecto, se abordó este problema en los datos faltantes de una base de datos de celdas solares de perovskita mediante la implementación de Modelos de Mezcla Gaussiana Conscientes de Faltantes (MGMM). Estos métodos permiten entrenar modelos probabilísticos directamente sobre datos incompletos. Para evaluar el desempeño de los MGMM, se compararon sus resultados con aquellos obtenidos al utilizar datos imputados mediante los algoritmos imputaciones múltiples mediante ecuaciones encadenadas (MICE) y El algoritmo de Redes de imputación generativas adversarias (GAIN). La evaluación del rendimiento de los algoritmos de imputación demostró un mejor desempeño del modelo MICE y se evidenció que el número de muestras y parámetros puede influir en el rendimiento de los algoritmos. Posteriormente, se utilizaron los datos imputados por cada modelo para evaluar las predicciones de los modelos de mezcla gaussiana (GMM) con las métricas error cuadrático medio (RMSE) y error porcentual medio absoluto (MAPE). Los resultados mostraron que el modelo GMM con datos imputados por MICE tuvo mejores predicciones en comparación con GAIN. La implementación del modelo MGMM con la base de datos de menor tamaño demostró que la distribución de los datos seleccionados impacta en el rendimiento del modelo, obteniendo resultados inferiores a medida que aumenta el porcentaje de valores faltantes. Este estudio demuestra que datos de celdas solares de perovskita pueden ser tratados eficazmente con modelos de imputación como MICE y GAIN, considerando la naturaleza y características de los datos.
dc.description.abstractenglishThe quality of the data used to implement machine learning models is crucial for their optimal performance. However, in numerous research studies, collecting data from multiple sources with different structures results in data with missing or erroneous values. This problem is present and affects the existing database for perovskite cell design, making it difficult to apply machine learning methods. In this project, this problem was addressed in the missing data of a perovskite solar cell database by implementing Gaussian Mixture Models Aware of Missing Values (MGMM). These methods allow training probabilistic models directly on incomplete data. To evaluate the performance of the MGMMs, their results were compared with those obtained when using data imputed using the Multiple Imputations via Chained Equations (MICE) and the Generative Adversarial Imputation Networks (GAIN) algorithms. The evaluation of the performance of the imputation algorithms showed a better performance of the MICE model and it was evidenced that the number of samples and parameters can influence the performance of the algorithms. Subsequently, the data imputed by each model were used to evaluate the predictions of the Gaussian mixture models (GMM) with the metrics root mean square error (RMSE) and mean absolute percentage error (MAPE). The results showed that the GMM model with MICE imputed data had better predictions compared to GAIN. Implementation of the MGMM model with the smaller database size showed that the distribution of the selected data impacts the model performance, obtaining lower results as the percentage of missing values increases. This study demonstrates that perovskite solar cell data can be effectively treated with imputation models such as MICE and GAIN, considering the nature and characteristics of the data.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero Electrónico
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/44520
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingeníerias Fisicomecánicas
dc.publisher.programIngeniería Electrónica
dc.publisher.schoolEscuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones
dc.rightsinfo:eu-repo/semantics/embargoedAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_f1cf
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAtribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectModelos probabilísticos
dc.subjectCeldas solares de perovskita
dc.subjectPredicción
dc.subjectAprendizaje automático
dc.subjectModelos de imputación
dc.subject.keywordProbabilistic models
dc.subject.keywordPerovskite solar cells
dc.subject.keywordPrediction
dc.subject.keywordMachine learning
dc.subject.keywordImputation models
dc.titleImplementación de algoritmos de entrenamiento de modelos probabilísticos para predecir el rendimiento de celdas solares de perovskita con datos incompletos
dc.title.englishImplementation of probabilistic model training algorithms for predicting Perovskite solar cell performance with incomplete data
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.hasversionhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
Files
Original bundle
Now showing 1 - 4 of 4
No Thumbnail Available
Name:
Documento.pdf
Size:
1.34 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
203.95 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
131.38 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Carta de confidencialidad.pdf
Size:
157.98 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.18 KB
Format:
Item-specific license agreed to upon submission
Description: