ENRIQUECIMIENTO AUTOMÁTICO DE DATOS EXTRAÍDOS MEDIANTE EL PROCESAMIENTO DE LENGUAJE NATURAL EN LA MINERÍA DE INFORMACIÓN DE CELDAS SOLARES DE PEROVSKITA

dc.contributor.advisorCamacho Parra, Cristian David
dc.contributor.advisorSepulveda Sepulveda, Franklin Alexander
dc.contributor.authorToscano Higuera, Sebastián Camilo
dc.contributor.authorArroyave Zapata, Juan David
dc.contributor.evaluatorCorrea Cely, Carlos Rodrigo
dc.contributor.evaluatorFajardo Ariza, Carlos Augusto
dc.date.accessioned2022-11-04T12:58:19Z
dc.date.available2022-11-04T12:58:19Z
dc.date.created2022-11-03
dc.date.issued2022-11-03
dc.description.abstractEn los últimos años se identifica un desarrollo notorio en el campo de la ciencia de los materiales logrando grandes cantidades de información. Dicha información se hace compleja de recopilar debido a distintos factores que dificultan obtener una base de datos confiable con una estructura bien definida. Por esta razón, las técnicas de PLN ofrecen una solución a una robusta recopilación de datos. Sin embargo, este conjunto de datos extraído con PLN presentan incongruencias y/o instancias incompletas. Por ello, se hace necesario aplicar estrategias para manejar estos problemas, las cuales en este trabajo de investigación se usa un único modelo de función de probabilidad para el enriquecimiento de un conjunto de datos de parámetros de celdas solares de Perovskita. El desarrollo de esta investigación se lleva a cabo en 2 fases. En la primera se acondiciona la base de datos para eliminar valores atípicos y en la segunda se entrena y evalúa el modelo. En consecuencia a este procedimiento se consigue una precisión media mayor al 50% y en el caso de la variable de eficiencia de conversión de energía se logra una precisión del 84%. En conclusión, esta investigación presenta resultados prometedores dada que resulta ser una propuesta innovadora en el campo de las celdas solares de Perovskita. Por último para obtener un mejor entrenamiento del modelo se recomienda hacer uso de una base de datos con una cantidad de datos más significativa.
dc.description.abstractenglishIn recent years, a notable development has been identified in the field of materials science, achieving large amounts of information. This information becomes complex to collect due to different factors that make it difficult to obtain a reliable database with a well-defined structure. For this reason, PLN techniques offer a solution to robust data collection. However, this dataset extracted with PLN presents inconsistencies and/or incomplete instances. Therefore, it is necessary to apply strategies to handle these problems, which in this research work we use a single probability function model for the enrichment of a dataset of Perovskite solar cell parameters. The development of this research is carried out in 2 phases. In the first, the database is conditioned to eliminate outliers, and in the second, the model is trained and evaluated. As a result of this procedure, an average accuracy greater than 50% is achieved and in the case of the energy conversion efficiency variable, an accuracy of 84% is achieved. In conclusion, this research presents promising results given that it turns out to be an innovative proposal in the field of Perovskite solar cells. Finally, to obtain a better training of the model, it is recommended to use a database with a more significant amount of data.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero Electrónico
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/11895
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingeníerias Fisicomecánicas
dc.publisher.programIngeniería Electrónica
dc.publisher.schoolEscuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectImputación
dc.subjectMezclas gaussianas
dc.subjectCeldas solares de Perovskita
dc.subject.keywordImputation
dc.subject.keywordGaussian mix
dc.subject.keywordSolar cells
dc.subject.keywordPerovskite
dc.titleENRIQUECIMIENTO AUTOMÁTICO DE DATOS EXTRAÍDOS MEDIANTE EL PROCESAMIENTO DE LENGUAJE NATURAL EN LA MINERÍA DE INFORMACIÓN DE CELDAS SOLARES DE PEROVSKITA
dc.title.englishAUTOMATIC ENRICHMENT OF EXTRACTED DATA USING NATURAL LANGUAGE PROCESSING IN PEROVSKITE SOLAR CELL INFORMATION MINING
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.hasversionhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.type
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
179.46 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
980.41 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
89.06 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.18 KB
Format:
Item-specific license agreed to upon submission
Description: