ENRIQUECIMIENTO AUTOMÁTICO DE DATOS EXTRAÍDOS MEDIANTE EL PROCESAMIENTO DE LENGUAJE NATURAL EN LA MINERÍA DE INFORMACIÓN DE CELDAS SOLARES DE PEROVSKITA
dc.contributor.advisor | Camacho Parra, Cristian David | |
dc.contributor.advisor | Sepulveda Sepulveda, Franklin Alexander | |
dc.contributor.author | Toscano Higuera, Sebastián Camilo | |
dc.contributor.author | Arroyave Zapata, Juan David | |
dc.contributor.evaluator | Correa Cely, Carlos Rodrigo | |
dc.contributor.evaluator | Fajardo Ariza, Carlos Augusto | |
dc.date.accessioned | 2022-11-04T12:58:19Z | |
dc.date.available | 2022-11-04T12:58:19Z | |
dc.date.created | 2022-11-03 | |
dc.date.issued | 2022-11-03 | |
dc.description.abstract | En los últimos años se identifica un desarrollo notorio en el campo de la ciencia de los materiales logrando grandes cantidades de información. Dicha información se hace compleja de recopilar debido a distintos factores que dificultan obtener una base de datos confiable con una estructura bien definida. Por esta razón, las técnicas de PLN ofrecen una solución a una robusta recopilación de datos. Sin embargo, este conjunto de datos extraído con PLN presentan incongruencias y/o instancias incompletas. Por ello, se hace necesario aplicar estrategias para manejar estos problemas, las cuales en este trabajo de investigación se usa un único modelo de función de probabilidad para el enriquecimiento de un conjunto de datos de parámetros de celdas solares de Perovskita. El desarrollo de esta investigación se lleva a cabo en 2 fases. En la primera se acondiciona la base de datos para eliminar valores atípicos y en la segunda se entrena y evalúa el modelo. En consecuencia a este procedimiento se consigue una precisión media mayor al 50% y en el caso de la variable de eficiencia de conversión de energía se logra una precisión del 84%. En conclusión, esta investigación presenta resultados prometedores dada que resulta ser una propuesta innovadora en el campo de las celdas solares de Perovskita. Por último para obtener un mejor entrenamiento del modelo se recomienda hacer uso de una base de datos con una cantidad de datos más significativa. | |
dc.description.abstractenglish | In recent years, a notable development has been identified in the field of materials science, achieving large amounts of information. This information becomes complex to collect due to different factors that make it difficult to obtain a reliable database with a well-defined structure. For this reason, PLN techniques offer a solution to robust data collection. However, this dataset extracted with PLN presents inconsistencies and/or incomplete instances. Therefore, it is necessary to apply strategies to handle these problems, which in this research work we use a single probability function model for the enrichment of a dataset of Perovskite solar cell parameters. The development of this research is carried out in 2 phases. In the first, the database is conditioned to eliminate outliers, and in the second, the model is trained and evaluated. As a result of this procedure, an average accuracy greater than 50% is achieved and in the case of the energy conversion efficiency variable, an accuracy of 84% is achieved. In conclusion, this research presents promising results given that it turns out to be an innovative proposal in the field of Perovskite solar cells. Finally, to obtain a better training of the model, it is recommended to use a database with a more significant amount of data. | |
dc.description.degreelevel | Pregrado | |
dc.description.degreename | Ingeniero Electrónico | |
dc.format.mimetype | application/pdf | |
dc.identifier.instname | Universidad Industrial de Santander | |
dc.identifier.reponame | Universidad Industrial de Santander | |
dc.identifier.repourl | https://noesis.uis.edu.co | |
dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/11895 | |
dc.language.iso | spa | |
dc.publisher | Universidad Industrial de Santander | |
dc.publisher.faculty | Facultad de Ingeníerias Fisicomecánicas | |
dc.publisher.program | Ingeniería Electrónica | |
dc.publisher.school | Escuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Imputación | |
dc.subject | Mezclas gaussianas | |
dc.subject | Celdas solares de Perovskita | |
dc.subject.keyword | Imputation | |
dc.subject.keyword | Gaussian mix | |
dc.subject.keyword | Solar cells | |
dc.subject.keyword | Perovskite | |
dc.title | ENRIQUECIMIENTO AUTOMÁTICO DE DATOS EXTRAÍDOS MEDIANTE EL PROCESAMIENTO DE LENGUAJE NATURAL EN LA MINERÍA DE INFORMACIÓN DE CELDAS SOLARES DE PEROVSKITA | |
dc.title.english | AUTOMATIC ENRICHMENT OF EXTRACTED DATA USING NATURAL LANGUAGE PROCESSING IN PEROVSKITE SOLAR CELL INFORMATION MINING | |
dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
dc.type.hasversion | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado | |
dspace.entity.type |
Files
Original bundle
1 - 3 of 3
No Thumbnail Available
- Name:
- Carta de autorización.pdf
- Size:
- 179.46 KB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Documento.pdf
- Size:
- 980.41 KB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Nota de proyecto.pdf
- Size:
- 89.06 KB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 2.18 KB
- Format:
- Item-specific license agreed to upon submission
- Description: