Herramienta de software para la extracción automática de parámetros de desempeño a partir de publicaciones científicas de celdas solares de perovskita
dc.contributor.advisor | Sepúlveda Sepúlveda, Franklin Alexander | |
dc.contributor.advisor | Otálora Bastidas, Camilo Andrés | |
dc.contributor.advisor | Camacho Parra, Cristian David | |
dc.contributor.author | Jiménez Díaz, Mary Zuleika | |
dc.contributor.evaluator | Rey López, Juan Manuel | |
dc.contributor.evaluator | Botero Londoño, Mónica Andrea | |
dc.date.accessioned | 2022-04-19T13:59:34Z | |
dc.date.available | 2022-04-19T13:59:34Z | |
dc.date.created | 2022-03-29 | |
dc.date.issued | 2022-03-29 | |
dc.description.abstract | El creciente interés en la tecnología fotovoltaica basada en Perovskitas ha llevado a un aumento significativo del número de artículos científicos publicados, lo que implica un aumento en la cantidad de información disponible para analizar. Dada la diversidad y gran cantidad de fuentes, los análisis profundos de la literatura relacionada, ahora toman gran tiempo. En el presente trabajo se plantea una solución para agilizar el análisis y recolección de información, mediante aplicaciones relacionadas con el aprendizaje automático (ML), usando herramientas de procesamiento de lenguaje natural (NLP) y minería de texto. Para esto se desarrolla una herramienta software de aprendizaje automático en lenguaje Python, que permite la extracción automática de capas de la celda de Perovskita como la ETL, la HTL y la Perovskita, y de parámetros de desempeño de la celda Perovskita como el Voc, el Jsc, el PCE y el FF, basada en la librería Python spaCy 3.0 a partir de publicaciones de estudios científicos en formato PDF almacenados en una base de datos. La herramienta de software cuenta con la funcionalidad de comandos de linea y se encuentra guardada en un repositorio virtual de Github. Además se adicionan dos trabajos a futuro, una interfaz gráfica desarrollada en Python para la corrección de datos de entrenamiento y un acercamiento a la minera de texto aplicada a tablas contenidas en PDFs. | |
dc.description.abstractenglish | The growing interest in Perovskite-based photovoltaic technology has led to a significant increase in the number of scientific papers published, which implies an increase in the amount of information available for analysis. Given the diversity and large number of sources, in-depth analyses of the related literature now take a great deal of time. This paper proposes a solution to speed up the analysis and collection of information through applications related to machine learning (ML), using natural language processing (NLP) and text mining tools. For this purpose, a machine learning software tool is developed in Python language, which allows the automatic extraction of Perovskite cell layers such as ETL, HTL and Perovskite, and Perovskite cell performance parameters such as Voc, Jsc, PCE and FF, based on the Python library spaCy 3.0 from publications of scientific studies in PDF format stored in a database. The software tool has line command functionality and is stored in a virtual repository on Github. In addition, two future works are added, a graphical interface developed in Python for the correction of training data and an approach to text mining applied to tables contained in PDFs. | |
dc.description.degreelevel | Pregrado | |
dc.description.degreename | Ingeniero Electrónico | |
dc.description.orcid | https://orcid.org/0000-0001-8981-5211 | |
dc.format.mimetype | application/pdf | |
dc.identifier.instname | Universidad Industrial de Santander | |
dc.identifier.reponame | Universidad Industrial de Santander | |
dc.identifier.repourl | https://noesis.uis.edu.co | |
dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/9977 | |
dc.language.iso | spa | |
dc.publisher | Universidad Industrial de Santander | |
dc.publisher.faculty | Facultad de Ingeníerias Fisicomecánicas | |
dc.publisher.program | Ingeniería Electrónica | |
dc.publisher.school | Escuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Celdas solares de perovskita | |
dc.subject | Celdas solares | |
dc.subject | Reconocimiento de entidades nombradas | |
dc.subject | Aprendizaje Automático | |
dc.subject | spaCy | |
dc.subject | Procesamiento del lenguaje natural | |
dc.subject | Minería de texto | |
dc.subject | Python | |
dc.subject.keyword | Perovskite solar cells | |
dc.subject.keyword | Solar cells | |
dc.subject.keyword | Named entity recognition | |
dc.subject.keyword | Machine learning | |
dc.subject.keyword | spaCy | |
dc.subject.keyword | Natural language processing | |
dc.subject.keyword | Text mining | |
dc.subject.keyword | Python | |
dc.title | Herramienta de software para la extracción automática de parámetros de desempeño a partir de publicaciones científicas de celdas solares de perovskita | |
dc.title.english | Software for Automatic Extraction of Performance Parameters from Scientific Publications on Perovskite Solar Cells | |
dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
dc.type.hasversion | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado | |
dspace.entity.type |
Files
Original bundle
1 - 3 of 3
No Thumbnail Available
- Name:
- Carta de autorización.pdf
- Size:
- 413.2 KB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Nota de proyecto.pdf
- Size:
- 425.96 KB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 2.18 KB
- Format:
- Item-specific license agreed to upon submission
- Description: