Herramienta de software para la extracción automática de parámetros de desempeño a partir de publicaciones científicas de celdas solares de perovskita

dc.contributor.advisorSepúlveda Sepúlveda, Franklin Alexander
dc.contributor.advisorOtálora Bastidas, Camilo Andrés
dc.contributor.advisorCamacho Parra, Cristian David
dc.contributor.authorJiménez Díaz, Mary Zuleika
dc.contributor.evaluatorRey López, Juan Manuel
dc.contributor.evaluatorBotero Londoño, Mónica Andrea
dc.date.accessioned2022-04-19T13:59:34Z
dc.date.available2022-04-19T13:59:34Z
dc.date.created2022-03-29
dc.date.issued2022-03-29
dc.description.abstractEl creciente interés en la tecnología fotovoltaica basada en Perovskitas ha llevado a un aumento significativo del número de artículos científicos publicados, lo que implica un aumento en la cantidad de información disponible para analizar. Dada la diversidad y gran cantidad de fuentes, los análisis profundos de la literatura relacionada, ahora toman gran tiempo. En el presente trabajo se plantea una solución para agilizar el análisis y recolección de información, mediante aplicaciones relacionadas con el aprendizaje automático (ML), usando herramientas de procesamiento de lenguaje natural (NLP) y minería de texto. Para esto se desarrolla una herramienta software de aprendizaje automático en lenguaje Python, que permite la extracción automática de capas de la celda de Perovskita como la ETL, la HTL y la Perovskita, y de parámetros de desempeño de la celda Perovskita como el Voc, el Jsc, el PCE y el FF, basada en la librería Python spaCy 3.0 a partir de publicaciones de estudios científicos en formato PDF almacenados en una base de datos. La herramienta de software cuenta con la funcionalidad de comandos de linea y se encuentra guardada en un repositorio virtual de Github. Además se adicionan dos trabajos a futuro, una interfaz gráfica desarrollada en Python para la corrección de datos de entrenamiento y un acercamiento a la minera de texto aplicada a tablas contenidas en PDFs.
dc.description.abstractenglishThe growing interest in Perovskite-based photovoltaic technology has led to a significant increase in the number of scientific papers published, which implies an increase in the amount of information available for analysis. Given the diversity and large number of sources, in-depth analyses of the related literature now take a great deal of time. This paper proposes a solution to speed up the analysis and collection of information through applications related to machine learning (ML), using natural language processing (NLP) and text mining tools. For this purpose, a machine learning software tool is developed in Python language, which allows the automatic extraction of Perovskite cell layers such as ETL, HTL and Perovskite, and Perovskite cell performance parameters such as Voc, Jsc, PCE and FF, based on the Python library spaCy 3.0 from publications of scientific studies in PDF format stored in a database. The software tool has line command functionality and is stored in a virtual repository on Github. In addition, two future works are added, a graphical interface developed in Python for the correction of training data and an approach to text mining applied to tables contained in PDFs.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero Electrónico
dc.description.orcidhttps://orcid.org/0000-0001-8981-5211
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/9977
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingeníerias Fisicomecánicas
dc.publisher.programIngeniería Electrónica
dc.publisher.schoolEscuela de Ingenierías Eléctrica, Electrónica y Telecomunicaciones
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectCeldas solares de perovskita
dc.subjectCeldas solares
dc.subjectReconocimiento de entidades nombradas
dc.subjectAprendizaje Automático
dc.subjectspaCy
dc.subjectProcesamiento del lenguaje natural
dc.subjectMinería de texto
dc.subjectPython
dc.subject.keywordPerovskite solar cells
dc.subject.keywordSolar cells
dc.subject.keywordNamed entity recognition
dc.subject.keywordMachine learning
dc.subject.keywordspaCy
dc.subject.keywordNatural language processing
dc.subject.keywordText mining
dc.subject.keywordPython
dc.titleHerramienta de software para la extracción automática de parámetros de desempeño a partir de publicaciones científicas de celdas solares de perovskita
dc.title.englishSoftware for Automatic Extraction of Performance Parameters from Scientific Publications on Perovskite Solar Cells
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.hasversionhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dspace.entity.type
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
Documento.pdf
Size:
10.44 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
413.2 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
425.96 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.18 KB
Format:
Item-specific license agreed to upon submission
Description: