Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)Sepúlveda Sepúlveda, Franklin AlexanderOtálora Bastidas, Camilo AndrésCamacho Parra, Cristian DavidJiménez Díaz, Mary Zuleika2022-04-192022-04-192022-03-292022-03-29https://noesis.uis.edu.co/handle/20.500.14071/9977El creciente interés en la tecnología fotovoltaica basada en Perovskitas ha llevado a un aumento significativo del número de artículos científicos publicados, lo que implica un aumento en la cantidad de información disponible para analizar. Dada la diversidad y gran cantidad de fuentes, los análisis profundos de la literatura relacionada, ahora toman gran tiempo. En el presente trabajo se plantea una solución para agilizar el análisis y recolección de información, mediante aplicaciones relacionadas con el aprendizaje automático (ML), usando herramientas de procesamiento de lenguaje natural (NLP) y minería de texto. Para esto se desarrolla una herramienta software de aprendizaje automático en lenguaje Python, que permite la extracción automática de capas de la celda de Perovskita como la ETL, la HTL y la Perovskita, y de parámetros de desempeño de la celda Perovskita como el Voc, el Jsc, el PCE y el FF, basada en la librería Python spaCy 3.0 a partir de publicaciones de estudios científicos en formato PDF almacenados en una base de datos. La herramienta de software cuenta con la funcionalidad de comandos de linea y se encuentra guardada en un repositorio virtual de Github. Además se adicionan dos trabajos a futuro, una interfaz gráfica desarrollada en Python para la corrección de datos de entrenamiento y un acercamiento a la minera de texto aplicada a tablas contenidas en PDFs.application/pdfspainfo:eu-repo/semantics/openAccessCeldas solares de perovskitaCeldas solaresReconocimiento de entidades nombradasAprendizaje AutomáticospaCyProcesamiento del lenguaje naturalMinería de textoPythonHerramienta de software para la extracción automática de parámetros de desempeño a partir de publicaciones científicas de celdas solares de perovskitaUniversidad Industrial de SantanderTesis/Trabajo de grado - Monografía - PregradoUniversidad Industrial de Santanderhttps://noesis.uis.edu.coPerovskite solar cellsSolar cellsNamed entity recognitionMachine learningspaCyNatural language processingText miningPythonSoftware for Automatic Extraction of Performance Parameters from Scientific Publications on Perovskite Solar Cellshttp://purl.org/coar/access_right/c_abf2info:eu-repo/semantics/openAccessAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)