Herramienta de software para la extracción automática de parámetros de desempeño a partir de publicaciones científicas de celdas solares de perovskita
Cargando...
Fecha
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Industrial de Santander
Resumen
El creciente interés en la tecnología fotovoltaica basada en Perovskitas ha llevado a un aumento significativo del número de artículos científicos publicados, lo que implica un aumento en la cantidad de información disponible para analizar. Dada la diversidad y gran cantidad de fuentes, los análisis profundos de la literatura relacionada, ahora toman gran tiempo.
En el presente trabajo se plantea una solución para agilizar el análisis y recolección de información, mediante aplicaciones relacionadas con el aprendizaje automático (ML), usando herramientas de procesamiento de lenguaje natural (NLP) y minería de texto. Para esto se desarrolla una herramienta software de aprendizaje automático en lenguaje Python, que permite la extracción automática de capas de la celda de Perovskita como la ETL, la HTL y la Perovskita, y de parámetros de desempeño de la celda Perovskita como el Voc, el Jsc, el PCE y el FF, basada en la librería Python spaCy 3.0 a partir de publicaciones de estudios científicos en formato PDF almacenados en una base de datos.
La herramienta de software cuenta con la funcionalidad de comandos de linea y se encuentra guardada en un repositorio virtual de Github. Además se adicionan dos trabajos a futuro, una interfaz gráfica desarrollada en Python para la corrección de datos de entrenamiento y un acercamiento a la minera de texto aplicada a tablas contenidas en PDFs.