ENRIQUECIMIENTO AUTOMÁTICO DE DATOS EXTRAÍDOS MEDIANTE EL PROCESAMIENTO DE LENGUAJE NATURAL EN LA MINERÍA DE INFORMACIÓN DE CELDAS SOLARES DE PEROVSKITA

Abstract
En los últimos años se identifica un desarrollo notorio en el campo de la ciencia de los materiales logrando grandes cantidades de información. Dicha información se hace compleja de recopilar debido a distintos factores que dificultan obtener una base de datos confiable con una estructura bien definida. Por esta razón, las técnicas de PLN ofrecen una solución a una robusta recopilación de datos. Sin embargo, este conjunto de datos extraído con PLN presentan incongruencias y/o instancias incompletas. Por ello, se hace necesario aplicar estrategias para manejar estos problemas, las cuales en este trabajo de investigación se usa un único modelo de función de probabilidad para el enriquecimiento de un conjunto de datos de parámetros de celdas solares de Perovskita. El desarrollo de esta investigación se lleva a cabo en 2 fases. En la primera se acondiciona la base de datos para eliminar valores atípicos y en la segunda se entrena y evalúa el modelo. En consecuencia a este procedimiento se consigue una precisión media mayor al 50% y en el caso de la variable de eficiencia de conversión de energía se logra una precisión del 84%. En conclusión, esta investigación presenta resultados prometedores dada que resulta ser una propuesta innovadora en el campo de las celdas solares de Perovskita. Por último para obtener un mejor entrenamiento del modelo se recomienda hacer uso de una base de datos con una cantidad de datos más significativa.
Description
Keywords
Imputación, Mezclas gaussianas, Celdas solares de Perovskita
Citation