Optimización de Hiperparámetros en Algoritmos de Aprendizaje Automático

dc.contributor.advisorLamos Díaz, Henry
dc.contributor.authorAcero Lozada, July Andrea
dc.contributor.authorRojas Ramirez, Kevin Stiveen
dc.contributor.evaluatorOrtiz Pimiento, Nestor Raul
dc.contributor.evaluatorEscobar Rodriguez, Laura Yeraldin
dc.date.accessioned2023-08-09T15:40:37Z
dc.date.available2023-08-09T15:40:37Z
dc.date.created2023-08-08
dc.date.issued2023-08-08
dc.description.abstractEn la actualidad, el Automated Machine Learning (AutoML) ha sido ampliamente aplicado debido al alto potencial benéfico que aporta a los distintos sectores de la industria, particularmente en la mejora de los flujos de trabajo, el rendimiento de los procesos y la efectividad empresarial. Dentro del AutoML es importante la adecuada elección de los valores de hiperparámetros mediante técnicas de optimización, ya que los algoritmos de ML dependen de los valores de hiperparámetros (HPs) elegidos debido a que estos influyen en el rendimiento de la máquina. Por ello, en esta investigación se diseña metodológicamente el proceso de construcción de los espacios de búsqueda y se propone una técnica para la optimización hiperparámetros de una máquina de Random Forest (RF) mediante la adaptación de la metaheurística de Particle Swarm Optimization (PSO). Esta técnica se utiliza para el análisis de conjunto de datos equilibrados y desequilibrados, mediante un proceso de benchmarking. Para validar el rendimiento del método, inicialmente se ejecutó el algoritmo de Random Forest sin aplicar la técnica de optimización, en donde se encontró la existencia de sobreajuste. Para reducir este comportamiento se establece una comparación entre PSO y técnicas de mayor usabilidad como Grid Search y Random Search a fin de analizar el comportamiento del modelo e identificar la técnica más efectiva en términos de funcionalidad y rendimiento. Los resultados demuestran que el modelo de clasificación Random Forest junto con la técnica de optimización de hiperparámetros Particle Swarm Optimization (PSO) mejoró la eficacia general del modelo, posibilitando obtener valores óptimos de hiperparámetros que mejoraron el rendimiento y el sobreajuste del modelo.
dc.description.abstractenglishNowadays, Automated Machine Learning (AutoML) has been widely applied due to the high beneficial potential it brings to different industry sectors, particularly in the improvement of workflows, process performance and business effectiveness. Within AutoML, the proper choice of hyperparameter values through optimization techniques is important, since ML algorithms depend on the chosen hyperparameter values (HPs) due to the fact that they influence machine performance. Therefore, in this research we methodologically design the process of constructing the search spaces and propose a technique for hyperparameter optimization of a Random Forest machine by adapting the particle swarm metaheuristic (PSO). This technique is used for the analysis of balanced and unbalanced dataset through a benchmarking process. To validate the performance of the method, the Random Forest algorithm was initially run without applying the optimization technique, where the existence of overfitting was found. To reduce this behavior, a comparison between PSO and more usable techniques such as Grid Search and Random Search is established in order to analyze the behavior of the model and identify the most effective technique in terms of functionality and performance. The results show that the Random Forest classification model together with the hyperparameter optimization technique Particle Swarm Optimization (PSO) improved the overall efficiency of the model, making it possible to obtain optimal hyperparameter values that improved the performance and overfitting of the model.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero Industrial
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/14755
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingeníerias Fisicomecánicas
dc.publisher.programIngeniería Industrial
dc.publisher.schoolEscuela de Estudios Industriales y Empresariales
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectAutoML
dc.subjectHPO
dc.subjectespacios de búsqueda
dc.subjecthiperparámetros
dc.subjectestrategia de espacios de búsqueda
dc.subjectIngeniería de características
dc.subject.keywordAutoML
dc.subject.keywordHPO
dc.subject.keywordsearch spaces
dc.subject.keywordhyperparameters
dc.subject.keywordsearch space strategy
dc.subject.keywordfeature engineering
dc.titleOptimización de Hiperparámetros en Algoritmos de Aprendizaje Automático
dc.title.englishHyperparameter Optimization in Machine Learning Algorithms
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.hasversionhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
Files
Original bundle
Now showing 1 - 4 of 4
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
236.08 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
228.25 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
2.11 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Anexos.rar
Size:
2.37 MB
Format:
Unknown data format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.18 KB
Format:
Item-specific license agreed to upon submission
Description: