Entrenamiento de una red neuronal artificial mediante el método BFGS estructurado

Abstract
Los problemas de mínimos cuadrados no lineales son comunes en diversas áreas de la ciencia y la ingeniería, donde se busca ajustar modelos matemáticos a datos experimentales de manera que minimicen la diferencia entre los valores observados y los predichos por el modelo. Estos problemas suelen ser no lineales debido a la presencia de parámetros desconocidos en el modelo. Para abordar estos desafiantes problemas, se han desarrollado varios métodos de optimización. Tres de los enfoques más utilizados son el método de Gauss-Newton, el método de Levenberg- Marquardt y el secante estructurado BFGS. Estos métodos de optimización desempeñan un papel fundamental en la resolución de problemas de mínimos cuadrados no lineales en una amplia gama de aplicaciones. La elección del método más adecuado depende de la naturaleza específica del problema y de las características de los datos, y cada uno de estos enfoques ofrece ventajas y desventajas que deben considerarse cuidadosamente en la selección del algoritmo óptimo. En este trabajo se presenta el método secante estructurado BFGS, se analiza la convergencia del método y se presenta una aplicación del mismo en el contexto de las redes neuronales.
Description
Keywords
Mínimos cuadrados no lineales, Redes neuronales, Método secante estructurado, Aprendizaje profundo
Citation
Collections