Tres técnicas de regresión con aprendizaje de máquina: Regresiones Lineal, Ridge y Lasso

Mogotocoro Sanabria, Juan Carlos

Tres técnicas de regresión con aprendizaje de máquina: Regresiones Lineal, Ridge y Lasso

Files

Carta de autorización.pdf (141.35 KB)

Nota de proyecto.pdf (314.46 KB)

Documento.pdf (1.58 MB)

Date

2024-05-21

Publisher

Universidad Industrial de Santander

Abstract

En la actualidad el aprendizaje automático sirve para analizar grandes bases de datos almacenados en los avances tecnológicos y empresas. Normalmente, existen muchas variables predictoras en el modelo de regresión lineal. No obstante, el método de mínimos cuadrados ordinarios hace varias suposiciones sobre los datos lo que genera que no sea ciertas en datos reales. Frecuentemente, ocasiona problemas al ajustar el modelo mediante mínimos cuadrados. La dificultad más común es que el modelo se ajuste demasiado a los datos, esto pasa cuando el estimador es insesgado pero tiene una alta variabilidad. Para este problema las regresiones Ridge y Lasso son dos técnicas de regularización utilizadas para crear un modelo mejor y más preciso. Las cuales se basan en reducir el número de variables imponiendo una penalización sobre los coeficientes de regresión que obliga a que los coeficientes tiendan a cero o incluso sean cero. Por último, se realiza una implementación con dos conjuntos de datos donde se comparan los tres modelos y se elige el que mejor tenga ajuste con el criterio del menor error cuadrático medio (ECM).

Keywords

Regresión lineal, Regresión Ridge, Regresión Lasso, Aprendizaje de máquina, Regularización, Validación cruzada

URI

https://noesis.uis.edu.co/handle/20.500.14071/43662

Collections

Matemáticas

Full item page