Tres técnicas de regresión con aprendizaje de máquina: Regresiones Lineal, Ridge y Lasso
dc.contributor.advisor | Ríos Gutiérrez, Andrés Sebastián | |
dc.contributor.author | Mogotocoro Sanabria, Juan Carlos | |
dc.contributor.evaluator | Romo Bucheli, David Edmundo | |
dc.contributor.evaluator | Rivera Flórez, Tulia Esther | |
dc.date.accessioned | 2024-06-27T20:12:18Z | |
dc.date.available | 2024-06-27T20:12:18Z | |
dc.date.created | 2024-05-21 | |
dc.date.issued | 2024-05-21 | |
dc.description.abstract | En la actualidad el aprendizaje automático sirve para analizar grandes bases de datos almacenados en los avances tecnológicos y empresas. Normalmente, existen muchas variables predictoras en el modelo de regresión lineal. No obstante, el método de mínimos cuadrados ordinarios hace varias suposiciones sobre los datos lo que genera que no sea ciertas en datos reales. Frecuentemente, ocasiona problemas al ajustar el modelo mediante mínimos cuadrados. La dificultad más común es que el modelo se ajuste demasiado a los datos, esto pasa cuando el estimador es insesgado pero tiene una alta variabilidad. Para este problema las regresiones Ridge y Lasso son dos técnicas de regularización utilizadas para crear un modelo mejor y más preciso. Las cuales se basan en reducir el número de variables imponiendo una penalización sobre los coeficientes de regresión que obliga a que los coeficientes tiendan a cero o incluso sean cero. Por último, se realiza una implementación con dos conjuntos de datos donde se comparan los tres modelos y se elige el que mejor tenga ajuste con el criterio del menor error cuadrático medio (ECM). | |
dc.description.abstractenglish | Currently, machine learning is used to analyze large datasets stored in technological advancements. Typically, there are many predictor variables in the linear regression model. However, the ordinary least squares method makes several assumptions about the data that are often not true in real-world datasets. Frequently, this causes issues when fitting the model using least squares. The most common difficulty is that the model overfits the data, which occurs when the estimator is unbiased but has high variability. For this problem, Ridge and Lasso regressions are two regularization techniques used to create a better and more accurate model. These techniques aim to reduce the number of variables by imposing a penalty on the regression coefficients, forcing them to tend towards zero or even be zero. Finally, an implementation is carried out using two datasets where the three models are compared, and the one with the best fit is chosen based on the criterion of the lowest mean squared error (MSE). | |
dc.description.degreelevel | Pregrado | |
dc.description.degreename | Matemático | |
dc.format.mimetype | application/pdf | |
dc.identifier.instname | Universidad Industrial de Santander | |
dc.identifier.reponame | Universidad Industrial de Santander | |
dc.identifier.repourl | https://noesis.uis.edu.co | |
dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/43662 | |
dc.language.iso | spa | |
dc.publisher | Universidad Industrial de Santander | |
dc.publisher.faculty | Facultad de Ciencias | |
dc.publisher.program | Matemáticas | |
dc.publisher.school | Escuela de Matemáticas | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
dc.rights.license | Atribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO) | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Regresión lineal | |
dc.subject | Regresión Ridge | |
dc.subject | Regresión Lasso | |
dc.subject | Aprendizaje de máquina | |
dc.subject | Regularización | |
dc.subject | Validación cruzada | |
dc.subject.keyword | Linear regression | |
dc.subject.keyword | Ridge regression | |
dc.subject.keyword | Lasso regression | |
dc.subject.keyword | machine learning | |
dc.subject.keyword | Regularization | |
dc.subject.keyword | cross-validation | |
dc.title | Tres técnicas de regresión con aprendizaje de máquina: Regresiones Lineal, Ridge y Lasso | |
dc.title.english | Three Machine Learning Regression Techniques: Linear, Ridge, and Lasso Regressions | |
dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
dc.type.hasversion | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado |
Files
Original bundle
1 - 3 of 3
No Thumbnail Available
- Name:
- Carta de autorización.pdf
- Size:
- 141.35 KB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Nota de proyecto.pdf
- Size:
- 314.46 KB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 2.18 KB
- Format:
- Item-specific license agreed to upon submission
- Description: