Tres técnicas de regresión con aprendizaje de máquina: Regresiones Lineal, Ridge y Lasso

dc.contributor.advisorRíos Gutiérrez, Andrés Sebastián
dc.contributor.authorMogotocoro Sanabria, Juan Carlos
dc.contributor.evaluatorRomo Bucheli, David Edmundo
dc.contributor.evaluatorRivera Flórez, Tulia Esther
dc.date.accessioned2024-06-27T20:12:18Z
dc.date.available2024-06-27T20:12:18Z
dc.date.created2024-05-21
dc.date.issued2024-05-21
dc.description.abstractEn la actualidad el aprendizaje automático sirve para analizar grandes bases de datos almacenados en los avances tecnológicos y empresas. Normalmente, existen muchas variables predictoras en el modelo de regresión lineal. No obstante, el método de mínimos cuadrados ordinarios hace varias suposiciones sobre los datos lo que genera que no sea ciertas en datos reales. Frecuentemente, ocasiona problemas al ajustar el modelo mediante mínimos cuadrados. La dificultad más común es que el modelo se ajuste demasiado a los datos, esto pasa cuando el estimador es insesgado pero tiene una alta variabilidad. Para este problema las regresiones Ridge y Lasso son dos técnicas de regularización utilizadas para crear un modelo mejor y más preciso. Las cuales se basan en reducir el número de variables imponiendo una penalización sobre los coeficientes de regresión que obliga a que los coeficientes tiendan a cero o incluso sean cero. Por último, se realiza una implementación con dos conjuntos de datos donde se comparan los tres modelos y se elige el que mejor tenga ajuste con el criterio del menor error cuadrático medio (ECM).
dc.description.abstractenglishCurrently, machine learning is used to analyze large datasets stored in technological advancements. Typically, there are many predictor variables in the linear regression model. However, the ordinary least squares method makes several assumptions about the data that are often not true in real-world datasets. Frequently, this causes issues when fitting the model using least squares. The most common difficulty is that the model overfits the data, which occurs when the estimator is unbiased but has high variability. For this problem, Ridge and Lasso regressions are two regularization techniques used to create a better and more accurate model. These techniques aim to reduce the number of variables by imposing a penalty on the regression coefficients, forcing them to tend towards zero or even be zero. Finally, an implementation is carried out using two datasets where the three models are compared, and the one with the best fit is chosen based on the criterion of the lowest mean squared error (MSE).
dc.description.degreelevelPregrado
dc.description.degreenameMatemático
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/43662
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ciencias
dc.publisher.programMatemáticas
dc.publisher.schoolEscuela de Matemáticas
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAtribución-NoComercial-SinDerivadas 2.5 Colombia (CC BY-NC-ND 2.5 CO)
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectRegresión lineal
dc.subjectRegresión Ridge
dc.subjectRegresión Lasso
dc.subjectAprendizaje de máquina
dc.subjectRegularización
dc.subjectValidación cruzada
dc.subject.keywordLinear regression
dc.subject.keywordRidge regression
dc.subject.keywordLasso regression
dc.subject.keywordmachine learning
dc.subject.keywordRegularization
dc.subject.keywordcross-validation
dc.titleTres técnicas de regresión con aprendizaje de máquina: Regresiones Lineal, Ridge y Lasso
dc.title.englishThree Machine Learning Regression Techniques: Linear, Ridge, and Lasso Regressions
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.hasversionhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
141.35 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
314.46 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
1.58 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.18 KB
Format:
Item-specific license agreed to upon submission
Description:
Collections