Analítica de datos para la predicción del desempeño en el examen saber 11

dc.contributor.advisorPedraza Ferreira, Gabriel Rodrigo
dc.contributor.advisorRamos Pollan, Raul
dc.contributor.authorForero Africano, Aron Rene
dc.date.accessioned2024-03-04T00:04:25Z
dc.date.available2018
dc.date.available2024-03-04T00:04:25Z
dc.date.created2018
dc.date.issued2018
dc.description.abstractLa analítica de datos que es la ciencia que tiene como tarea examinar los datos en bruto, y sacar conclusiones útiles, y el Machine Learning es una importante área en la Inteligencia Artificial, dos de las más populares áreas del conocimiento en la actualidad y es porque buscan automatizar procesos que se realizan manualmente, pero que pueden ser llevados a cabo por una máquina. La educación colombiana si bien ha visto una evolución significativa en los últimos años, se sitúa muy atrás en comparación con otros países. Los procesos de seguimiento y mejoramiento de la educación no dan los mejores resultados, y los programas de apoyo a los estudiantes son muy ineficaces y lentos; por tanto en esta investigación se propone la construcción de una herramienta de machine learning que contribuya a la identificación de los factores socio-económicos que afectan el rendimiento académico de los estudiantes. Se plantea utilizar los datos que proporciona las pruebas SABER11, desde el año 2000 hasta el año 2017. A estos datos se les hizo un análisis exploratorio y luego una limpieza profunda para que fuese posible su uso posterior en un modelo de machine learning. Con los datos ya limpios se hizo un análisis más profundo para tratar cualquier fenómeno particular que presentaran los datos. Lo siguiente fue plantear los modelos predictivos, realizar las respectivas pruebas, la selección de mejores algoritmos y la experimentación para obtener resultados. Se consiguió un error medio absoluto de 7.13 y finalmente se realizó un análisis a los resultados y se concluyó que factores como los ingresos familiares, la educación de los padres, algunos aspectos del colegio, entre otros, influyen en el rendimiento académico del estudiante.
dc.description.abstractenglishData analysis is the science that has the task to examine the pure data and make useful conclusions, and machine learning a really important area of the artificial intelligence, are two of the most popular areas of the knowledge in the present and that is because are looking for automation in a lot of processes that are manually done, but could be done by a machine. The Colombian education although have seen a good improvement in the last years, it is located far back in comparison to other countries. The monitoring processes and the processes of improvement are not giving the better results, and the students support programs are so slow and ineffective; thus in this investigation the construction of a machine learning tool that contributes to identify the socio-economic factors that affects the academic performance of the student is proposed. It is proposed to use the SABER11 data, since the 2000 to the 2017 year. An exploratory analysis was done and then a data cleaning to this data with the purpose of using it into a machine learning model. With the data already cleaned a deeper analysis was done to treat any particular phenomenon that could exist. The next step was purpose the predictive models, do the respective tests, the selection of the best algorithms and the experimentation to get the results. A mean absolute error of 7.13 was achieved and finally an analysis of the results was done, and it was conclude that factors such as family income, parents education, some aspects of the school among others, influence the academic performance of the students.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero de Sistemas
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/38589
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingenierías Fisicomecánicas
dc.publisher.programIngeniería de Sistemas
dc.publisher.schoolEscuela de Ingeniería de Sistemas e Informática
dc.rightshttp://creativecommons.org/licenses/by/4.0/
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0
dc.subjectIcfes
dc.subjectExamen Saber11
dc.subjectDesempeño En El Examen Saber11
dc.subjectDeserción Estudiantil
dc.subjectAnalítica De Datos
dc.subjectMachine Learning
dc.subjectInteligencia Artificial.
dc.subject.keywordIcfes
dc.subject.keywordSaber11 Exam
dc.subject.keywordPerformance In Saber11 Exam
dc.subject.keywordData Analytics
dc.subject.keywordMachine Learning
dc.subject.keywordArtificial Intelligence.
dc.titleAnalítica de datos para la predicción del desempeño en el examen saber 11
dc.title.englishData analytics for predicting performance in the saber11 exam.
dc.type.coarhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversionhttp://purl.org/coar/resource_type/c_7a1f
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
1.42 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
4.93 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
158.22 KB
Format:
Adobe Portable Document Format