Analítica de datos para la predicción del desempeño en el examen saber 11
dc.contributor.advisor | Pedraza Ferreira, Gabriel Rodrigo | |
dc.contributor.advisor | Ramos Pollan, Raul | |
dc.contributor.author | Forero Africano, Aron Rene | |
dc.date.accessioned | 2024-03-04T00:04:25Z | |
dc.date.available | 2018 | |
dc.date.available | 2024-03-04T00:04:25Z | |
dc.date.created | 2018 | |
dc.date.issued | 2018 | |
dc.description.abstract | La analítica de datos que es la ciencia que tiene como tarea examinar los datos en bruto, y sacar conclusiones útiles, y el Machine Learning es una importante área en la Inteligencia Artificial, dos de las más populares áreas del conocimiento en la actualidad y es porque buscan automatizar procesos que se realizan manualmente, pero que pueden ser llevados a cabo por una máquina. La educación colombiana si bien ha visto una evolución significativa en los últimos años, se sitúa muy atrás en comparación con otros países. Los procesos de seguimiento y mejoramiento de la educación no dan los mejores resultados, y los programas de apoyo a los estudiantes son muy ineficaces y lentos; por tanto en esta investigación se propone la construcción de una herramienta de machine learning que contribuya a la identificación de los factores socio-económicos que afectan el rendimiento académico de los estudiantes. Se plantea utilizar los datos que proporciona las pruebas SABER11, desde el año 2000 hasta el año 2017. A estos datos se les hizo un análisis exploratorio y luego una limpieza profunda para que fuese posible su uso posterior en un modelo de machine learning. Con los datos ya limpios se hizo un análisis más profundo para tratar cualquier fenómeno particular que presentaran los datos. Lo siguiente fue plantear los modelos predictivos, realizar las respectivas pruebas, la selección de mejores algoritmos y la experimentación para obtener resultados. Se consiguió un error medio absoluto de 7.13 y finalmente se realizó un análisis a los resultados y se concluyó que factores como los ingresos familiares, la educación de los padres, algunos aspectos del colegio, entre otros, influyen en el rendimiento académico del estudiante. | |
dc.description.abstractenglish | Data analysis is the science that has the task to examine the pure data and make useful conclusions, and machine learning a really important area of the artificial intelligence, are two of the most popular areas of the knowledge in the present and that is because are looking for automation in a lot of processes that are manually done, but could be done by a machine. The Colombian education although have seen a good improvement in the last years, it is located far back in comparison to other countries. The monitoring processes and the processes of improvement are not giving the better results, and the students support programs are so slow and ineffective; thus in this investigation the construction of a machine learning tool that contributes to identify the socio-economic factors that affects the academic performance of the student is proposed. It is proposed to use the SABER11 data, since the 2000 to the 2017 year. An exploratory analysis was done and then a data cleaning to this data with the purpose of using it into a machine learning model. With the data already cleaned a deeper analysis was done to treat any particular phenomenon that could exist. The next step was purpose the predictive models, do the respective tests, the selection of the best algorithms and the experimentation to get the results. A mean absolute error of 7.13 was achieved and finally an analysis of the results was done, and it was conclude that factors such as family income, parents education, some aspects of the school among others, influence the academic performance of the students. | |
dc.description.degreelevel | Pregrado | |
dc.description.degreename | Ingeniero de Sistemas | |
dc.format.mimetype | application/pdf | |
dc.identifier.instname | Universidad Industrial de Santander | |
dc.identifier.reponame | Universidad Industrial de Santander | |
dc.identifier.repourl | https://noesis.uis.edu.co | |
dc.identifier.uri | https://noesis.uis.edu.co/handle/20.500.14071/38589 | |
dc.language.iso | spa | |
dc.publisher | Universidad Industrial de Santander | |
dc.publisher.faculty | Facultad de Ingenierías Fisicomecánicas | |
dc.publisher.program | Ingeniería de Sistemas | |
dc.publisher.school | Escuela de Ingeniería de Sistemas e Informática | |
dc.rights | http://creativecommons.org/licenses/by/4.0/ | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
dc.rights.license | Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc/4.0 | |
dc.subject | Icfes | |
dc.subject | Examen Saber11 | |
dc.subject | Desempeño En El Examen Saber11 | |
dc.subject | Deserción Estudiantil | |
dc.subject | Analítica De Datos | |
dc.subject | Machine Learning | |
dc.subject | Inteligencia Artificial. | |
dc.subject.keyword | Icfes | |
dc.subject.keyword | Saber11 Exam | |
dc.subject.keyword | Performance In Saber11 Exam | |
dc.subject.keyword | Data Analytics | |
dc.subject.keyword | Machine Learning | |
dc.subject.keyword | Artificial Intelligence. | |
dc.title | Analítica de datos para la predicción del desempeño en el examen saber 11 | |
dc.title.english | Data analytics for predicting performance in the saber11 exam. | |
dc.type.coar | http://purl.org/coar/version/c_b1a7d7d4d402bcce | |
dc.type.hasversion | http://purl.org/coar/resource_type/c_7a1f | |
dc.type.local | Tesis/Trabajo de grado - Monografía - Pregrado |
Files
Original bundle
1 - 3 of 3
No Thumbnail Available
- Name:
- Carta de autorización.pdf
- Size:
- 1.42 MB
- Format:
- Adobe Portable Document Format
No Thumbnail Available
- Name:
- Nota de proyecto.pdf
- Size:
- 158.22 KB
- Format:
- Adobe Portable Document Format