Análisis de los factores asociados a los resultados del examen saber pro, de los estudiantes de ingeniería industrial de universidades en Colombia, usando técnicas de minería de datos y minería de texto

dc.contributor.advisorLamos Díaz, Henry
dc.contributor.authorParra Moreno, Juan Camilo
dc.contributor.authorEspinosa Orjuela, Paola Andrea
dc.date.accessioned2024-03-04T01:14:00Z
dc.date.available2021
dc.date.available2024-03-04T01:14:00Z
dc.date.created2021
dc.date.issued2021
dc.description.abstractLas entidades del Estado Colombiano generan una gran cantidad de datos diariamente mediante sus procesos misionales, estos datos deben ser transformados en información útil que conduzca a una mejora en la eficiencia del gobierno en prácticas dirigidas al análisis y el perfeccionamiento del diseño de políticas públicas .En este artículo se explora la aplicación de la metodología KDD (Knowledge Discovery in Databases) a una base de datos que contiene los resultados del examen Saber Pro2019 publicados por el ICFES. Se realizaron análisis estadísticos y matemáticos a las variables consideradas de interés, se ajustó un modelo de clasificación a Instituciones de Educación Superior (IES) , se agruparon los estudiantes por medio de una clasificación socioeconómica y se crearon los perfiles tipológicos de cada grupo. Adicionalmente, se estudió la relación entre la clasificación socioeconómica, la institución de educación superior y el puntaje global por medio de un árbol de decisión. Por último, se realizó un análisis de sentimientos y se construyeron nubes de palabras con base a los resultados de una encuesta relacionada con las pruebas saber Pro. Se concluye que la categoría socioeconómica si es una variable con significancia estadística sobre el puntaje global, sin embargo, su influencia se ve trivializada en comparación con el efecto de la institución de educación superior con el puntaje. También se observa que hay una mayor proporción de estudiantes con categorías socioeconómicas más altas conforme aumenta la categoría la universidad. 1*
dc.description.abstractenglishThe Colombian State generates a large amount of data daily through his missionary processes, this data must be transformed into useful information that leads to improved government efficiency in practices aimed at the analysis and improvement of public policy design. This article explores the application of the KDD (Knowledge Discovery in Databases) methodology to a database containing the results of the Saber Pro2019 tests published by the ICFES. Statistical and mathematical analyses were performed on the variables deemed of interest, a classification model was adjusted on the Higher Education Institutions (IES), students were grouped by socioeconomic classification and typological profiles were created for each group. Additionally, the relationship between socioeconomic classification, higher education institution and overall score was studied by means of a decision tree. Finally, a sentiment analysis was performed and word clouds were constructed based on the results of a survey related to the saber Pro tests. It is concluded that the socioeconomic category is a variable with statistical significance on the overall score; however, its influence is trivialized in comparison with the effect that the institution of higher education has over the global score. It is also observed that there is a greater proportion of students with higher socioeconomic categories as the university category increases.
dc.description.degreelevelPregrado
dc.description.degreenameIngeniero Industrial
dc.format.mimetypeapplication/pdf
dc.identifier.instnameUniversidad Industrial de Santander
dc.identifier.reponameUniversidad Industrial de Santander
dc.identifier.repourlhttps://noesis.uis.edu.co
dc.identifier.urihttps://noesis.uis.edu.co/handle/20.500.14071/41225
dc.language.isospa
dc.publisherUniversidad Industrial de Santander
dc.publisher.facultyFacultad de Ingenierías Fisicomecánicas
dc.publisher.programIngeniería Industrial
dc.publisher.schoolEscuela de Estudios Industriales y Empresariales
dc.rightshttp://creativecommons.org/licenses/by/4.0/
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAttribution-NonCommercial 4.0 International (CC BY-NC 4.0)
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0
dc.subjectMinería de datos
dc.subjectAprendizaje automático
dc.subjectAlgoritmos
dc.subjectAnalítica de datos
dc.subjectMetodología KDD
dc.subjectaprendizaje no supervisado
dc.subjectaprendizaje supervisado
dc.subject.keywordData mining
dc.subject.keywordMachine learning
dc.subject.keywordAlgorithms
dc.subject.keywordData analytics
dc.subject.keywordKDD Methodology
dc.subject.keywordunsupervised learning
dc.subject.keywordsupervised learning
dc.titleAnálisis de los factores asociados a los resultados del examen saber pro, de los estudiantes de ingeniería industrial de universidades en Colombia, usando técnicas de minería de datos y minería de texto
dc.title.englishApplication of data mining techniques to the Saber Pro 2019 test results in Industrial Engineering students.4*
dc.type.coarhttp://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.hasversionhttp://purl.org/coar/resource_type/c_7a1f
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
Files
Original bundle
Now showing 1 - 3 of 3
No Thumbnail Available
Name:
Carta de autorización.pdf
Size:
109.47 KB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Documento.pdf
Size:
2.64 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Nota de proyecto.pdf
Size:
73.66 KB
Format:
Adobe Portable Document Format