Análisis Comparativo de modelos de clasificación en el estudio de la deserción universitaria
Resumen
El presente artículo tiene como fi nalidad mostrar una metodología para la comparación de los modelos de clasificación “regresión logística” y “árbol de clasificación”. Este análisis comparativo se basó en el estudio de la deserción universitaria en una universidad particular. Se deseaba determinar si un alumno dado podría ser clasifi cado como un desertor potencial, teniendo como referencia determinadas variables explicativas. Para la aplicación de los modelos de clasificación se hizo uso del software comercial Minitab 16 y del software libre Weka 3-7-2, en los que se obtuvieron los modelos de regresión logística y el árbol de clasificación, respectivamente. En ambos casos se usaron los mismos datos de entrada y los datos de prueba para su evaluación. Entre las principales conclusiones se puede señalar que los dos modelos presentaron resultados similares, de acuerdo con las variables explicativas utilizadas, y que la elección del tipo de modelo a utilizar dependerá, además de la comparación de los resultados, de los requerimientos del estudio y de las facilidades de su implementación dentro del sistema de información de la institución que lo realice.
Descargas
Citas
Barreno, Emma y Gustavo Espíritu (2011). “Reducción de la deserción estudiantil en una facultad de un centro de estudios universitarios”. Trabajo de diplomatura. Lima: Universidad Nacional de Ingeniería
Bouckaert, Remco; Frank, Eibe; Hall, Mark; Kirkby, Richard; Reutemann, Peter; Seewald, Alex y David Scuse (2012). Weka manual for version 3-7-6. Universidad de Waikato, Hamilton <http://ufpr.dl.sourceforge.net/project/weka/documentation/3.7.x/WekaManual-3-7-6.pdf >. [Consulta: 15 de marzo del 2012].
Cuadras, Carles (2012). Nuevos métodos de análisis multivariante. Barcelona: CMC Editions. http://www.ub.edu/stat/personal/cuadras/metodos.pdf. [Consulta: 24 de febrero del 2012].
Giraldo, Juan (2009). “Caracterización de algunas técnicas algorítmicas de la inteligencia artificial para el descubrimiento de asociaciones entre variables y su aplicación en un caso de investigación específico” Tesis para optar el grado de magíster. Facultad de Minas, Universidad Nacional de Colombia, Medellín. <http://www.bdigital.unal.edu.co/2272/1/71741491.2009.pdf>. [Consulta: 01 de marzo del 2012]
Guzmán, Sandra (2009). “Deserción y retención estudiantil en los programas de pregrado de la Pontificia Universidad Javeriana”. Tesis para optar el grado de doctor. Pontificia Universidad Javeriana.<http://www.javeriana.edu.co/biblos/tesis/educacion/tesis81.pdf>. [Consulta: 30 de enero del 2012].
Hernández, José; Ramírez, M.ª José y César Ferri (2004). Introducción a la minería de datos. Madrid: Pearson Educación, S.A.
Ibarra, María del Carmen y Juan Michalus (2010). “Análisis del rendimiento académico mediante un modelo logit”. Ingeniería Industrial 9. Lima: Universidad de Lima, pp. 47-56. http://www.ici.ubiobio.cl/revista/index.php option=com_docman&task=doc_download&gid=110&&Itemid=15. [Consulta: 5 de marzo del 2012].
Juárez, O. y Ernestina Castells (2010). “Modelos de árbol de regresión bayesiano: un estudio de caso”. Investigación Operacional 31. Lima: Universidad de Lima, pp. 109-125. http://rev-inv-ope.univ-paris1.fr/files/31210/31210-02R.pdf. [Consulta: 10 de marzo del 2012].
Larose, Daniel (2006). Data mining: Methods and models. Nueva Jersey: Wiley Interscience <http://www.cse.hcmut.edu.vn/~chauvtn/data_mining/Texts/%5B6%5D%202006%20Data%20Mining%20Methods%20and%20Models.pdf>. [Consulta: 12 de marzo del 2012].
Ministerio de Educación Nacional (2009). Deserción estudiantil en la educación superior colombiana. Metodología de seguimiento, diagnóstico y elementos para su prevención. Bogotá: Imprenta Nacional de Colombia. <http://www.mineducacion.gov.co/sistemasdeinformacion/1735/articles-254702_libro_desercion.pdf>.[Consulta: 24 de enero del 2012].
Ramírez, Juliana (2010). “Regularización y métodos kernel para algoritmos de clasificación”. Tesis para optar el grado de magíster. Universidad Nacional de Colombia, Manizales. <http://www.bdigital.unal.edu.co/1991/1/julianaramirezcandamil.2010.pdf>. [Consulta: 11 de marzo del 2012].
Serna, Sandra (2009). “Comparación de árboles de regresión y clasificación y regresión logística”. Tesis para optar el grado de magíster. Universidad Nacional de Colombia, Medellín. <http://www.bdigital.unal.edu.co/671/1/42694070_2009.pdf>. [Consulta: 27 de enero del 2012].
Sineace (2010). Sistema Nacional de Evaluación, Acreditación y Certificación de la Calidad Educativa. “Propuesta del glosario de términos básicos de evaluación, acreditación y certificación del Sineace”. Lima.
Uriel, Ezequiel y Joaquín Aldás (2005). Análisis multivariante aplicado: aplicaciones al marketing, investigación de mercados, economía, dirección de empresas y turismo. Madrid: Thomson-Paraninfo.
Witten, Ian y Eibe Frank (2005). Data mining. Practical machine learning tools and techniques. California: Elsevier Publishing. <http://177.101.20.73/docs/WittenFrank.pdf>. [Consulta: 14 de marzo del 2012]
Los autores/as que publiquen en esta revista aceptan las siguientes condiciones:
Los autores/as conservan los derechos de autor y ceden a la revista el derecho de la primera publicación, con el trabajo registrado con la licencia de atribución de Creative Commons, que permite a terceros utilizar lo publicado siempre que mencionen la autoría del trabajo y a la primera publicación en esta revista.
Los autores/as pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en esta revista (p. ej., incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en esta revista.
Se permite y recomienda a los autores/as a publicar su trabajo en Internet (por ejemplo en páginas institucionales o personales) antes y durante el proceso de revisión y publicación, ya que puede conducir a intercambios productivos y a una mayor y más rápida difusión del trabajo publicado (vea The Effect of Open Access).
Última actualización: 03/05/21