Análisis Comparativo de modelos de clasificación en el estudio de la deserción universitaria

  • Emma Barreno-Vereau Universidad de Lima (Perú)
Palabras clave: Universidades, Análisis de regresión logística, Deserción universitaria

Resumen

El presente artículo tiene como fi nalidad mostrar una metodología para la comparación de los modelos de clasificación “regresión logística” y “árbol de clasificación”. Este análisis comparativo se basó en el estudio de la deserción universitaria en una universidad particular. Se deseaba determinar si un alumno dado podría ser clasifi cado como un desertor potencial, teniendo como referencia determinadas variables explicativas. Para la aplicación de los modelos de clasificación se hizo uso del software comercial Minitab 16 y del software libre Weka 3-7-2, en los que se obtuvieron los modelos de regresión logística y el árbol de clasificación, respectivamente. En ambos casos se usaron los mismos datos de entrada y los datos de prueba para su evaluación. Entre las principales conclusiones se puede señalar que los dos modelos presentaron resultados similares, de acuerdo con las variables explicativas utilizadas, y que la elección del tipo de modelo a utilizar dependerá, además de la comparación de los resultados, de los requerimientos del estudio y de las facilidades de su implementación dentro del sistema de información de la institución que lo realice.

Descargas

La descarga de datos todavía no está disponible.

Biografía del autor/a

Emma Barreno-Vereau, Universidad de Lima (Perú)

Citas

Barreno, Emma y Gustavo Espíritu (2011). “Reducción de la deserción estudiantil en una facultad de un centro de estudios universitarios”. Trabajo de diplomatura. Lima: Universidad Nacional de Ingeniería

Bouckaert, Remco; Frank, Eibe; Hall, Mark; Kirkby, Richard; Reutemann, Peter; Seewald, Alex y David Scuse (2012). Weka manual for version 3-7-6. Universidad de Waikato, Hamilton <http://ufpr.dl.sourceforge.net/project/weka/documentation/3.7.x/WekaManual-3-7-6.pdf >. [Consulta: 15 de marzo del 2012].

Cuadras, Carles (2012). Nuevos métodos de análisis multivariante. Barcelona: CMC Editions. http://www.ub.edu/stat/personal/cuadras/metodos.pdf. [Consulta: 24 de febrero del 2012].

Giraldo, Juan (2009). “Caracterización de algunas técnicas algorítmicas de la inteligencia artificial para el descubrimiento de asociaciones entre variables y su aplicación en un caso de investigación específico” Tesis para optar el grado de magíster. Facultad de Minas, Universidad Nacional de Colombia, Medellín. <http://www.bdigital.unal.edu.co/2272/1/71741491.2009.pdf>. [Consulta: 01 de marzo del 2012]

Guzmán, Sandra (2009). “Deserción y retención estudiantil en los programas de pregrado de la Pontificia Universidad Javeriana”. Tesis para optar el grado de doctor. Pontificia Universidad Javeriana.<http://www.javeriana.edu.co/biblos/tesis/educacion/tesis81.pdf>. [Consulta: 30 de enero del 2012].

Hernández, José; Ramírez, M.ª José y César Ferri (2004). Introducción a la minería de datos. Madrid: Pearson Educación, S.A.

Ibarra, María del Carmen y Juan Michalus (2010). “Análisis del rendimiento académico mediante un modelo logit”. Ingeniería Industrial 9. Lima: Universidad de Lima, pp. 47-56. http://www.ici.ubiobio.cl/revista/index.php option=com_docman&task=doc_download&gid=110&&Itemid=15. [Consulta: 5 de marzo del 2012].

Juárez, O. y Ernestina Castells (2010). “Modelos de árbol de regresión bayesiano: un estudio de caso”. Investigación Operacional 31. Lima: Universidad de Lima, pp. 109-125. http://rev-inv-ope.univ-paris1.fr/files/31210/31210-02R.pdf. [Consulta: 10 de marzo del 2012].

Larose, Daniel (2006). Data mining: Methods and models. Nueva Jersey: Wiley Interscience <http://www.cse.hcmut.edu.vn/~chauvtn/data_mining/Texts/%5B6%5D%202006%20Data%20Mining%20Methods%20and%20Models.pdf>. [Consulta: 12 de marzo del 2012].

Ministerio de Educación Nacional (2009). Deserción estudiantil en la educación superior colombiana. Metodología de seguimiento, diagnóstico y elementos para su prevención. Bogotá: Imprenta Nacional de Colombia. <http://www.mineducacion.gov.co/sistemasdeinformacion/1735/articles-254702_libro_desercion.pdf>.[Consulta: 24 de enero del 2012].

Ramírez, Juliana (2010). “Regularización y métodos kernel para algoritmos de clasificación”. Tesis para optar el grado de magíster. Universidad Nacional de Colombia, Manizales. <http://www.bdigital.unal.edu.co/1991/1/julianaramirezcandamil.2010.pdf>. [Consulta: 11 de marzo del 2012].

Serna, Sandra (2009). “Comparación de árboles de regresión y clasificación y regresión logística”. Tesis para optar el grado de magíster. Universidad Nacional de Colombia, Medellín. <http://www.bdigital.unal.edu.co/671/1/42694070_2009.pdf>. [Consulta: 27 de enero del 2012].

Sineace (2010). Sistema Nacional de Evaluación, Acreditación y Certificación de la Calidad Educativa. “Propuesta del glosario de términos básicos de evaluación, acreditación y certificación del Sineace”. Lima.

Uriel, Ezequiel y Joaquín Aldás (2005). Análisis multivariante aplicado: aplicaciones al marketing, investigación de mercados, economía, dirección de empresas y turismo. Madrid: Thomson-Paraninfo.

Witten, Ian y Eibe Frank (2005). Data mining. Practical machine learning tools and techniques. California: Elsevier Publishing. <http://177.101.20.73/docs/WittenFrank.pdf>. [Consulta: 14 de marzo del 2012]

Publicado
2012-02-25
Cómo citar
Barreno-Vereau, E. (2012). Análisis Comparativo de modelos de clasificación en el estudio de la deserción universitaria. Interfases, 5(005), 45-82. https://doi.org/10.26439/interfases2012.n005.149
Sección
Artículos