Análisis Comparativo de modelos de clasificación en el estudio de la deserción universitaria
DOI:
https://doi.org/10.26439/interfases2012.n005.149Keywords:
Universidades, Análisis de regresión logística, Deserción universitariaAbstract
El presente artículo tiene como fi nalidad mostrar una metodología para la comparación de los modelos de clasificación “regresión logística” y “árbol de clasificación”. Este análisis comparativo se basó en el estudio de la deserción universitaria en una universidad particular. Se deseaba determinar si un alumno dado podría ser clasifi cado como un desertor potencial, teniendo como referencia determinadas variables explicativas. Para la aplicación de los modelos de clasificación se hizo uso del software comercial Minitab 16 y del software libre Weka 3-7-2, en los que se obtuvieron los modelos de regresión logística y el árbol de clasificación, respectivamente. En ambos casos se usaron los mismos datos de entrada y los datos de prueba para su evaluación. Entre las principales conclusiones se puede señalar que los dos modelos presentaron resultados similares, de acuerdo con las variables explicativas utilizadas, y que la elección del tipo de modelo a utilizar dependerá, además de la comparación de los resultados, de los requerimientos del estudio y de las facilidades de su implementación dentro del sistema de información de la institución que lo realice.
Downloads
References
Barreno, Emma y Gustavo Espíritu (2011). “Reducción de la deserción estudiantil en una facultad de un centro de estudios universitarios”. Trabajo de diplomatura. Lima: Universidad Nacional de Ingeniería
Bouckaert, Remco; Frank, Eibe; Hall, Mark; Kirkby, Richard; Reutemann, Peter; Seewald, Alex y David Scuse (2012). Weka manual for version 3-7-6. Universidad de Waikato, Hamilton <http://ufpr.dl.sourceforge.net/project/weka/documentation/3.7.x/WekaManual-3-7-6.pdf >. [Consulta: 15 de marzo del 2012].
Cuadras, Carles (2012). Nuevos métodos de análisis multivariante. Barcelona: CMC Editions. http://www.ub.edu/stat/personal/cuadras/metodos.pdf. [Consulta: 24 de febrero del 2012].
Giraldo, Juan (2009). “Caracterización de algunas técnicas algorítmicas de la inteligencia artificial para el descubrimiento de asociaciones entre variables y su aplicación en un caso de investigación específico” Tesis para optar el grado de magíster. Facultad de Minas, Universidad Nacional de Colombia, Medellín. <http://www.bdigital.unal.edu.co/2272/1/71741491.2009.pdf>. [Consulta: 01 de marzo del 2012]
Guzmán, Sandra (2009). “Deserción y retención estudiantil en los programas de pregrado de la Pontificia Universidad Javeriana”. Tesis para optar el grado de doctor. Pontificia Universidad Javeriana.<http://www.javeriana.edu.co/biblos/tesis/educacion/tesis81.pdf>. [Consulta: 30 de enero del 2012].
Hernández, José; Ramírez, M.ª José y César Ferri (2004). Introducción a la minería de datos. Madrid: Pearson Educación, S.A.
Ibarra, María del Carmen y Juan Michalus (2010). “Análisis del rendimiento académico mediante un modelo logit”. Ingeniería Industrial 9. Lima: Universidad de Lima, pp. 47-56. http://www.ici.ubiobio.cl/revista/index.php option=com_docman&task=doc_download&gid=110&&Itemid=15. [Consulta: 5 de marzo del 2012].
Juárez, O. y Ernestina Castells (2010). “Modelos de árbol de regresión bayesiano: un estudio de caso”. Investigación Operacional 31. Lima: Universidad de Lima, pp. 109-125. http://rev-inv-ope.univ-paris1.fr/files/31210/31210-02R.pdf. [Consulta: 10 de marzo del 2012].
Larose, Daniel (2006). Data mining: Methods and models. Nueva Jersey: Wiley Interscience <http://www.cse.hcmut.edu.vn/~chauvtn/data_mining/Texts/%5B6%5D%202006%20Data%20Mining%20Methods%20and%20Models.pdf>. [Consulta: 12 de marzo del 2012].
Ministerio de Educación Nacional (2009). Deserción estudiantil en la educación superior colombiana. Metodología de seguimiento, diagnóstico y elementos para su prevención. Bogotá: Imprenta Nacional de Colombia. <http://www.mineducacion.gov.co/sistemasdeinformacion/1735/articles-254702_libro_desercion.pdf>.[Consulta: 24 de enero del 2012].
Ramírez, Juliana (2010). “Regularización y métodos kernel para algoritmos de clasificación”. Tesis para optar el grado de magíster. Universidad Nacional de Colombia, Manizales. <http://www.bdigital.unal.edu.co/1991/1/julianaramirezcandamil.2010.pdf>. [Consulta: 11 de marzo del 2012].
Serna, Sandra (2009). “Comparación de árboles de regresión y clasificación y regresión logística”. Tesis para optar el grado de magíster. Universidad Nacional de Colombia, Medellín. <http://www.bdigital.unal.edu.co/671/1/42694070_2009.pdf>. [Consulta: 27 de enero del 2012].
Sineace (2010). Sistema Nacional de Evaluación, Acreditación y Certificación de la Calidad Educativa. “Propuesta del glosario de términos básicos de evaluación, acreditación y certificación del Sineace”. Lima.
Uriel, Ezequiel y Joaquín Aldás (2005). Análisis multivariante aplicado: aplicaciones al marketing, investigación de mercados, economía, dirección de empresas y turismo. Madrid: Thomson-Paraninfo.
Witten, Ian y Eibe Frank (2005). Data mining. Practical machine learning tools and techniques. California: Elsevier Publishing. <http://177.101.20.73/docs/WittenFrank.pdf>. [Consulta: 14 de marzo del 2012]
Downloads
Published
Issue
Section
License
Authors who publish with this journal agree to the following terms:
Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under an Attribution 4.0 International (CC BY 4.0) License. that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.
Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.
Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (See The Effect of Open Access).
Last updated 03/05/21