Análisis comparativo de métodos de machine learning para clasificar opiniones sobre el servicio de restaurantes peruanos en Facebook

  • Martín Jesús Adrianzén Torres Universidad de Lima, Perú
  • Edwin Jhonatan Escobedo Cárdenas Universidad de Lima, Perú
Palabras clave: análisis de sentimientos, procesamiento de lenguaje natural, machine learning, máquinas de soporte vectorial, Naive Bayes, Ramdom Forest, servicio de restaurantes

Resumen

Las opiniones de los clientes sobre servicios en redes sociales son vitales para las empresas debido a que se pueden utilizar para mejorar y potenciar las oportunidades de negocio si los comentarios pueden analizarse a tiempo. El propósito de este trabajo es determinar los métodos de machine learning con mejor rendimiento para aplicar análisis de sentimientos y clasificar comentarios positivos y negativos sobre el servicio de restaurantes peruanos en Facebook. Como primera contribución en este proyecto, se crearon dos datasets de comentarios de publicaciones de cadenas de restaurantes peruanos en Facebook. La segunda contribución es la metodología propuesta dividida en dos etapas: en la primera etapa se aplicaron técnicas de Lenguaje Natural para el preprocesamiento de los comentarios; en la segunda etapa se analizó el desempeño de los algoritmos de Naive Bayes, Random Forest y SVM con núcleos RBF y Lineal para clasificar las opiniones en los datasets. Los resultados experimentales demostraron que el clasificador SVM obtuvo el mejor desempeño tanto en la etapa de entrenamiento como en la de pruebas con un 91.44% y 94% de exactitud para los datasets primario y secundario respectivamente, probando la viabilidad de la metodología propuesta.

Descargas

La descarga de datos todavía no está disponible.

Biografía del autor/a

Martín Jesús Adrianzén Torres, Universidad de Lima, Perú

Estudiante de último ciclo de la Carrera de Ingeniería de Sistemas de la Universidad de Lima con formación en aprendizaje automático/profundo. Conocimientos de los lenguajes de programación en Java y Python e interés y participación en proyectos de investigación de procesamiento de lenguaje natural, ingeniería social y análisis en redes sociales.

Edwin Jhonatan Escobedo Cárdenas, Universidad de Lima, Perú

Doctor en Ciencias de la Computación con una sólida formación en aprendizaje automático/profundo y más de seis años de experiencia en el uso de modelos predictivos y algoritmos de procesamiento de datos. Experto en los lenguajes de programación Matlab y R/Python e involucrado en la investigación de reconocimiento del lenguaje de acción/gesto/signo.

Citas

He, W., Zha, S., y Li, L. (2016). Social Media Competitive Analysis and Text Mining: A Case Study in the Pizza Industry. International Journal of Information Management, 33(3), 464-472. https://doi.org/10.1016/j.ijinfomgt.2013.01.001

Hossain, F. M. T., Hossain, M. I., y Nawshin, S. (2017). Machine Learning Based Class Level Prediction of Restaurant Reviews. 2017 IEEE Region 10 Humanitarian Technology Conference (R10-HTC), 420-423. https://doi.org/10.1109/R10-HTC.2017.8288989

Ibrahim, N. F., y Wang, X. (2019). A Text Analytics Approach for Online Retailing Service Improvement: Evidence from Twitter. Decision Support Systems, 121, 37-50. https://doi.org/10.1016/j.dss.2019.03.002

Islam, M., Jubayer, F., y Ahmed, S. (2017). A Support Vector Machine Mixed with TFIDF Algorithm to Categorize Bengali Document. 2017 International Conference on Electrical, Computer and Communication Engineering (ECCE), 191-196. https://doi.org/10.1109/ecace.2017.7912904

Khan, A. H., y Zubair, M. (2020). Classification of Multi-Lingual Tweets, into Multi-Class Model Using Naïve Bayes and Semi-Supervised Learning. Multimedia Tools and Applications, 79(43-44), 32749-32767. https://doi.org/10.1007/s11042-020-09512-2

Krishna, A., Akhilesh, V., Aich, A., y Hegde, C. (2019). Sentiment Analysis of Restaurant Reviews Using Machine Learning Techniques. En V. Sridhar, M. Padma y K. Rao (Eds.), Emerging Research in Electronics, Computer Science and Technology (pp. 687-696). Springer. https://doi.org/10.1007/978-981-13-5802-9_60

Madasu, A., y Elango, S. (2020). Efficient Feature Selection Techniques for Sentiment Analysis. Multimedia Tools and Applications, 79(9-10), 6313-6335. https://doi.org/10.1007/s11042-019-08409-z

Poornima, A., y Priya, K. S. (2020). A Comparative Sentiment Analysis of Sentence Embedding Using Machine Learning Techniques. En 2020 6th International Conference on Advanced Computing and Communication Systems, ICACCS, 493-496. https://doi.org/10.1109/ICACCS48705.2020.9074312

Yulianto, M., Girsang, A. S., y Rumagit, R. Y. (2018). Business Intelligence for Social Media Interaction in the Travel Industry in Indonesia. Journal of Intelligence Studies in Business, 8(2), 77-84. https://doi.org/10.37380/JISIB.V8I2.323

Zahoor, K., Bawany, N. Z., y Hamid, S. (2020). Sentiment Analysis and Classification of Restaurant Reviews Using Machine Learning. 2020 21st International Arab Conference on Information Technology (ACIT). https://doi.org/10.1109/ACIT50332.2020.9300098

Publicado
2021-12-22
Cómo citar
Adrianzén Torres, M. J., & Escobedo Cárdenas, E. J. (2021). Análisis comparativo de métodos de machine learning para clasificar opiniones sobre el servicio de restaurantes peruanos en Facebook. Actas Del Congreso Internacional De Ingeniería De Sistemas, 67-81. https://doi.org/10.26439/ciis2021.5578