Modelo basado en aprendizaje de máquina estadístico para la determinación de factores que influyen en el rendimiento de sistemas de gestión de bases de datos relacionales

  • José Luis Ponce-Vergara Universidad Nacional de Ingeniería
Palabras clave: SQL, sistema de gestión de base de datos relacional, análisis de componentes principales, análisis de correlación canónica, algoritmo de aprendizaje de máquina estadístico, rendimiento de ejecución de sentencias SQL, administración del rendimiento

Resumen

Los procesos de negocios que soportan sus operaciones con aplicaciones que interactúan con sistemas de gestión de bases de datos relacionales (RDBMS) pueden incrementar su productividad a través de la identificación de los factores que afectan el rendimiento de las ejecuciones de las sentencias SQL que conforman su carga de trabajo, especialmente las cargas generadas por aplicaciones implementadas en ambientes de producción, que son recurrentes en el tiempo. El artículo propone un modelo de identificación de factores que afectan el rendi miento de las ejecuciones de las sentencias SQL que se procesan en un RDBMS, valiéndose de algoritmos de aprendizaje de máquina estadístico (análisis de componentes principales y análi sis de correlación canónica) que explotan la información de los planes, estadísticas y métricas generadas durante el ciclo de vida de las ejecuciones de las sentencias SQL.

Descargas

La descarga de datos todavía no está disponible.

Citas

Badrinath Krishna, V., Weaver G.A., y Sanders W. H. (2015). PCA-Based Method for Detecting Integrity Attacks on Advanced Metering Infrastructure. En J. Campos y B. Haverkort (Eds.), Quantitative Evaluation of Systems. 12th International Conference, QEST 2015, Proceedings (pp. 70-85). Springer.

Bontempi G., y Kruijtzer W. (2002). A Data Analysis Method for Software Performance Prediction. En Proceedings of the Design, automation and test in Europe (DATE 02) (pp. 971-976). IEEE.

Brauckhoff, D., Salamatian, K., y May, M. (2009). Applying PCA for Traffic Anomaly Detection: Problems and Solutions. En Proceedings of IEEE INFOCOMM 2009.

De, P., Sinha, A. P., y Vessey, I. (2001). An Empirical Investigation of Factors Influencing Object-Oriented Database Querying. Information Technolog y and Management, 2(1), 71-93.

Fortier P. J., y Michel H. E. (2003). Computer Systems Performance Evaluation and Prediction. Digital Press.

Ganapathi, A. S., Kuno, H. A., y Dayal, U. (2015). U. S. Patent No. 9,189,523. U.S. Patent and Trademark Office.

Giusto P., Martin G., Harcourt E. (2001). Reliable Estimation of Execution Time of Embedded Software. Proceedings of the DATE 200 on Design, Automationand Test in Europe (pp. 580-589). IEEE.

Kleinrock, L. (1976). Queuing Systems, Volume II: Computer Applications. John Wiley & Sons.

Mikolajczyk, K., Schmid, C.,(2005). A performance evaluation of local descriptors. IEEE Transactions of Pattern Analysis and Machine Intelligence, 27(10), 1615-1630.

Schkolnick, M., y Tiberio, P. (1985). Estimating the cost of updates in a relational database. ACM Transactions on Database Systems (TODS), 10(2), 163-179.

Shawe-Taylor, J. (2004). Kernel Methods for Pattern Analysis. Cambridge University Press.

Smith, C. U., y Williams, L. G. (2002). Performance and Scalability of Distributed Software Architectures: An SPE Approach. Scalable Computing: Practice and Experience, 3(4).

Zhang L., Liu F., y Zeng Z. (2018). Combining Link and Content Correlation Learning for Cross-Modal Retrieval in Social Multimedia. En Q. Zu y B. Hu (Eds.), Human Centered Computing. HCC 2017. Lecture Notes in Computer Science, 10745. Springer, Cham.

Publicado
2021-10-14
Cómo citar
Ponce-Vergara, J. L. (2021). Modelo basado en aprendizaje de máquina estadístico para la determinación de factores que influyen en el rendimiento de sistemas de gestión de bases de datos relacionales. Actas Del Congreso Internacional De Ingeniería De Sistemas, 59-75. https://doi.org/10.26439/ciis2020.5511