The machine learning in the prediction of elections - El aprendizaje automático en la predicción de las elecciones
DOI:
https://doi.org/10.32870/recibe.v4i2.36Palabras clave:
Automatic Learning, fuzzy logic, grouping, Weka, SALSA, LAMDA, state elections, predictionResumen
This research article, presents an analysis and a comparison of three different algorithms: A.- Grouping method K-means, B.-Expectation a convergence criteria, EM and C.- Methodology for classification LAMDA, using two software of classification Weka and SALSA, as an aid for the prediction of future elections in the state of Quintana Roo. When working with electoral data, these are classified in a qualitative and quantitative way, by such virtue at the end of this article you will have the elements necessary to decide, which software, has better performance for such learning of classification.The main reason for the development of this work, is to demonstrate the efficiency of algorithms, with different data types. At the end, it may be decided, the algorithm with the better performance in data management.Resúmen: Este artículo de investigación presenta el análisis y comparación de tres algoritmos diferentes: A.- método de agrupamiento K-media, B.- expectativa de criterios de convergencia y C.- metodología de clasificación LAMDA usando dos softwares de clasificación, Weka y SALSA, como auxiliares para la predicción de las futuras elecciones en el estado de Quintana Roo. Cuando se trabaja con datos electorales, éstos son clasificados en forma cualitativa y cuantitativa, de tal virtud que al final de este artículo tendrá los elementos necesarios para decidir que software tiene un mejor desempeño para el aprendizaje de dicha clasificación. La principal razón para hacer este trabajo es demostrar la eficiencia de los algoritmos con diferentes tipos de datos. Al final se podrá decidir sobre el algoritmo con mejor desempeño para el manejo de información.Palabras clave: aprendizaje automático, lógica fuzzy, agrupamiento, Weka, SALSA, LAMDA, elecciones estatales, predicción.Citas
Aguado-Chao, J. C. (1998). A mixed qualitative quantitative self-learning classification technique applied to situation assessment in industrial process control. Scotland: Associate European Lab, on Intelligent Systems and Advanced Control (LEA-SICA).
Aguado-Chao, J. C. (1998). A mixed Qualitative-Quantitative self-learning Classification Technique Applied to Situation Assessment in Industrial Process Control. Ph. D. Thesis Universitat Politecnica de Catalunya, Catalunya, España.
Aguilar–Martín, J., & López De Mantaras R. (1982), R. The process of classification and learning the meaning of linguistic descriptors of concepts. Approximate reasoning in decision analysis. 1982, pp. 165–175.
Arango, A., Velásquez, J. D., & Franco, C. J. (2013). Técnicas de Lógica Difusa en la predicción de índices de mercados de valores: una revisión de literatura. Revista Ingenierías Universidad de Medellín, 12(22), 117-126.
Becerra-Fernández, I.; Zanakis, S.H. & Steven Walczak (2002). Knowledge discovery techniques for predicting country investment risk. Computers and Industrial Engineering, 43(4) 787-800.
Berkhin, P. (2006). A survey of clustering data mining techniques. In Grouping multidimensional data. (pp. 25-71). Springer Berlin Heidelberg.
Berry, M. & Linoff, G.(1997). Data Mining Techniques for Marketing, Sales, and Customer Support, John Wiley & Sons Inc.
Bin-Othman, M. F., & Yau, T. M. S. (2007). Comparison of different classification techniques using WEKA for breast cancer. In 3rd Kuala Lumpur International Conference on Biomedical Engineering 2006 (pp. 520-523). Springer Berlin Heidelberg.
Carbonell, J. G., Michalski, R. S., & Mitchell, T. M. (1983). An overview of machine learning. In Machine learning (pp. 3-23). Springer Berlin Heidelberg.
De Ariza, M. G., & Aguilar-Martin, J. (2004). Clasificación de la personalidad y sus trastornos, con la herramienta LAMDA de Inteligencia Artificial en una muestra de personas de origen hispano que viven en Toulouse-Francia. Revista de Estudios Sociales, (18), 99-110.
Dellte, L., Osteso, J., M., & Claes, F (2013). Predicción de tendencia política por Twitter: elecciones Andaluzas 2012. Ámbitos. Revista Internacional de Comunicación, 22(1).
Desroches, P.(1987). Syclare: France de Classification avec Apprentissage et Reconnaissance de Formes. Manuel d’utilisation. Rapport de recherche, Centre d’estudis avançats de Blanes, Spagne.
Figueiredo, M. A., & Jain, A. K. (2002). Unsupervised learning of finite mixture models. Pattern Analysis and Machine Intelligence. IEEE Transactions on, 24(3), 381-396.
García, E. G., López, R. J., Moreno, J. J. M., Abad, A. S., Blasco, B. C., & Pol, A. P. (2009). La metodología del Data Mining. Una aplicación al consumo de alcohol en adolescentes. Adicciones: Revista de socidrogalcohol. 21(1), 65-80.
García, M. C., Jalal, A. M., Garzón, L. A., & López, J. M. (2013). Métodos para predecir índices bursátiles. Ecos de Economía, 17(37), 51-82.
Garre, M., Cuadrado, J. J., Sicilia, M. A., Rodríguez, D., & Rejas, R. (2007). Comparación de diferentes algoritmos de clustering en la estimación de coste en el desarrollo de software. Revista Española de Innovación, Calidad e Ingeniería del Software, 3(1), 6-22.
Jungherr, A., Jürgens, P., & Schoen, H. (2012). Why the pirate party won the german election of 2009 or the trouble with predictions: A response to Tumasjan, A., Sprenger, to, Sander, PG, & Welpe, IM “Predicting elections with twitter: What 140 characters reveal about political sentiment”. Social Science Computer Review, 30(2), 229-234.
J. B. MacQueen (1967): "Some Methods for classification and Analysis of Multivariate Observations, Proceedings of 5-th Berkeley Symposium on Mathematical Statistics and Probability", Berkeley, University of California Press, 1:281-297
Makazhanov, A., & Rafiei, D. (2013). Predicting political preference of Twitter users. In Proceedings of the 2013 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining (pp. 298-305). ACM
Matamoros, O. M., Balankin, A., & Simón, L. M. H. (2005). Metodología de predicción de precios del petróleo basada en dinámica fractal. Científica, 9(1), 3-11.
Torres Medina, Luis Eduardo (2000) Proyecciones electorales. Estudios Políticos, (26).
Moon, T. K. (1996). The expectation-maximization algorithm. Signal processing magazine, IEEE, 13(6), 47-60.
Piera, N., Deroches, P. and Aguilar-Martin (1989). J. LAMDA: An Incremental Conceptual Clustering Method. LAAS–CNRS, report (89420), Toulouse, France.
Xu R., & Wunsch D. (2005). Survey of clustering Algorithms. Neural Networks, IEEE Transactions on, 16(3), 645-678.
Ross, Timothy J (2009). Fuzzy logic with engineering applications. John Wiley & Sons.
Samuel, A. L. (1967). Some studies in machine learning using the game of checkers. II - Recent progress. IBM Journal of research and development, 11(6), 601-607.
Sang, E. T. K., & Bos, J. (2012). Predicting the 2011 dutch senate election results with twitter. In Proceedings of the Workshop on Semantic Analysis in Social Media, 53-60.
Sidorov, G., Miranda-Jiménez, S., Viveros-Jiménez, F., Gelbukh, A., Castro-Sánchez, N., Velásquez, F., & Gordon, J. (2013). Empirical study of machine learning based approach for opinion mining in tweets. In Advances in Artificial Intelligence (pp. 1-14). Springer Berlin Heidelberg.
Toro Ocampo, E. M., Molina Cabrera, A., & Garcés Ruiz, A. (2006). Pronóstico de bolsa de valores empleando técnicas inteligentes. Revista Tecnura, 9(18), 57-66.
Tumasjan, A., Sprenger, T. O., Sandner, P. G., & Welpe, I. M. (2010). Predicting Elections with Twitter. What 140 Characters Reveal about Political Sentiment. ICWSM, 10, 178-185.
Vega, C. A., Rosano, G., López, J. M., Cendejas, J. L., & Ferreira, H. (2010). Data Mining Aplicado a la Predicción y Tratamiento de Enfermedades. CISCI (Conferencia Iberoamericana en Sistemas, Cibernética e Informática) 2012, Aplicaciones de Informática y Cibernética en Ciencia y Tecnología. Recuperado el 24 de Marzo de 2015, de http://www.iiis.org/CDs2012/CD2012SCI/CISCI_2012/PapersPdf/CA732OV.pdf
Weron, R. (2007). Modeling and forecasting electricity loads and prices: A statistical approach (Vol. 403). John Wiley & Sons.
Zadeh, L. A. (1994). Fuzzy logic, neural networks, and soft computing. Communications of the ACM. 37(3), 77-84.