The machine learning in the prediction of elections - El aprendizaje automático en la predicción de las elecciones

José A. León-Borges; Roger-Ismael Noh-Balam; Lino Rangel Gómez; Michael Philip Strand

doi:10.32870/recibe.v4i2.36

Autores/as

José A. León-Borges Universidad Politécnica de Quintana Roo, México.
Roger-Ismael Noh-Balam Instituto Tecnológico de Chetumal, México.
Lino Rangel Gómez Instituto Tecnológico de Chetumal, México.
Michael Philip Strand Estudiante de Ingeniería en Sistemas Computacionales Instituto Tecnológico de Chetumal, México.

DOI:

https://doi.org/10.32870/recibe.v4i2.36

Palabras clave:

Automatic Learning, fuzzy logic, grouping, Weka, SALSA, LAMDA, state elections, prediction

Resumen

This research article, presents an analysis and a comparison of three different algorithms: A.- Grouping method K-means, B.-Expectation a convergence criteria, EM and C.- Methodology for classification LAMDA, using two software of classification Weka and SALSA, as an aid for the prediction of future elections in the state of Quintana Roo. When working with electoral data, these are classified in a qualitative and quantitative way, by such virtue at the end of this article you will have the elements necessary to decide, which software, has better performance for such learning of classification.The main reason for the development of this work, is to demonstrate the efficiency of algorithms, with different data types. At the end, it may be decided, the algorithm with the better performance in data management.Resúmen: Este artículo de investigación presenta el análisis y comparación de tres algoritmos diferentes: A.- método de agrupamiento K-media, B.- expectativa de criterios de convergencia y C.- metodología de clasificación LAMDA usando dos softwares de clasificación, Weka y SALSA, como auxiliares para la predicción de las futuras elecciones en el estado de Quintana Roo. Cuando se trabaja con datos electorales, éstos son clasificados en forma cualitativa y cuantitativa, de tal virtud que al final de este artículo tendrá los elementos necesarios para decidir que software tiene un mejor desempeño para el aprendizaje de dicha clasificación. La principal razón para hacer este trabajo es demostrar la eficiencia de los algoritmos con diferentes tipos de datos. Al final se podrá decidir sobre el algoritmo con mejor desempeño para el manejo de información.Palabras clave: aprendizaje automático, lógica fuzzy, agrupamiento, Weka, SALSA, LAMDA, elecciones estatales, predicción.

Biografía del autor/a

José A. León-Borges, Universidad Politécnica de Quintana Roo, México.

José Antonio León Borges 2014: Candidato a Doctor en Sistemas Computacionales: Universidad del Sur, plantel Cancún 2012. Maestría en Ciencias de la Informática. Universidad Villa Rica. Boca del Río, Veracruz. 2010. Especialidad en Base de Datos. Universidad Villa Rica. Boca del Río, Veracruz. 2009. Licenciatura en Computación y Sistemas. Universidad Villa Rica. Boca del Río, Veracruz. Inglés: 453 puntos en TOEFL Perfil Deseable Dic 2014-Dic 2017.

Roger-Ismael Noh-Balam, Instituto Tecnológico de Chetumal, México.

Roger Ismael Noh Balam 2014: Candidato a Doctor en Sistemas Computacionales: Universidad del Sur, plantel Cancún 2000. Maestría en Administración. Instituto de Estudios Universitarios, plantel Cancún 1994. Licenciatura en Informática. Instituto Tecnológico de Chetumal 1994-2003: Profesor de Tiempo Completo Instituto Tecnológico de Chetumal 2003-2012: Titular de la Unidad Técnica de Informática y Estadística Instituto Electoral de Quintana Roo 2012: Profesor de Tiempo Completo Instituto Tecnológico de Chetumal.

Lino Rangel Gómez, Instituto Tecnológico de Chetumal, México.

Lino Rangel Gómez 2008: Maestría en Tecnología Educativa Universidad Da Vinci 1993: Licenciado en Computación Universidad Autónoma del Estado de Hidalgo. 2002:Subdirector de Planeación del Instituto Tecnológico de Chetumal.

Michael Philip Strand, Estudiante de Ingeniería en Sistemas Computacionales Instituto Tecnológico de Chetumal, México.

Micheal Philip Strand 2015: Instituto Tecnológico de Chetumal, Estudiante de la Ingeniería en Sistemas Computacionales 2012: University of Belize, Architectural Technology, Associates degree in Applied Science.

Citas

Aguado-Chao, J. C. (1998). A mixed qualitative quantitative self-learning classification technique applied to situation assessment in industrial process control. Scotland: Associate European Lab, on Intelligent Systems and Advanced Control (LEA-SICA).

Aguado-Chao, J. C. (1998). A mixed Qualitative-Quantitative self-learning Classification Technique Applied to Situation Assessment in Industrial Process Control. Ph. D. Thesis Universitat Politecnica de Catalunya, Catalunya, España.

Aguilar–Martín, J., & López De Mantaras R. (1982), R. The process of classification and learning the meaning of linguistic descriptors of concepts. Approximate reasoning in decision analysis. 1982, pp. 165–175.

Arango, A., Velásquez, J. D., & Franco, C. J. (2013). Técnicas de Lógica Difusa en la predicción de índices de mercados de valores: una revisión de literatura. Revista Ingenierías Universidad de Medellín, 12(22), 117-126.

Becerra-Fernández, I.; Zanakis, S.H. & Steven Walczak (2002). Knowledge discovery techniques for predicting country investment risk. Computers and Industrial Engineering, 43(4) 787-800.

Berkhin, P. (2006). A survey of clustering data mining techniques. In Grouping multidimensional data. (pp. 25-71). Springer Berlin Heidelberg.

Berry, M. & Linoff, G.(1997). Data Mining Techniques for Marketing, Sales, and Customer Support, John Wiley & Sons Inc.

Bin-Othman, M. F., & Yau, T. M. S. (2007). Comparison of different classification techniques using WEKA for breast cancer. In 3rd Kuala Lumpur International Conference on Biomedical Engineering 2006 (pp. 520-523). Springer Berlin Heidelberg.

Carbonell, J. G., Michalski, R. S., & Mitchell, T. M. (1983). An overview of machine learning. In Machine learning (pp. 3-23). Springer Berlin Heidelberg.

De Ariza, M. G., & Aguilar-Martin, J. (2004). Clasificación de la personalidad y sus trastornos, con la herramienta LAMDA de Inteligencia Artificial en una muestra de personas de origen hispano que viven en Toulouse-Francia. Revista de Estudios Sociales, (18), 99-110.

Dellte, L., Osteso, J., M., & Claes, F (2013). Predicción de tendencia política por Twitter: elecciones Andaluzas 2012. Ámbitos. Revista Internacional de Comunicación, 22(1).

Desroches, P.(1987). Syclare: France de Classification avec Apprentissage et Reconnaissance de Formes. Manuel d’utilisation. Rapport de recherche, Centre d’estudis avançats de Blanes, Spagne.

Figueiredo, M. A., & Jain, A. K. (2002). Unsupervised learning of finite mixture models. Pattern Analysis and Machine Intelligence. IEEE Transactions on, 24(3), 381-396.

García, E. G., López, R. J., Moreno, J. J. M., Abad, A. S., Blasco, B. C., & Pol, A. P. (2009). La metodología del Data Mining. Una aplicación al consumo de alcohol en adolescentes. Adicciones: Revista de socidrogalcohol. 21(1), 65-80.

García, M. C., Jalal, A. M., Garzón, L. A., & López, J. M. (2013). Métodos para predecir índices bursátiles. Ecos de Economía, 17(37), 51-82.

Garre, M., Cuadrado, J. J., Sicilia, M. A., Rodríguez, D., & Rejas, R. (2007). Comparación de diferentes algoritmos de clustering en la estimación de coste en el desarrollo de software. Revista Española de Innovación, Calidad e Ingeniería del Software, 3(1), 6-22.

Jungherr, A., Jürgens, P., & Schoen, H. (2012). Why the pirate party won the german election of 2009 or the trouble with predictions: A response to Tumasjan, A., Sprenger, to, Sander, PG, & Welpe, IM “Predicting elections with twitter: What 140 characters reveal about political sentiment”. Social Science Computer Review, 30(2), 229-234.

J. B. MacQueen (1967): "Some Methods for classification and Analysis of Multivariate Observations, Proceedings of 5-th Berkeley Symposium on Mathematical Statistics and Probability", Berkeley, University of California Press, 1:281-297

Makazhanov, A., & Rafiei, D. (2013). Predicting political preference of Twitter users. In Proceedings of the 2013 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining (pp. 298-305). ACM

Matamoros, O. M., Balankin, A., & Simón, L. M. H. (2005). Metodología de predicción de precios del petróleo basada en dinámica fractal. Científica, 9(1), 3-11.

Torres Medina, Luis Eduardo (2000) Proyecciones electorales. Estudios Políticos, (26).

Moon, T. K. (1996). The expectation-maximization algorithm. Signal processing magazine, IEEE, 13(6), 47-60.

Piera, N., Deroches, P. and Aguilar-Martin (1989). J. LAMDA: An Incremental Conceptual Clustering Method. LAAS–CNRS, report (89420), Toulouse, France.

Xu R., & Wunsch D. (2005). Survey of clustering Algorithms. Neural Networks, IEEE Transactions on, 16(3), 645-678.

Ross, Timothy J (2009). Fuzzy logic with engineering applications. John Wiley & Sons.

Samuel, A. L. (1967). Some studies in machine learning using the game of checkers. II - Recent progress. IBM Journal of research and development, 11(6), 601-607.

Sang, E. T. K., & Bos, J. (2012). Predicting the 2011 dutch senate election results with twitter. In Proceedings of the Workshop on Semantic Analysis in Social Media, 53-60.

Sidorov, G., Miranda-Jiménez, S., Viveros-Jiménez, F., Gelbukh, A., Castro-Sánchez, N., Velásquez, F., & Gordon, J. (2013). Empirical study of machine learning based approach for opinion mining in tweets. In Advances in Artificial Intelligence (pp. 1-14). Springer Berlin Heidelberg.

Toro Ocampo, E. M., Molina Cabrera, A., & Garcés Ruiz, A. (2006). Pronóstico de bolsa de valores empleando técnicas inteligentes. Revista Tecnura, 9(18), 57-66.

Tumasjan, A., Sprenger, T. O., Sandner, P. G., & Welpe, I. M. (2010). Predicting Elections with Twitter. What 140 Characters Reveal about Political Sentiment. ICWSM, 10, 178-185.

Vega, C. A., Rosano, G., López, J. M., Cendejas, J. L., & Ferreira, H. (2010). Data Mining Aplicado a la Predicción y Tratamiento de Enfermedades. CISCI (Conferencia Iberoamericana en Sistemas, Cibernética e Informática) 2012, Aplicaciones de Informática y Cibernética en Ciencia y Tecnología. Recuperado el 24 de Marzo de 2015, de http://www.iiis.org/CDs2012/CD2012SCI/CISCI_2012/PapersPdf/CA732OV.pdf

Weron, R. (2007). Modeling and forecasting electricity loads and prices: A statistical approach (Vol. 403). John Wiley & Sons.

Zadeh, L. A. (1994). Fuzzy logic, neural networks, and soft computing. Communications of the ACM. 37(3), 77-84.

The machine learning in the prediction of elections - El aprendizaje automático en la predicción de las elecciones

Autores/as

DOI:

Palabras clave:

Resumen

Biografía del autor/a

José A. León-Borges, Universidad Politécnica de Quintana Roo, México.

Roger-Ismael Noh-Balam, Instituto Tecnológico de Chetumal, México.

Lino Rangel Gómez, Instituto Tecnológico de Chetumal, México.

Michael Philip Strand, Estudiante de Ingeniería en Sistemas Computacionales Instituto Tecnológico de Chetumal, México.

Citas

Descargas

Publicado

Cómo citar

Número

Sección

Licencia

Idioma

Enviar un artículo