Aplicación de Algoritmos de Votación en la Clasificación de Textos

Authors

  • Saturnino Job Morales Escobar Centro Universitario UAEM Valle de México Universidad Autónoma del Estado de México http://orcid.org/0000-0002-8144-7984
  • María Esther Guevara Cruz Universidad Tecnológica Fidel Velázquez
  • Héctor Rafael Orozco Aguirre Centro Universitario UAEM Valle de México Universidad Autónoma del Estado de México http://orcid.org/0000-0002-2169-4254

DOI:

https://doi.org/10.32870/recibe.v8i2.138

Keywords:

clasificación de textos, algoritmos de votación, rasgos textuales, contexto

Abstract

Los algoritmos de clasificación basada en la similitud entre textos, es un tópico de gran interés lo que es motivado por la relevancia y complejidad que presenta esta problemática y la gran cantidad de ámbitos que requieren de sistemas automatizados para resolverla. Por mencionar algunos ejemplos, se requiere de aplicaciones capaces de determinar de manera automática la sensibilidad de la información textual almacenada en archivos para decidir el grado de protección o diferenciar datos sensibles de aquellos que no lo son para prevenir o detectar su fuga o accesos no autorizados. Esto puede ser establecido con base en la importancia de su contenido. Así, una forma de abordar el problema es desde la perspectiva de la clasificación de textos con base en contexto. Para ello, es necesario desarrollar algoritmos que consideren la semántica de los documentos desde el momento que se generan y obtener su clasificación mediante un conjunto de características que incluyan rasgos textuales. En este trabajo, se definen los rasgos textuales y la relación semántica entre rasgos textuales. Considerando que un texto es la concatenación de rasgos textuales, la relación semántica de los rasgos textuales permite determinar su grado de pertenencia a un tema. Para la clasificación de textos, se aplican las etapas del modelo de algoritmos de votación desarrollados bajo el Reconocimiento Lógico Combinatorio de Patrones.

Author Biographies

Saturnino Job Morales Escobar, Centro Universitario UAEM Valle de México Universidad Autónoma del Estado de México

Recibió el título de Licenciado en Computación y el grado de Maestro en Ciencias de la Computación por la Benemérita Universidad Autónoma de Puebla, México. Ha participado en el desarrollo de proyectos de investigación en las áreas de la Inteligencia Artificial y el Reconocimiento de Patrones y sus aplicaciones. Desde 2002 es Profesor de Tiempo Completo en el Centro Universitario Valle de México de la Universidad Autónoma del Estado de México, México. Pertenece al cuerpo académico de Inteligencia Computacional y sus áreas de interés incluyen, Reconocimiento Lógico Combinatorio de Patrones, Inteligencia Artificial y Minería de datos y de textos. Cuenta con el reconocimiento de Perfil Deseable PRODEP de la SEP en México.

María Esther Guevara Cruz, Universidad Tecnológica Fidel Velázquez

recibió el título de Licenciada en Computación y el grado de Maestra en Ciencias de la Computación por la Benemérita Universidad Autónoma de Puebla, México. Ha participado en el desarrollo de proyectos de investigación en las áreas de la Inteligencia Artificial y el Reconocimiento de Patrones y sus aplicaciones. Actualmente es Profesora de Tiempo Completo en la Universidad Tecnológica Fidel Velázquez, México. Sus áreas de interés incluyen, Reconocimiento Lógico Combinatorio de Patrones, Inteligencia Artificial y Minería de Datos y de Textos.

Héctor Rafael Orozco Aguirre, Centro Universitario UAEM Valle de México Universidad Autónoma del Estado de México

Profesor de Tiempo Completo del Centro Universitario UAEM Valle de México de la Universidad Autónoma del Estado de México, México. Obtuvo su Maestría en 2006 y Doctorado en 2010 en el Centro de Investigación y de Estudios Avanzados del Instituto Politécnico Nacional, Unidad Guadalajara, México. Como parte de sus estancias de investigación en el extranjero, de 2007 a 2008 estuvo en el Laboratorio de Realidad Virtual de la Escuela Politécnica Federal de Lausana, Suiza, y de 2011 a 2012 en el Instituto de Innovación en Medios de Comunicación de la Universidad Tecnológica de Nanyang, Singapur. En 2011, fue galardonado por la Sociedad Mexicana de Inteligencia Artificial a la Tercera Mejor Tesis de Doctorado a nivel nacional. Actualmente, trabaja en Proyectos de Investigación referentes a Simulación de Estrategias de Predicción y Anticipación de Crimen para su Control y Reducción, Tutores Virtuales para la Mejora de la Enseñanza Educativa, así como Análisis, Modelado y Simulación de Tráfico Vehicular y Comportamiento Peatonal. Ha dirigido tesis de maestría y licenciatura, Ha sido conferencista magistral y ponente en diversos eventos y ha publicado artículos y capítulos de libro en las áreas de Inteligencia Artificial Aplicada e Inteligencia Computacional. Cuenta con el reconocimiento de Perfil Deseable PRODEP de la SEP en México.

References

Aggarwal, C. C., & Zhai, C. (2012). A survey of text clustering algorithms. En C. C. Aggarwal, & C. Zhai, Mining text data (págs. 77-128). Boston, MA, USA: Springer.

Coello, L., Frias, M., Fernandez, Y., Filiberto, Y., Bello, R., & Caballero, Y. (2018). Construcción de relaciones de similaridad borrosa basada en la medida calidad de la similaridad. Investigación Operacional, 38(2), 132-140.

Kowsari, K., Jafari Meimandi, K., Heidarysafa, M., Mendu, S., Barnes, L., & Brown, D. (2019). Text Classification Algorithms: A Survey. Information, 10(4), 1-68. Obtenido de Information: https://arxiv.org/pdf/1904.08067.pdf

Kumar, B. V., & Basha, M. S. (2015). Optimal Similarity Measure to Ensure Robustness in Text Classification and Clustering. International Journal of Electronics Communication and Computer Engineering, 6(5), 161-167.

Manning, C. D., & Schütze, H. (1999). Foundations of statistical natural language processing. London, England: MIT Press.

Martı́nez-Trinidad, J. F., & Guzmán-Arenas, A. (2001). The logical combinatorial approach to pattern recognition, an overview through selected works. Pattern Recognition, 34(4), 741-751.

Ruiz-Shulcloper, J., Arenas, A. G., & Trinidad, J. F. (1999). Enfoque Lógico Combinatorio al Reconocimiento de Patrones. Ciudad de México, México: Instituto Politécnico Nacional.

Vallez, M., & Pedraza, R. (20 de september de 2007). El Procesamiento del Lenguaje Natural en la Recuperación de Información Textual y áreas afines. Hipertext.net(5). Obtenido de Hipertext.net: http://www.hipertext.net

Published

2019-10-29

How to Cite

Morales Escobar, S. J., Guevara Cruz, M. E., & Orozco Aguirre, H. R. (2019). Aplicación de Algoritmos de Votación en la Clasificación de Textos. ReCIBE, Electronic Journal of Computing, Informatics, Biomedical and Electronics, 8(2), C–5. https://doi.org/10.32870/recibe.v8i2.138

Issue

Section

Computer Science & IT