Modelos analíticos de clasificación de texto

Modelos analíticos de clasificación de texto La clasificación de documentos es un proceso que busca facilitar la búsqueda y recuperación de la información. De acuerdo con (Lévano, 2011) la clasificación permite la agrupación de los documentos sobre un mismo tema a partir de características similares, donde un documento puede pertenecer a una sola clase o a varias clases. La clasificación se puede realizar de manera manual o automatizada; la clasificación automatizada es realizada por sistemas de computó y se divide en dos etapas, de entrenamiento y reconocimiento. En la etapa de entrenamiento se utiliza un conjunto de documentos para la construcción del modelo y en la etapa de reconocimiento se realiza la clasificación. Existen diferentes métodos computacionales (Godoy Viera, enero-abril 2017) que permiten dicha gestión como son Support vector machine (svm), K-means (k-m), K-nearest neighbors (k-nn) , Naive Bayes (nb), Self-organizing maps (som), Latent semantic indexing (lsi), Hi...