Minería de Texto en posible propuesta de grado

Volviendo al tema de mi propuesta de proyecto de grado, me encuentro con el tema: la Minería de texto (text mining), el cual:

"(...) es una herramienta que proviene del área del procesamiento automático de textos y que permite localizar y extraer la información más significativa y esencial de los documentos, así como información y conocimiento implícito y oculto en grandes corpus textuales electrónicos, estructurados o no estructurados", .

Funciona a partir de una telaraña semántica, que tiene como objetivo construir toda una estructura de metadatos, información sobre la estructura y significado de los datos almacenados e incluirlos en los documentos de forma que sean navegables, identificables y entendibles por las máquinas, por lo que es una herramienta eficaz para gestionar el conocimiento. "Se enfoca en el descubrimiento de patrones interesantes y nuevos conocimientos en un conjunto de textos, es decir, su objetivo es descubrir tendencias, desviaciones y asociaciones en la gran cantidad de información textual disponible",1 e s decir, facilita realizar análisis y se erige como un área emergente de la minería de datos. Elimina la información duplicada y detecta información similar o relacionada con la existente.(...)". (tomado de http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1024-94352007000500014) (subrado fuera de texto)

El término subrayado, creo que puede ser base para mi proyecto de grado, ya que considero que este concepto me parece muy interesante para poder aplicar, teniendo en cuenta que existe una falencia en relación con la captura de información relevante que llega diariamente al Ministerio (favor ver mis blogs anteriores relacionados con el proyecto de grado), ya que mucha de esta información simplemente se tramita y se archiva, perdiéndose valiosa información, que puede ser útil a tener en cuenta, cuando se requiere tramitar actos administrativos.

Al día de hoy en no he visto que se aplique este tipo de metodologías en el Ministerio (aunque desconozco si en otros grupos estas trabajando al respecto).

Comentarios

Entradas populares de este blog

Opinión UML

Impresiones Orange - Minería de Datos