Modelo de visualización de documentos: cluster y outliers (VA) (Spanish Edition)
Book Details
PublisherEditorial Académica Española
ISBN / ASIN3845487992
ISBN-139783845487991
MarketplaceFrance 🇫🇷
Description
En los últimos años de modernidad se ha generado una revolución en la digitalización de la información: datos numéricos y documentos. La minerÃa de texto es una respuesta a la necesidad de manipular el texto adecuadamente. La visualización de datos es una herramienta de la minerÃa de texto que permite obtener una representación gráfica de la información en alta dimensión. En este documento se presenta un modelo de separación de documentos por clases (tópicos) e identificación de estructuras: conglomerados (cluster), sub-conglomerados y valores atÃpicos (VA- Outliers). Se definen los conceptos de ruido y VA en documentos, también se propone una clasificación de VA basados en el tipo de palabras utilizadas (de propósito particular, general o compartidas). De los diferentes algoritmos de proyección de datos el de generación de mapas topográficos (GTM) ha tomado gran importancia en el marco probabilÃstico. Se presentan dos algoritmos: uno para la proyección y visualización de documentos (VL-ZIP) y otro para la separación de clases. El algoritmo VL-ZIP considera aplicar la función de distribución inflación de ceros con Poisson (ZIP) y un nuevo espacio latente.
