Título: Classificação automática de texto buscando similaridade de palavras e significados ocultos
Autores: Rocha, Ricardo Luis de Azevedo da
Catae, Fabricio S.
Fecha: 2012-11-06
2012-10
2012-10
Publicador: Unversidad Nacional de La Plata
Fuente:

Tipo: Objeto de conferencia
Objeto de conferencia
Tema: information retrieval
latent semantic indexing
Clustering
Semantics
Data mining
Ciencias Informáticas
base de datos
Descripción: Adotamos o m etodo da indexação da semântica latente (LSI) para classifi car documentos que estejam relacionados por algum meio não restrito apenas aos termos presentes, mas buscando outras formas de similaridades. A redu cão de dimensionalidade da matriz Termo-Documento n~ao e novidade, sendo normalmente adotado entre 200 a 300 dimensões. Nesse trabalho, transformamos o LSI em um algoritmo semi-supervisionado e determinamos o n umero ideal de dimensão durante a fase de treinamento. O algoritmo utiliza um espa co isom etrico a aquele de nido pela matriz Termo-Documento para acelerar os c alculos.
Eje: Workshop Bases de datos y minería de datos (WBDDM)
Idioma: Portugués