Metabuscador

Inicio Atrás
Título:	Uma metodologia para classificação de dados nominais baseada no processo KDD
Autores:	Souza, Rodrigo Clemente Thom de
Fecha:	2013-08-30 2013-08-30 2013-08-30
Publicador:	Universidade Federal do Parana
Fuente:
Tipo:	Tese
Tema:	Teses
Descripción:	Resumo: A classificação de padrões é um problema de aprendizado supervisionado do campo da ciência conhecido como Reconhecimento de Padrões (RP), através do qual se deseja discriminar instâncias de dados em diferentes classes. A solução para este problema é obtida por meio de algoritmos (classificadores) que buscam por padrões de relacionamento entre classes em casos conhecidos (treinamento), usando tais relações para classificar casos desconhecidos (teste). O desempenho em termos de acurácia preditiva dos algoritmos que se propõem a realizar tal tarefa depende muito da qualidade e dos tipos de dados contidos nas bases. Visando melhorar a qualidade dos dados e dar tratamento adequado aos tipos de dados utilizados, o presente trabalho faz uso do processo de Descoberta de Conhecimento em Bases de Dados (Knowledge Discovery in Databases; KDD), no qual a classificação é uma das tarefas da etapa conhecida como Mineração de Dados (Data Mining; DM). As etapas aqui aplicadas antes da classificação são a seleção de atributos wrapper e um processo de transformação de atributos baseado em Análise Geométrica de Dados (Geometric Data Analysis; GDA). Para a seleção de atributos é proposta uma nova técnica baseada em Algoritmo de Estimação de Distribuição (Estimation of Distribution Algorithm; EDA) e em Algoritmos Culturais (AC) batizada de Belief-Based Incremental Learning (BBIL). Para a transformação de atributos é aqui proposta a utilização de uma alternativa à clássica Análise de Componentes Principais (Principal Component Analysis; PCA) para lidar especificamente com dados nominais: a Análise de Correspondência Múltipla (Multiple Correspondence Analysis; MCA). Na etapa de DM, de fato, faz-se a aplicação de dois tradicionais classificadores da área de RP, Naïve Bayes e Função Discriminante Linear de Fisher (Linear Discriminant Analysis; LDA). Apoiado em argumentos teóricos e em testes empíricos realizados com nove diferentes conjuntos de dados nominais, o presente trabalho objetiva avaliar a capacidade do MCA e do BBIL em melhorar o desempenho de classificadores em termos de acurácia preditiva média. Com o objetivo de se beneficiar simultaneamente das vantagens de ambos os tratamentos de dados são avaliadas duas combinações entre estas técnicas. A primeira trata-se da transformação GDA sobre os atributos previamente selecionados e, a segunda, a seleção de factor scores do MCA utilizando o BBIL (metodologia proposta). Os resultados dos experimentos confirmam a melhoria no desempenho de classificação proporcionada pelos tratamentos realizados e atestam a superioridade da metodologia proposta na maioria das situações analisadas.
Idioma:	Portugués

1 Coordenação do Chute do Futebol Sob Condições de Fadiga em Sujeitos Novatos e Experientes / por Andrade, Sergio Luiz Ferreira	6 Mapeamento de Atributos Complexos e Multivalorados na Extração de Esquemas Utilizando XML por Pinto, Jose S. P.
2 Introdução à Geometria Computacional por Guedes, Andre Luiz Pires	7 Provedores de Dados de Baixo Custo: Publicação Digital ao Alcance de Todos por Garcia, Patricia A. B.
3 Algoritmo para Planificação Baseada em STRIPS por Silva, Fabiano	8 Uso de XML para Interoperabilidade entre Bases Heterogêneas por Pasqual, Juliana P.
4 Análise da Qualidade no Setor de Serviços Segundo o Método de Avaliação Servqual por Cardoso, Flavia Aparecida Reitz	9 Avaliacao de investimento em reflorestamento de Pinus sob condicoes de incerteza / por Goncalves, Mozart
5 Causalidade e Dependência em Raciocínio Sobre Ações por Varzinczak, Ivan J.	10 Análise de Antenas de Microfita Através do Método FDTD Utilizando Malha Tetraedrica / por Naegele, Marcelo