Biblioteca Digital - UNIMEP

Visualização do documento

Título

MINERAÇÃO DE REGRAS DE ASSOCIAÇÃO MULTI-RELACIONAL QUANTITATIVAS

Orientador

MARINA TERESA PIRES VIEIRA

Autor

EDERSON GARCIA

Palavra chave

MINERAÇÃO DE DADOS, MINERAÇÃO DE DADOS MULTI-RELACIONAL, MINERAÇÃO DE DADOS

Grupo CNPQ


Programa

MS - CIÊNCIA DA COMPUTAÇÃO

Área

CIÊNCIAS EXATAS E DA

Data da defesa

22/02/2008

Nº Downloads

1234

Resumo

A mineração de dados é parte do processo de descoberta de conhecimento em bases de dados e tem como objetivo encontrar padrões relevantes em um conjunto de dados. As primeiras pesquisas sobre mineração de dados tratavam dados categóricos. Posteriormente as pesquisas também passaram a se concentrar em técnicas de mineração de dados que tratam dados quantitativos. Entre as abordagens atuais em mineração de dados encontram-se aquelas que processam mais de uma tabela separadamente, para a descoberta de padrões sobre os dados das várias tabelas conjuntamente. Esses trabalhos concentram-se em dados categóricos. Com o intuito de dar uma contribuição à comunidade científica, este trabalho apresenta uma abordagem para a mineração de dados envolvendo múltiplas tabelas. Como resultado apresenta os algoritmos ConnectionBlock e ConnectionBlockQ. O ConnectionBlock baseia-se em uma técnica existente para a geração de regras de associação em bases de dados multi-relacional, considerando dados categóricos, com uma abordagem nova a respeito da contagem de suporte e confiança. O ConnectionBlockQ gera regras de associação quantitativas em bases de dados multi-relacional usando a abordagem do ConnectionBlock.

Abstract

Data mining is part of the process of knowledge discovery in databases and its purpose is to find relevant patterns in a data set. The earliest research into data mining dealt with categorical data. Later on, research efforts also began to concentrate on data mining techniques for treating quantitative data. Among the current approaches to data mining are those that process more than one table separately to discover patterns in the data of the various tables jointly. These efforts are concentrated on categorical data. Aiming to contribute to the body of knowledge on the subject, this work proposes a data mining approach involving multiple tables. To this end, two algorithms are presented here, called ConnectionBlock and ConnectionBlockQ. The former algorithm, ConnectionBlock, is based on an existing technique for generating association rules in multi-relational databases considering categorical data, using a new approach with respect to counting of support and confidence. The ConnectionBlockQ algorithm generates quantitative association rules in multi-relational databases using the ConnectionBlock approach.