O que é
Data Mining?
A mineração de dados tem
sido definida como "A extração não trivial de informação implícita,
previamente desconhecida e potencialmente útil a partir de dados" [1] Ele
usa a aprendizagem de máquina, estatística e técnicas de visualização para
descoberta do conhecimento e do presente de uma forma que é facilmente
compreensível para os seres humanos.
É
o processo de descobrir
informações relevantes, como padrões, associações, mudanças, anomalias e
estruturas, em grandes quantidades de dados armazenados em banco de dados,
depósitos de dados ou outros repositórios de informação.
Devido a disponibilidade de enormes
quantias de dados em formas eletrônicas, e à necessidade iminente de extrair
delas informações e conhecimentos úteis a diversas aplicações, por exemplo na
análise de mercado, administração empresarial, apoio à decisão, etc, data
mining foi popularmente tratado como sinônimo de descoberta de
conhecimento em bases de dados, apesar de, na visão de alguns
pesquisadores, data mining será considerado como um passo
essencial da descoberta de conhecimento também conhecido como KDD (Knowledge
Discovery in Databases).
Pra você entender melhor é todo uma
gama de dados vamos dizer escondida que você não consideraria como dado útil,
gerada por sistemas de grandes empresas produzidas no dia-a-dia, que é extraido
minuciosamente pelo data mining, fatos que não se repetem normalmente, gerando
um resultado específicos ao usuário. Um exemplo que poderemos citar é o
seguinte, se uma empresa recebe muitos pedidos de descontos num determinado
dia, houve uma procura comum, e não uma regra sobre “pedir descontos em um dia
especifico”. O que significa que não há uma associação entre pedido de desconto
e dia específico como uma regra. O que importa para o Data Mining é que em um
determinado dia houve um padrão de acontecimentos, e isso ele ira considerar. Outro
exemplo que poderemos utilizar para ajudar a compreender é do Bank of America que
usou essas técnicas para selecionar entre seus 36 milhões
de clientes aqueles com menor risco de dar calote num empréstimo. A partir
desses relatórios, enviou cartas oferecendo linhas de crédito para os
correntistas cujos filhos tivessem entre 18 e 21 anos e, portanto, precisassem
de dinheiro para ajudar os filhos a comprar o próprio carro, uma casa ou arcar
com os gastos da faculdade. Resultado: em três anos, o banco lucrou 30 milhões
de dólares. Acho que com esses exemplos dá pra você entender que o Data Mining
ele procura esses dados escondidos dentro da base de dados que é muito útil
para as grandes empresas.
Alguns sistemas dependem da mineração como o data
warehouse que organiza e armazena esses dados brutos; IA e sistemas
especialistas.
[1] W.
Frawley e G. Piatetsky-Shapiro e C. Matheus, Knowledge Discovery in Databases:
Uma Visão Geral. AI Magazine,
Outono 1992, pgs 213-228.

Muitíssimo esclarecedor o seu post. Funcionou para mim como um data mining, pois garimpou dentro de todas as ferramentas apresentadas uma que realmente se diferencia das demais.
ResponderExcluirMuito bom!
ResponderExcluir