segunda-feira, 30 de julho de 2012

Data Mining - Marcos


O que é Data Mining?
            A mineração de dados tem sido definida como "A extração não trivial de informação implícita, previamente desconhecida e potencialmente útil a partir de dados" [1] Ele usa a aprendizagem de máquina, estatística e técnicas de visualização para descoberta do conhecimento e do presente de uma forma que é facilmente compreensível para os seres humanos.
            É o processo de descobrir informações relevantes, como padrões, associações, mudanças, anomalias e estruturas, em grandes quantidades de dados armazenados em banco de dados, depósitos de dados ou outros repositórios de informação.
            Devido a disponibilidade de enormes quantias de dados em formas eletrônicas, e à necessidade iminente de extrair delas informações e conhecimentos úteis a diversas aplicações, por exemplo na análise de mercado, administração empresarial, apoio à decisão, etc, data mining foi popularmente tratado como sinônimo de descoberta de conhecimento em bases de dados, apesar de, na visão de alguns pesquisadores, data mining será considerado como um passo essencial da descoberta de conhecimento também conhecido como KDD (Knowledge Discovery in Databases).
           

            Pra você entender melhor é todo uma gama de dados vamos dizer escondida que você não consideraria como dado útil, gerada por sistemas de grandes empresas produzidas no dia-a-dia, que é extraido minuciosamente pelo data mining, fatos que não se repetem normalmente, gerando um resultado específicos ao usuário. Um exemplo que poderemos citar é o seguinte, se uma empresa recebe muitos pedidos de descontos num determinado dia, houve uma procura comum, e não uma regra sobre “pedir descontos em um dia especifico”. O que significa que não há uma associação entre pedido de desconto e dia específico como uma regra. O que importa para o Data Mining é que em um determinado dia houve um padrão de acontecimentos, e isso ele ira considerar. Outro exemplo que poderemos utilizar para ajudar a compreender é do Bank of America que usou essas técnicas para selecionar entre seus 36 milhões de clientes aqueles com menor risco de dar calote num empréstimo. A partir desses relatórios, enviou cartas oferecendo linhas de crédito para os correntistas cujos filhos tivessem entre 18 e 21 anos e, portanto, precisassem de dinheiro para ajudar os filhos a comprar o próprio carro, uma casa ou arcar com os gastos da faculdade. Resultado: em três anos, o banco lucrou 30 milhões de dólares. Acho que com esses exemplos dá pra você entender que o Data Mining ele procura esses dados escondidos dentro da base de dados que é muito útil para as grandes empresas.
            Alguns sistemas dependem da mineração como o data warehouse que organiza e armazena esses dados brutos; IA e sistemas especialistas.


 [1] W. Frawley e G. Piatetsky-Shapiro e C. Matheus, Knowledge Discovery in Databases: Uma Visão Geral. AI Magazine, Outono 1992, pgs 213-228.

2 comentários:

  1. Muitíssimo esclarecedor o seu post. Funcionou para mim como um data mining, pois garimpou dentro de todas as ferramentas apresentadas uma que realmente se diferencia das demais.

    ResponderExcluir