Significado de Data Mining

O que é Data Mining

Data Mining é uma expressão da língua inglesa.

O significado de Data Mining está associado com a área de informática, traduzindo-se como mineração de dados.

Significado de data mining

Significado de data mining

A mineração de dados (data mining) surgiu pela primeira vez em 1990 em grupos de bases de dados.

Data mining, também comumente chamado de agregador ou mesmo organizador de dados, é um processo que agrega e organiza dados, determinando padrões, associações, mudanças e anomalias que podem ser encontradas e que são relevantes. Em suma, data mining irá processar dados brutos e transformá-los em informações úteis.

O processo faz uma varredura de uma grande quantidade de dados, fazendo a procura por padrões e detectando relacionamentos entre as informações, o que pode gerar novos subgrupos de dados.

Vemos o uso de data mining em grandes bancos de dados. O seu uso resulta em regras, árvores de decisão, hipóteses e dendrogramas, por exemplo.

Para organizações, o data mining pode ter uma função vital na potencialização da inovação e lucratividade, pois suas técnicas de informática, inteligência artificial e reconhecimento de padrões, entre outros, oferecem conhecimento benéfico para as empresas e também para os indivíduos.

O data mining possui algumas fases básicas: a exploração, construção de modelo, definição de padrão e validação e verificação. Para que o processo seja bem executado e eficaz, o data mining depende de uma coleta eficaz de dados e armazenagem, assim como do processamento do computador.

Por isso, o data mining precisa cumprir certas tarefas para ser bem executado. Alguns exemplos são a detecção de anomalias, sumarização, aprendizagem da regra de associação (chamado de modelo de dependência), agrupamento (do inglês clustering), classificação e regressão.

Diversas empresas e até mesmo softwares se dedicam ao data mining, especialmente pela notável e crescente importância da mineração de dados para identificar padrões em bancos de dados.

É claro que identificar padrões não é um trabalho exclusivo da área da informática: nosso próprio cérebro age de maneira semelhante para determinar padrões e alcançar conhecimento. Áreas como bioinformática, educação, engenharia elétrica, genética e medicina também estão utilizam o processo de mineração de dados.

Muitos indivíduos acusam que a mineração de dados levanta questões sobre a privacidade e ética, já que seu conceito, em vários casos, se associa com a extração de informação concernente ao comportamento de pessoas. Contudo, muitas pessoas afirmam que o data mining é implica questões éticas, por ser neutro.

O armazenamento de dados é também outro conceito relativamente novo, assim como o data mining. Este se define como um processo de gestão centralizada de dados e recuperação, ou seja, mantém-se um repositório central com os dados organizacionais, onde são centralizados para facilitar o acesso para usuários e para realizar análises.

Os softwares de análise de dados dão suporte para o data mining. Este é um avanço excepcional na captura de dados, transmissão e capacidade de armazenamento, assim como no poder de processamento existentes nas organizações!

Exemplos reais de Data Mining

Pode-se destacar vários exemplos reais de data mining:

  • Em uma empresa da área de telecomunicações, as técnicas de mineração de dados foram utilizadas para classificar os clientes (empresas) conforme o potencial de compra de serviços.

O processo foi iniciado com uma seleção de alguns clientes a partir da base de dados. Estes clientes preencheram formulários e com as informações obtidas os dados foram enriquecidos. Após, o agrupamento de clientes foi realizado para identificar similaridades para que, posteriormente, as classes de clientes fossem definidas.

Desse ponto, um modelo de classificação foi desenvolvimento através da amostra de clientes. Com esse modelo foi possível caracterizar o potencial de compras por meio da base de dados completa de clientes. Essa ação de data mining foi uma estratégia para compor estratégias de marketing específicas.

  • Na área de energia, as técnicas de data mining foram utilizadas para gerar modelos que realizem a previsão de demanda de consumo de energia elétrica, separado por regiões, especialmente para épocas em que há pouca precipitação de chuva.

Registros de consumo de longos períodos anteriores foram utilizados para facilitar o processo.

  • Na área de comércio, as técnicas de data mining podem ser úteis para cruzar dados sobre determinados hábitos de compras de clientes. Um exemplo fácil é quando um cliente compra um produto A, mas também compra um produto B.

O cruzamento de dados para determinar se produtos são comprados em conjunto pode facilitar uma mudança de posicionamento desses mesmos produtos, colocando-os próximos um do outro, para incentivar ainda mais a compra do cliente.