Data Mining vs OLAP
A mineração de dados e o OLAP são duas das tecnologias comuns de Business Intelligence (BI). Inteligência de negócios refere-se a métodos baseados em computador para identificar e extrair informações úteis de dados de negócios. Data mining é o campo da ciência da computação que lida com a extração de padrões interessantes de grandes conjuntos de dados. Ele combina muitos métodos de inteligência artificial, estatísticas e gerenciamento de banco de dados. OLAP (processamento analítico online) como o nome sugere é uma compilação de maneiras de consultar bancos de dados multidimensionais.
A mineração de dados também é conhecida como Knowledge Discovery in data (KDD). Como mencionado acima, é um campo da ciência da computação, que trata da extração de informações antes desconhecidas e interessantes de dados brutos. Devido ao crescimento exponencial dos dados, especialmente em áreas como negócios, a mineração de dados se tornou uma ferramenta muito importante para converter essa grande riqueza de dados em inteligência de negócios, pois a extração manual de padrões tornou-se aparentemente impossível nas últimas décadas. Por exemplo, atualmente é usado para várias aplicações, como análise de redes sociais, detecção de fraude e marketing. A mineração de dados geralmente lida com as seguintes quatro tarefas: agrupamento, classificação, regressão e associação. Clustering é a identificação de grupos semelhantes de dados não estruturados. Classificação são regras de aprendizagem que podem ser aplicadas a novos dados e normalmente incluem as seguintes etapas: pré-processamento de dados, modelagem de projeto, seleção de aprendizagem / recurso e avaliação / validação. A regressão é encontrar funções com erro mínimo para modelar dados. E a associação procura relacionamentos entre variáveis. A mineração de dados costuma ser usada para responder a perguntas como quais são os principais produtos que podem ajudar a obter altos lucros no próximo ano no Wal-Mart. A mineração de dados geralmente é usada para responder a perguntas como quais são os principais produtos que podem ajudar a obter altos lucros no próximo ano no Wal-Mart. A mineração de dados costuma ser usada para responder a perguntas como quais são os principais produtos que podem ajudar a obter altos lucros no próximo ano no Wal-Mart.
OLAP é uma classe de sistemas que fornece respostas a consultas multidimensionais. Normalmente, o OLAP é usado para marketing, orçamento, previsão e aplicativos semelhantes. Nem é preciso dizer que os bancos de dados usados para OLAP são configurados para consultas complexas e ad-hoc com um desempenho rápido em mente. Normalmente, uma matriz é usada para exibir a saída de um OLAP. As linhas e colunas são formadas pelas dimensões da consulta. Eles costumam usar métodos de agregação em várias tabelas para obter resumos. Por exemplo, pode ser usado para saber mais sobre as vendas deste ano no Wal-Mart em comparação com o ano passado? Qual a previsão de vendas para o próximo trimestre? O que pode ser dito sobre a tendência, olhando para a variação percentual?
Embora seja óbvio que Data Mining e OLAP sejam semelhantes porque operam em dados para obter inteligência, a principal diferença vem de como eles operam em dados. As ferramentas OLAP fornecem análises de dados multidimensionais e resumos dos dados, mas, diferentemente, a mineração de dados se concentra em proporções, padrões e influências no conjunto de dados. Esse é um OLAP lidar com agregação, que se resume à operação de dados via “adição”, mas a mineração de dados corresponde a “divisão”. Outra diferença notável é que enquanto as ferramentas de data mining modelam dados e retornam regras acionáveis, o OLAP conduzirá técnicas de comparação e contraste ao longo da dimensão do negócio em tempo real.