Diferença principal - Aprendizado de máquina supervisionado x não supervisionado
Aprendizagem supervisionada e aprendizagem não supervisionada são dois conceitos centrais do aprendizado de máquina. Aprendizado supervisionado é uma tarefa de aprendizado de máquina de aprendizagem de uma função que mapeia uma entrada para uma saída com base nos pares de entrada-saída de exemplo. Aprendizado não supervisionado é a tarefa de aprendizado de máquina de inferir uma função para descrever a estrutura oculta de dados não rotulados. A principal diferença entre aprendizado de máquina supervisionado e não supervisionado é que o aprendizado supervisionado usa dados rotulados, enquanto o aprendizado não supervisionado usa dados não rotulados.
O aprendizado de máquina é um campo da ciência da computação que permite que um sistema de computador aprenda com os dados sem ser explicitamente programado. Permite analisar os dados e prever padrões nos mesmos. Existem muitas aplicações de aprendizado de máquina. Alguns deles são o reconhecimento facial, reconhecimento de gestos e reconhecimento de fala. Existem vários algoritmos relacionados ao aprendizado de máquina. Alguns deles são regressão, classificação e agrupamento. As linguagens de programação mais comuns para o desenvolvimento de aplicativos baseados em aprendizado de máquina são R e Python. Outras linguagens como Java, C ++ e Matlab também podem ser usadas.
CONTEÚDO
1. Visão geral e principais diferenças
2. O que é aprendizado supervisionado
3. O que é aprendizado não supervisionado
4. Semelhanças entre aprendizado de máquina supervisionado e não supervisionado
5. Comparação lado a lado - aprendizado de máquina supervisionado versus não supervisionado na forma tabular
6. Resumo
O que é aprendizagem supervisionada?
Em sistemas baseados em aprendizado de máquina, o modelo funciona de acordo com um algoritmo. Na aprendizagem supervisionada, o modelo é supervisionado. Primeiro, é necessário treinar o modelo. Com o conhecimento adquirido, pode prever respostas para as instâncias futuras. O modelo é treinado usando um conjunto de dados rotulado. Quando um dado fora da amostra é fornecido ao sistema, ele pode prever o resultado. A seguir está um pequeno trecho do popular conjunto de dados IRIS.
De acordo com a tabela acima, comprimento da sépala, largura da sépala, comprimento da patela, largura da patela e espécies são chamados de atributos. As colunas são conhecidas como recursos. Uma linha contém dados para todos os atributos. Portanto, uma linha é chamada de observação. Os dados podem ser numéricos ou categóricos. O modelo recebe as observações com o nome da espécie correspondente como entrada. Quando uma nova observação é dada, o modelo deve prever o tipo de espécie a que pertence.
Na aprendizagem supervisionada, existem algoritmos de classificação e regressão. Classificação é o processo de classificação dos dados rotulados. O modelo criou limites que separaram as categorias de dados. Quando novos dados são fornecidos ao modelo, ele pode categorizar com base na localização do ponto. O K-Nearest Neighbours (KNN) é um modelo de classificação. Dependendo do valor k, a categoria é decidida. Por exemplo, quando k é 5, se um determinado ponto de dados estiver próximo a oito pontos de dados na categoria A e seis pontos de dados na categoria B, então o ponto de dados será classificado como A.
A regressão é o processo de prever a tendência dos dados anteriores para prever o resultado dos novos dados. Na regressão, a saída pode consistir em uma ou mais variáveis contínuas. A previsão é feita usando uma linha que cobre a maioria dos pontos de dados. O modelo de regressão mais simples é uma regressão linear. É rápido e não requer parâmetros de ajuste como no KNN. Se os dados mostrarem uma tendência parabólica, o modelo de regressão linear não é adequado.
Esses são alguns exemplos de algoritmos de aprendizagem supervisionada. Geralmente, os resultados gerados a partir de métodos de aprendizado supervisionado são mais precisos e confiáveis porque os dados de entrada são bem conhecidos e rotulados. Portanto, a máquina deve analisar apenas os padrões ocultos.
O que é aprendizagem não supervisionada?
Na aprendizagem não supervisionada, o modelo não é supervisionado. O modelo funciona por conta própria, para prever os resultados. Ele usa algoritmos de aprendizado de máquina para chegar a conclusões sobre dados não rotulados. Geralmente, os algoritmos de aprendizado não supervisionado são mais difíceis do que algoritmos de aprendizado supervisionado porque há poucas informações. Clustering é um tipo de aprendizagem não supervisionada. Ele pode ser usado para agrupar os dados desconhecidos usando algoritmos. O agrupamento com base em densidade e a média k são dois algoritmos de agrupamento.
O algoritmo k-mean, coloca o centróide k aleatoriamente para cada cluster. Em seguida, cada ponto de dados é atribuído ao centróide mais próximo. A distância euclidiana é usada para calcular a distância do ponto de dados ao centróide. Os pontos de dados são classificados em grupos. As posições para k centróides são calculadas novamente. A nova posição do centróide é determinada pela média de todos os pontos do grupo. Novamente, cada ponto de dados é atribuído ao centróide mais próximo. Esse processo se repete até que os centróides não mudem mais. k-mean é um algoritmo de agrupamento rápido, mas não há inicialização especificada de pontos de agrupamento. Além disso, há uma grande variação de modelos de clustering com base na inicialização de pontos de cluster.
Outro algoritmo de agrupamento é o agrupamento baseado em densidade. É também conhecido como Aplicativos de Clustering Espacial Baseado em Densidade com ruído. Ele funciona definindo um cluster como o conjunto máximo de pontos conectados de densidade. Eles são dois parâmetros usados para agrupamento baseado em densidade. Eles são Ɛ (épsilon) e pontos mínimos. O Ɛ é o raio máximo da vizinhança. Os pontos mínimos são o número mínimo de pontos na vizinhança Ɛ para definir um cluster. Esses são alguns exemplos de agrupamento que resultam em aprendizagem não supervisionada.
Geralmente, os resultados gerados a partir de algoritmos de aprendizagem não supervisionados não são muito precisos e confiáveis porque a máquina tem que definir e rotular os dados de entrada antes de determinar os padrões e funções ocultos.
Qual é a similaridade entre aprendizado de máquina supervisionado e não supervisionado?
Tanto o aprendizado supervisionado quanto o não supervisionado são tipos de aprendizado de máquina
Qual é a diferença entre aprendizado de máquina supervisionado e não supervisionado?
Artigo Diff meio antes da tabela
Aprendizado de máquina supervisionado x não supervisionado |
|
Aprendizado supervisionado é a tarefa de aprendizado de máquina de aprender uma função que mapeia uma entrada para uma saída com base em pares de entrada-saída de exemplo. | Aprendizado não supervisionado é a tarefa de aprendizado de máquina de inferir uma função para descrever a estrutura oculta de dados não rotulados. |
Funcionalidade Principal | |
Na aprendizagem supervisionada, o modelo prevê o resultado com base nos dados de entrada rotulados. | Na aprendizagem não supervisionada, o modelo prevê o resultado sem dados rotulados, identificando os padrões por conta própria. |
Precisão dos resultados | |
Os resultados gerados a partir de métodos de aprendizagem supervisionada são mais precisos e confiáveis. | Os resultados gerados a partir de métodos de aprendizagem não supervisionados não são muito precisos e confiáveis. |
Algoritmos Principais | |
Existem algoritmos de regressão e classificação na aprendizagem supervisionada. | Existem algoritmos para agrupamento na aprendizagem não supervisionada. |
Resumo - Aprendizado de máquina supervisionado x não supervisionado
Aprendizado supervisionado e Aprendizado não supervisionado são dois tipos de aprendizado de máquina. Aprendizado supervisionado é a tarefa de aprendizado de máquina de aprender uma função que mapeia uma entrada para uma saída com base em pares de entrada-saída de exemplo. Aprendizado não supervisionado é a tarefa de aprendizado de máquina de inferir uma função para descrever a estrutura oculta de dados não rotulados. A diferença entre o aprendizado de máquina supervisionado e o não supervisionado é que o aprendizado supervisionado usa dados rotulados, enquanto a aprendizagem não supervisionada usa dados não rotulados.