Regressão Linear vs Logística
Na análise estatística, é importante identificar as relações entre as variáveis concernentes ao estudo. Às vezes, pode ser o único propósito da própria análise. Uma ferramenta forte utilizada para estabelecer a existência de relacionamento e identificar a relação é a análise de regressão.
A forma mais simples de análise de regressão é a regressão linear, onde a relação entre as variáveis é linear. Em termos estatísticos, revela a relação entre a variável explicativa e a variável resposta. Por exemplo, usando regressão, podemos estabelecer a relação entre o preço da mercadoria e o consumo com base em dados coletados de uma amostra aleatória. A análise de regressão produzirá uma função de regressão do conjunto de dados, que é um modelo matemático que melhor se ajusta aos dados disponíveis. Isso pode ser facilmente representado por um gráfico de dispersão. Graficamente, a regressão é equivalente a encontrar a melhor curva de ajuste para o conjunto de dados fornecido. A função da curva é a função de regressão. Usando o modelo matemático, o uso de uma mercadoria pode ser previsto para um determinado preço.
Portanto, a análise de regressão é amplamente usada em previsões e previsões. Ele também é usado para estabelecer as relações em dados experimentais, nos campos da física, química e em muitas ciências naturais e disciplinas de engenharia. Se a relação ou a função de regressão for uma função linear, o processo é conhecido como regressão linear. No gráfico de dispersão, ele pode ser representado como uma linha reta. Se a função não for uma combinação linear dos parâmetros, a regressão é não linear.
A regressão logística é comparável à regressão multivariada e cria um modelo para explicar o impacto de vários preditores em uma variável de resposta. No entanto, na regressão logística, a variável de resultado final deve ser categórica (geralmente dividida; isto é, um par de resultados alcançáveis, como morte ou sobrevivência, embora técnicas especiais permitam modelar informações mais categorizadas). Uma variável de resultado contínua pode ser transformada em uma variável categórica, a ser usada para regressão logística; no entanto, reduzir as variáveis contínuas dessa maneira é desencorajado principalmente porque reduz a precisão.
Ao contrário da regressão linear, em direção à média, as variáveis preditoras na regressão logística não precisam ser obrigadas a ser linearmente conectadas, comumente distribuídas ou ter variância igual dentro de cada cluster. Como resultado, a relação entre o preditor e as variáveis de resultado provavelmente não será uma função linear.
Qual é a diferença entre regressão logística e linear?
• Na regressão linear, uma relação linear entre a variável explicativa e a variável resposta é assumida e os parâmetros que satisfazem o modelo são encontrados por análise, para dar a relação exata.
• A regressão linear é realizada para variáveis quantitativas, e a função resultante é quantitativa.
• Na regressão logística, os dados usados podem ser categóricos ou quantitativos, mas o resultado é sempre categórico.