Média vs Mediana vs Modo
Média, mediana e moda são as principais medidas de tendência central usadas na estatística descritiva. Eles são completamente diferentes uns dos outros e os casos em que são usados para resumir os dados também são diferentes.
Significar
A média aritmética é a soma dos valores dos dados dividida pelo número de valores dos dados, ou seja,
Se os dados forem de um espaço amostral, eles são chamados de média amostral (
), que é uma estatística descritiva da amostra. Embora seja a medida descritiva mais comumente usada para uma amostra, não é uma estatística robusta. É muito sensível a outliers e oscilações.
Por exemplo, considere a renda média dos cidadãos de uma determinada cidade. Como todos os valores dos dados são somados e depois divididos, a renda de uma pessoa extremamente rica afeta a média de forma significativa. Portanto, os valores médios nem sempre são uma boa representação dos dados.
Além disso, no caso de um sinal alternado, a corrente que passa por um elemento varia periodicamente da direção positiva para a direção negativa e vice-versa. Se tomarmos a corrente média que passa pelo elemento em um único período, obteremos um 0, o que significa que nenhuma corrente passou pelo elemento, o que obviamente não é verdade. Portanto, também neste caso, a média aritmética não é uma boa medida.
A média aritmética é um bom indicador quando os dados são distribuídos uniformemente. Para uma distribuição normal, a média é igual à moda e à mediana. Ele também tem os menores resíduos quando se considera a raiz do erro quadrático médio; portanto, a melhor medida descritiva quando é necessário representar um conjunto de dados por um único número.
Mediana
Os valores do ponto de dados do meio depois de organizar todos os valores de dados em ordem crescente são definidos como a mediana do conjunto de dados. A mediana é o 2º quartil, 5º decil e 50º percentil.
• Se o número de observações (pontos de dados) for ímpar, a mediana é a observação exatamente no meio da lista ordenada.
• Se o número de observações (pontos de dados) for par, a mediana é a média das duas observações do meio na lista ordenada.
A mediana divide a observação em dois grupos; ou seja, um grupo (50%) de valores superiores e um grupo (50%) de valores inferiores à mediana. As medianas são usadas especificamente em distribuições distorcidas e representam dados razoavelmente melhores do que a média aritmética.
Modo
Modo é o número que mais ocorre em um conjunto de observações. O modo de um conjunto de dados é calculado encontrando a frequência de cada elemento dentro do conjunto.
• Se nenhum valor ocorrer mais de uma vez, o conjunto de dados não tem modo.
• Caso contrário, qualquer valor que ocorra com a maior frequência é um modo do conjunto de dados.
Mais de 1 modo pode existir em um conjunto; portanto, o modo não é uma estatística única de um conjunto de dados. Em uma distribuição uniforme, existe um modo. O modo de uma distribuição de probabilidade discreta é o ponto onde a função de massa de probabilidade atinge seu ponto mais alto. Renderizando a partir das interpretações acima, podemos dizer que os máximos globais são modos.
Considere a aplicação de todas as três medidas ao seguinte conjunto de dados.
DADOS: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Média = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25 = 8,12
Mediana = 9 (13º elemento)
Modo = 9 (frequência de 9 = 5)
Qual é a diferença entre média, mediana e modo?
• A média aritmética é a soma dos valores (observações) dividida pelo número de observações. Não é uma estatística robusta e fortemente dependente da natureza da distribuição normal dentro da distribuição considerada. Um único outlier pode causar uma mudança significativa na média, dando valores relativamente enganosos. O conceito pode ser estendido para média geométrica, média harmônica, média ponderada e assim por diante.
• Mediana são os valores médios do conjunto de observações e é relativamente menos afetada por outliers. Pode fornecer uma boa estimativa como estatística resumida em casos altamente distorcidos.
• Modo são os valores de observação mais comuns no conjunto de dados. Se a distribuição for enviesada positiva, a moda fica da esquerda para a mediana e, se for negativa, a moda fica da direita para a mediana.
• Se for positivamente inclinado, a média está certa à mediana; se a média for inclinada negativamente, está à esquerda da mediana.
• Na distribuição normal, todos os três, média, moda e mediana são iguais.