Conteúdo principal
Matemática EM: Estatística
Curso: Matemática EM: Estatística > Unidade 5
Lição 1: Amplitude total, variância e desvio-padrãoCálculo passo a passo do desvio-padrão
Introdução
Neste artigo, vamos aprender a calcular o desvio-padrão "manualmente".
É interessante notar que no mundo real um estatístico nunca calcularia o desvio-padrão manualmente. Os cálculos envolvidos são um pouco complexos, e o risco de cometer um erro é grande. Além disso, calcular à mão é lento. Muito lento. É por isso que os estatísticos usam planilhas e programas de computador para fazer os cálculos.
Então, qual é o objetivo deste artigo? Por que estamos perdendo tempo aprendendo um processo que os estatísticos não usam de verdade? A resposta é que aprender a fazer os cálculos manualmente nos ajuda a compreender como o desvio-padrão realmente funciona. É importante entender isso. Em vez de ver o desvio-padrão como um número mágico que nossa planilha ou nosso programa de computador nos dá, poderemos explicar de onde esse número veio.
Visão geral do cálculo do desvio-padrão
A fórmula para o desvio-padrão (DP) é
em que sum significa "somatório", x é um valor do conjunto de dados, mu é a média do conjunto de dados e N é o número de dados na população.
A fórmula do desvio-padrão pode parecer confusa, mas ela vai fazer sentido depois de a desmembrarmos. Nas próximas seções, vamos apresentar passo a passo um exemplo interativo. Segue uma breve amostra dos passos que vamos seguir:
Etapa 1: calcular a média.
Etapa 2: calcular o quadrado da distância entre cada ponto e a média.
Etapa 3: somar os valores da Etapa 2.
Etapa 4: dividir pelo número de pontos.
Etapa 5: calcular a raiz quadrada.
Observação importante
A fórmula acima serve para calcular o desvio padrão de uma população. Se nós estivermos lidando com uma amostra, nós usaremos uma fórmula ligeiramente diferente (abaixo), que usa n, minus, 1 ao invés de N. Neste ponto do artigo, no entanto, você deve se familiarizar com o processo de cálculo do desvio padrão, que é basicamente o mesmo, não importando qual fórmula você irá usar.
Exemplo interativo passo a passo do cálculo do desvio-padrão
Primeiro, precisamos de um conjunto de dados com o qual trabalhar. Vamos escolher algo pequeno para que não sejamos sobrecarregados pelo número de pontos. Confira um bom:
Etapa 1: calcular start color #e07d10, mu, end color #e07d10 em square root of, start fraction, sum, start subscript, end subscript, start superscript, end superscript, open vertical bar, x, minus, start color #e07d10, mu, end color #e07d10, close vertical bar, squared, divided by, N, end fraction, end square root
Nessa etapa, calculamos a média do conjunto de dados, que é representada pela variável mu.
Etapa 2: calcular start color #e07d10, open vertical bar, x, minus, mu, close vertical bar, squared, end color #e07d10 em square root of, start fraction, sum, start subscript, end subscript, start superscript, end superscript, start color #e07d10, open vertical bar, x, minus, mu, close vertical bar, squared, end color #e07d10, divided by, N, end fraction, end square root
Nessa etapa, calculamos a distância entre cada dado e a média (ou seja, os desvios), e o quadrado de cada uma dessas distâncias.
Por exemplo, o primeiro dado é 6, e a média é 3, então a distância entre eles é de 3. O quadrado dessa distância é 9.
Etapa 3: calcular start color #e07d10, sum, open vertical bar, x, minus, mu, close vertical bar, squared, end color #e07d10 em square root of, start fraction, start color #e07d10, sum, start subscript, end subscript, start superscript, end superscript, open vertical bar, x, minus, mu, close vertical bar, squared, end color #e07d10, divided by, N, end fraction, end square root
O símbolo sum significa "somatório", então nessa etapa vamos somar os quatro valores que encontramos na Etapa 2.
Etapa 4: calcular start color #e07d10, start fraction, sum, open vertical bar, x, minus, mu, close vertical bar, squared, divided by, N, end fraction, end color #e07d10 em square root of, start color #e07d10, start fraction, sum, start subscript, end subscript, start superscript, end superscript, open vertical bar, x, minus, mu, close vertical bar, squared, divided by, N, end fraction, end color #e07d10, end square root
Nessa etapa, dividimos o resultado obtido na etapa 3 pela variável N, que é o número de dados.
Etapa 5: calcular o desvio-padrão square root of, start fraction, sum, start subscript, end subscript, start superscript, end superscript, open vertical bar, x, minus, mu, close vertical bar, squared, divided by, N, end fraction, end square root
Nós quase acabamos! Agora, é só calcular a raiz quadrada da resposta da Etapa 4 e terminamos.
Isso! Conseguimos! Calculamos com sucesso o desvio-padrão de um conjunto pequeno de dados.
Resumo do que fizemos
Dividimos a fórmula em cinco etapas:
Etapa 1: calcule a média mu.
Etapa 2: calcule o quadrado da distância de cada dado até a média open vertical bar, x, minus, mu, close vertical bar, squared.
x | open vertical bar, x, minus, mu, close vertical bar, squared | |
---|---|---|
6 | open vertical bar, 6, minus, start color #11accd, 3, end color #11accd, close vertical bar, squared, equals, 3, squared, equals, 9 | |
2 | open vertical bar, 2, minus, start color #11accd, 3, end color #11accd, close vertical bar, squared, equals, 1, squared, equals, 1 | |
3 | open vertical bar, 3, minus, start color #11accd, 3, end color #11accd, close vertical bar, squared, equals, 0, squared, equals, 0 | |
1 | open vertical bar, 1, minus, start color #11accd, 3, end color #11accd, close vertical bar, squared, equals, 2, squared, equals, 4 |
Steps 3, 4, and 5:
Tente você mesmo
Aqui está um lembrete da fórmula:
Quer participar da conversa?
- Se há desvio padrão, então significa que há outros tipos de desvio que não o padrão? Quais seriam? Qual a diferença?(9 votos)
- Lucas, deve haver outros sim, só conheço os básicos: desvio padrão e desvio absoluto médio, ambos explicados aqui no conteúdo de ensino médio. Bom, deve haver o que você coloca a distância ao cubo, faz a média e depois tira a raiz cúbica etc :)(7 votos)
- Porque no excel quando usado o comando DESVPAD o resultado é diferente do cálculo manual?(4 votos)
- Talvez você tenha usado a função que calcula o DP da amostra em que o denominador é n-1 em vez de n. Existem as duas funções no excel, DESVPAD.P e DESVPAD.A, que significa desvio padrão de uma população e de uma amostra, respectivamente.(8 votos)
- Qual motivo para representar a equação do desvio padrão com a notação de módulo no conjunto |X-Xm|^2? A notação correta não é utilizando parênteses?(3 votos)
- Mário, matematicamente não há diferença alguma entre usar parênteses e usar módulo. Veja que foi dito: Etapa 2: calcular o quadrado da distância entre cada ponto e a média.
Se é distância, então tem que ser módulo e não parênteses. Esse seria o único motivo, penso eu.(5 votos)
- Podemos ter no final do calculo números inteiros?(3 votos)
- Sim, O resultado do desvio padrão poderá ser inteiro. Por exemplo, se na 4ª etapa o resultado fosse 4 o desvio padrão seria 2, ou seja, como a raiz quadrada de 4 é 2, teríamos um resultado com um número inteiro.(2 votos)
- a formula de desvio padrão não deveria ter o n-1 em vez de só n ?(1 voto)
- É pq no exercício se trata de um valor populacional, e não amostral, por isso da divisão por N e não n-1(5 votos)
- a formula nao teria q ser n-1? tentei encaixar essa formula e o resultado nao bateu(1 voto)
- É pq no exercício se trata de um valor populacional, e não amostral, por isso da divisão por N e não n-1(3 votos)