If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal
Tempo atual:0:00Duração total:9:33

Transcrição de vídeo

vamos supor que você é um fazendeiro e cultiva a melancias e você precisa e quer analisar como estão as quantidades de sementes nas suas melancias naturalmente você não pode abrir uma por uma das suas melancias e ficar contando as sementes que estão há uma ideia é você tomar algumas mudanças como a mostra e fazer um corte por exemplo no formato cúbico de um centímetro cúbico e verificar quantas sementes estão lá ea partir daí fazer uma análise e claro a estatística vai entrar para ajudar analisando a amostra esperamos chegar a boas estimativas para os parâmetros populacionais vamos supor que você tomou então algumas melancias neste caso 8 cortou um cubo de um centímetro cúbico por exemplo de cada uma contou quantas sementes havia lá então você encontrou melancia em uma melancia um pedaço com 4 sementes em outra com 3 em outra com cinco numa outra você encontrou sete sementes duas em outra 9 em outra 11 em outra 7 em outra estes valores compõem a mostra que nós temos para visualmente analisar um pouquinho vamos supor que aqui eu tenho toda a população da minha fazenda bem grande e nós tomamos nesse caso uma pequena amostra vamos supor por exemplo que a população toda tenha um milhão de melancias seria o n maiúsculo 1 milhão de m lances no caso então da nossa amostra nós tomamos apenas oito melancias é o n minúsculo que representa a quantidade de elementos da mostra neste caso 8 agora então vamos pensar sobre o que é a estatística pode medir vamos começar pela média aritmética é uma medida de tendência central no caso da mostra a média indicada por x barra ea média aritmética dos valores encontrados na mostra ou seja 4 mais três mais cinco mais sete mais dois mais nove mais 11 e mais sete divididos pelo número de elementos que oito temos aqui quatro mais 37 com 5 12 com 7 19 com 2 21 30 41 48 48 / 8 nos dá uma média 6 ou seja média de 6 sementes em cada pedacinho de um centímetro cúbico na amostra esta então pode ser uma estimativa para a média populacional vamos agora analisar um pouco a dispersão desses elementos em relação à média e para isso vamos usar a variância amostral indicada por s quadrado espero que neste momento você já esteja convencido de por que dividir por ele - 1 e aqui neste caso então nós temos que tomar cada elemento subtrair dele a média primeiro elemento é 4 vamos subtrair a média é 6 e levar ao quadrado mais o próximo e 3 - a média é 6 claro média amostral elevada ao quadrado mas 5 - 6 e leva o quadrado mais 7 -6 eleva o quadrado mais dois - 6 e leva o quadrado mas 9 -6 eleva quadrado mais 11 -6 que leva ao quadrado mais o último lá 7 -6 leva quadrato tudo isso dividido não por oito mas por ele - 18 - um unidade a menos que o número total de elementos estamos falando de uma variância amostral não viciada vamos fazer as contas então s quadrado que a variância amostral vai ser a divisão aqui 4 - 62 negativo ao quadrado 4 + 3 - 63 negativo quadrado 9 + 5 - 61 negativo ao quadrado um mais 7 -6 dá um nó quadrado um mais dois - 64 negativos ao quadrado 16 + 9 -6 3 ao quadrado 9 mais 11 - 65 quadrado 25 e finalmente mais 7 -6 que é um ao quadrado um tudo isso dividido por sete somando tudo vamos ter 66 sobre sete em forma de número isto nós teríamos nova inteiros e mais 37 pontos e dividindo 66 por sete para chegar a um número decimal nós teremos aproximadamente 9,43 para a variância amostral lembrando que dividimos por ele - ou então trata-se de uma variância a mostrar ou não viciada que é uma boa estimativa para a variância populacional o que falar então o desvio-padrão amostral vamos voltar um pouquinho quando nós falamos do desvio padrão populacional nós o definimos como a raiz quadrada da variância o populacional raiz quadrada de sigma quadrado então é razoável você pensar ora se o desvio padrão populacional é a raiz quadrada da aparência populacional o desvio-padrão amostral indicado por essa vai ser a raiz quadrada da variância amostral vamos fazer as contas para ver o que acontece lembrando que eu posso por aqui o índice e menos um para indicar falta / n menos um que se trata de uma variância a mostrar ou não viciado bem voltando aos cálculos então o desvio-padrão amostral aqui seria a raiz quadrada da variância 9,43 usando a calculadora para obter o valor vamos lá para a raiz quadrada de 9,43 isso nos dá 3,071 aqui aproximadamente 3,07 para o desvio padrão amostral lembrando que a variância quando nós calculamos / e menos um é um estimador não viciado para a variância populacional nós podemos pensar um pouco sobre o desvio padrão ele não é um estimador não viciado para o desvio padrão populacional olhando um pouquinho para o cálculo com que ele é feito vejamos aqui temos o desvio-padrão desvio-padrão amostral para o o desvio padrão amostral vamos a raiz quadrada da somatória com indo de 1 até n minúsculo que o número de elementos da mostra do x e - x barra que a média mostrar ao quadrado esse é o cálculo do desvio padrão amostral o que é que a raiz quadrada a função raiz quadrada de variável é não linear não linear e isso faz com que o s o desvio-padrão amostral não seja um bom estimador para o desvio padrão populacional bem mais se quando nós estávamos calculando a variância percebemos que ao dividir por ele - 1 conseguimos um estimador não viciado para a variância populacional como é que nós trabalharemos com desvio padrão para ter ali um estimador não viciado para o desvio padrão populacional o trabalho com esta função com este cálculo para chegar a uma estimativa a um estimador não viciado para o desvio padrão é bastante complexo bastante complicado diferente do trabalho com a a variância em que dividir por ele - 1 foi suficiente para determinar o estimador não viciado aquela divisão por ele - um no cálculo da variância amostral era suficiente pra qualquer distribuição entretanto o trabalho com desvio padrão depende de como os dados realmente estão distribuídos para poder determinar um estimador não viciado na estatística nós definimos o desvio-padrão amostral pela raiz quadrada da variância amostral é mas isso dá de fato um estimador viciado para o desvio padrão populacional não é um bom estimador para o desvio padrão populacional então nós usamos a variância para analisar a dispersão dos dados por ora é isso aí estude bastante até o próximo vídeo
AP® é uma marca comercial registrada da College Board, que não revisou este recurso.