If you're seeing this message, it means we're having trouble loading external resources on our website.

Se você está atrás de um filtro da Web, certifique-se que os domínios *.kastatic.org e *.kasandbox.org estão desbloqueados.

Conteúdo principal
Tempo atual:0:00Duração total:12:17

Transcrição de vídeo

RKA1JV Nós já estudamos em alguns vídeos o cálculo da variância em estatística. Nós vamos ver agora um pouco de manipulação algébrica com a fórmula da variância para obter alternativas para a fórmula desse cálculo. Primeiro, vamos lembrar para a variância populacional, indicamos por sigma ao quadrado (σ²), e ela é o resultado da somatória com "I" indo de 1 até "N", que o número de elementos da população. De "Xi", cada elemento, subtraindo dele o valor da média, e elevando o resultado ao quadrado e tudo isso dividido por "N". Esse é o cálculo da variância. Vamos lembrar que a média populacional, "µ", é nada mais nada menos que somar todos os elementos que nós temos na população, somatória com "I" indo de 1 até "N", de todos os elementos Xi divididos por "N". Nosso interesse está aqui com a fórmula da variância, vamos manipular um pouco algebricamente. Primeiro, vamos eliminar estes parênteses que você vê aqui, para isso, vamos nos lembrar de uma ferramenta da Álgebra, que é o quadrado da diferença de dois termos, o produto notável. Vou colocar aqui separadinho o seguinte: você deve se lembrar de que (a - b)² resulta em o primeiro termo ao quadrado, menos duas vezes o primeiro, vezes o segundo, mais o segundo termo ao quadrado. Esse é resultado padrão, um produto notável. Se você não se lembrar disso, basta lembrar que (a - b)² é (a - b) vezes (a - b). Distribuindo aqui a multiplicação e simplificando, você vai chegar exatamente ao que está lá. Vamos então reescrever a variância. σ² igual a somatória com "I" de 1 até "N", agora, vou eliminar os parênteses aqui, na verdade, eliminar os parênteses em um desses termos da somatória. Preciso manter os parênteses por causa da notação sigma que nós temos aqui. Usando este mesmo padrão que nós temos aqui, eu vou ter o Xi² menos 2Xi vezes a média "µ", mais o µ². Desenvolvi este quadrado aqui, tudo isso dividido por "N". A somatória de todos estes termos pode ser separado na somatória deste menos a somatória deste, mais a somatória deste. Então, nós temos aqui σ² igual, vamos separar todas as somatórias, cada uma dividida por "N". Nós vamos ter aqui uma somatória, somatória com "i" indo de 1 até "N", do Xi² dividido por "N". Menos a somatória com "i" indo de 1 até "N", de 2Xi vezes a média "µ" dividido por "N". Mais a somatória deste outro termo aqui, somatória com "i" indo de 1 até "N", da média µ² sobre "N". Agora, nós vamos manipular um pouquinho mais. Temos aqui σ² igual, nesse primeiro termo não temos muito o que fazer, vou simplesmente copiá-lo. Menos, agora, aqui existe uma série de maneiras de justificar o seguinte fato. O número 2 e o número "µ" que é a média não variam de acordo um índice "i" da somatória, eles são constantes, multiplicam todos os termos da somatória. Se eu colocá-los em evidência, eles multiplicariam o resultado da soma, isso quer dizer que eu posso escrever o 2µ vezes a somatória, a somatória com "i" indo de 1 até "N", do Xi. 2µ, por não envolver o índice, por não variar de um termo para outro, posso colocar em evidência e colocar fora da notação sigma. Sempre que eu tenho uma constante multiplicando o fator que varia, eu posso colocar esse constante multiplicando aqui fora mais este outro termo que temos aqui. Agora, se você observar, o "µ", mesmo que elevado ao quadrado é sempre um número constante, ele não varia de acordo com o índice da somatória. Claro que eu posso me lembrar de que ele está multiplicado por 1 aqui. Seguindo o mesmo raciocínio anterior, eu posso pegar o µ² que é uma constante para essa somatória e multiplicar fora da somatória, µ² vezes a somatória, com "i" indo de 1 até "N". Do número 1, aqui está multiplicado por 1, isso não posso ignorar, dividido por "N". As coisas parecem não estar muito simples, mas a ideia é ver o que acontece aqui e se podemos simplificar. σ² igual, vou mais uma vez copiar esse termo, que não temos muito o que fazer. Menos, agora, neste outro termo, nós temos uma coisa interessante, o 2µ que está aqui multiplicando. Com um pouco de atenção aqui, você pode perceber que este pedaço, somatório de todos os termos da população dividido pelo número de elementos da população, vamos voltar um pouquinho, é exatamente a média. Você pode ver que o que eu destaquei lá é exatamente esta parte, então, isto que está destacado na linha tracejada não é nada mais, nada menos que "µ", a média. Mais. Agora, neste outro termo aqui, nós podemos melhorar mais uma coisinha, temos aqui o denominador "N", o µ² aqui, vezes, vamos pensar um pouco nesta somatória. Ela é a somatória com "i" de 1 até "N" de vários termos. Cada termo é determinado pelo o que está aqui, ou seja, 1 mais 1, mais 1, mais vários termos 1. Quantos termos "1"? "N", porque o "i" vai de 1 até "n", veja que o termo é sempre 1. Aqui nós temos 1 mais 1, mais 1, mais 1, "N" vezes, ou seja, tudo isso se transforma simplesmente em "N". Agora está ficando mais interessante. Podemos simplificar mais um pouquinho, então, vamos lá. σ² igual, vou mais uma vez copiar este termo, menos, 2µ vezes "µ", 2µ². Mais, aqui, olha só, "N" cancela com "N", sobra µ². Melhorando um pouco mais, esses dois termos, eu posso agrupar, então, ficamos com σ² igual, de novo, aquela somatória, -2µ² mais µ² nos dá -µ². Então, veja que aqui já temos uma forma alternativa para o cálculo da variância. Em vez de fazer como lá no começo, vamos voltar um pouco, na definição da variância, eu preciso pegar cada termo, subtrair a média e o resultado elevar ao quadrado. O primeiro termo, depois o próximo termo, termo menos a média, o resultado eleva ao quadrado e assim por diante para todos os termos da população. Se for uma mostra, "N - 1". Voltando para cá, se você observar aqui, eu tenho que elevar cada termo ao quadrado, somar todos, dividir pelo número de termos e subtrair daquilo lá a média elevada ao quadrado, a média ao quadrado vou fazer uma vez só. Então, já pode ser interessante eu usar esta forma de escrever, mas há algo ainda que também é bastante interessante aqui, veja só. Como é mesmo que nós calculamos a média? Eu vou colocar aqui ao lado, está lá em cima, mas eu vou colocar aqui ao lado. A média, "µ", a média populacional "µ" é igual, vamos voltar. Temos a média aqui, é esta conta, vou copiar esta somatória aqui embaixo para ficar visivelmente melhor. Se o "µ" é igual a esta conta, µ² é este cálculo ao quadrado, pode parecer que não vai ficar muito simples, mas veja o que vai acontecer. De novo σ², igual. Mais uma vez, copiando este termo, menos, µ² é isso aqui elevado ao quadrado, então, vamos escrevê-lo aqui. Ao elevar tudo ao quadrado, o denominador vai ficar N², e aqui nós vamos ter todo aquele resultado, ou seja, a somatória com "i" indo de 1 até "N", do Xi, e o resultado elevado ao quadrado. Conseguimos uma outra fórmula para o cálculo da variância. Observe que esta forma é equivalente às outras, equivalente àquela primeira que nós já estudamos. Você pode pensar: "qual é a vantagem de trabalhar desta forma?" Observe com cuidado. Tanto no primeiro termo quanto, ou melhor dizendo, tanto na primeira somatória quanto na segunda somatória, nós estamos envolvendo simplesmente duas coisas: o valor de cada elemento da população e o número de elementos da população aqui nos denominadores. Nós não precisamos mais da média do "µ", ao simplificar dessa maneira, ao manipular algebricamente dessa maneira, nós reescrevemos a fórmula da variância sem a necessidade de utilizar a média populacional para obter a variância populacional. Da mesma maneira, só que dividido por "N - 1" e etc, nós teríamos para a variância amostral. Ao consultar livros, você pode encontrar fórmulas para a variância, daquela forma inicial, com certeza você vai encontrar esta fórmula aqui. Você pode muitas vezes encontrar no livro a variância calculada desta forma ou por esta outra fórmula que está aqui ou por esta aqui ainda. Mas aqui é importante você ver que, com um pouco de manipulação algébrica, nós entendemos o porquê de isso acontecer. Mais ainda, interpretando, nós vemos a importância disso, o fato de você não depender da média para calcular a variância. Espero que com esse vídeo você tenha podido observar um pouco melhor a utilidade da manipulação algébrica, que muitas vezes fica bastante abstrata, e aqui continua em um universo bastante abstrato, mas tem uma função importante de maneira indireta. Nesse caso é facilitar ou proporcionar outras formas de calcular o valor da variância. Estude bastante, e até o próximo vídeo!