Conteúdo principal
Curso: Estatística e probabilidade > Unidade 16
Lição 1: Análise de variância (ANOVA)ANOVA 2: Cálculo de SSW e SSB (soma total dos quadrados dentro e entre)
Análise de variância 2 – Cálculo de SSW e SSB (soma total dos quadrados dentro e entre). Versão original criada por Sal Khan.
Quer participar da conversa?
Nenhuma postagem por enquanto.
Transcrição de vídeo
[LEGENDA AUTOMÁTICA] o último vídeo nós calculamos a soma dos
quadrados total para esses nove dados aqui
esses 9 dados onde estão agrupados aqui em grupos de três aqui o 3 3 e 3 ou se
você quiser falar mais de maneira generalizada em m colunas com n
elementos em cada coluna o que eu quero fazer nesse vídeo aqui é determinar o
quanto dessa soma de quadros total aqui se deve à variação dentro do grupo ea
variação entre esses grupos aqui então primeiro vamos determinar a variação
dentro de cada um desses grupos vamos chamar isso de soma dos quadrados
de dentro vou fazer aqui de azul então isso vai ser a soma dos quadrados
de dentro e se de aqui ó deixar bem claro significa dentro beleza que vai
ser isso então ora eu quero saber a variação aqui de
cada um desses elementos de cada grupo em relação à sua média
vamos começar aqui com esse grupo de verde bom em vez de calcular a distância
de cada elemento para a média das médias preenche duas barras aqui e vou calcular
a distância de cada elemento para a sua própria média passou remédio a
respectiva esse x 1 barra por exemplo então nesse caso aqui o primeiro
elemento vai ser 3 ea distância dele até a média é 2 e 3 - 2 e eu vou levar isso
ao quadrado vamos fazer aqui então ó mas ser 3 - 2 ao quadrado
mas esse próximo elemento aqui 2 - 2 ao quadrado
2 - 2 ao quadrado mais o próximo 1 - 2 ao quadrado menos dois têm levado ao
quadrado e agora vou somar também continuar fazendo essas somas já com o
outro grupo a mesma coisa à distância desse elemento aqui de cada um dos
elementos até à sua média respectiva então vamos fazer aqui de roxo para esse
grupo eu vou ter cinco - 45 - quatro elevada ao quadrado mais próximo
elemento 3 menos quatro que a média a respectiva elevada ao quadrado
mas o próximo termo é 4 - a sua média respectiva que é 4 elevada ao quadrado e
agora finalmente o terceiro grupo e vou fazer a mesma coisa pegar cada
elemento calcula a distância do elemento até à sua média respectiva beleza
então aqui eu vou ter mais o que cinco menos seis é a média que seja então 5 -
6 5 - 6 ao quadrado mais o próximo 6 - 6 ao quadrado mas ainda 7 -6 ao quadrado
claro e agora isso tudo aqui vai ser igual a quanto ora aqui nesse primeiro
grupo eu vou ter é um ao quadrado da 1a que vai dar zero a 0 1 - 2 - 1 que
levaram à queda de um então mais um que dá 2 mas o resultado agora o próximo
grupo aqui ó quanto vai dar 5 -4 quadrado vai dar um elevada ao quadrado
da um aqui vai dar - um quadrado da 1 também é que vai dar zero ao quadrado
então eu tenho mais um que dá dois também mas esse próximo grupo aqui o
terceiro grupo 5 - 6 vai dar menos um que levava ao quadrado da um positivo
aqui vai dar 004 de zero e aqui vai dar um quê elevada ao quadrado de um e aqui
vai dar 2 também olha só dois mais dois mais dois
então a nossa conclusão é que a soma dos quadrados aqui dentro é daqueles grupos
isso vai ser igual então a 22 mas dois que das seis
e como nós podemos observar aqui ó a soma dos quadrados aqui dentro de cada
candidato de cada grupo daquele deus 6 portanto de desses 30 ac o 6 se devem à
soma dos quadrados de dentro de cada grupo
agora nós vamos ver a soma dos quadrados entre cada grupo desses mas antes eu
quero saber quantos graus de liberdade tem nesse cálculo aqui
ou seja quanto os dados independentes nós de fato temos nesse cálculo pois bem
como eu sei que em cada grupo tem três elementos se eu souber o valor dessa
média aqui ó basta que eu saiba o valor de n menos um
desses elementos nesse caso aqui portanto se eu souber dois valores
eu consigo terminar o terceiro se eu sei o valor da média beleza
portanto eu sei dos valores eu consigo de terminar o terceiro se eu souber a
média desse grupo portanto para cada um desses grupos aqui
ó para cada suma daqui eu vou te n - 1
graus de liberdade portanto eu vou ter um entendimento
zoom em -1 e menos um então de maneira generalizada aqui ó
eu posso dizer da seguinte maneira que eu voltei em cada um dos grupos
n - um grau de liberdade mas como tenho m grupo sac basta que multiplique isso
então por m então vai ser m vezes em menos 1
daí eu digo então que nesse caso são mbz - 1 graus de liberdade botar gl aqui pra
abreviar e nesse caso aqui do nosso cálculo como ele - um mali dois né a
gente determinou isso cada grupo sim em dois graus de liberdade quando
multiplicadores por m que a quantidade aqui de de grupos né
então são três grupos logo duas vezes três das seis
então são seis graus de liberdade pra cá seis graus de liberdade é claro no
futuro eu quero fazer uma discussão mais detalhada sobre o que significa o grau
de liberdade por enquanto nós vamos pensar o grau de liberdade como sendo o
variáveis independentes nós vamos pensar os graus de liberdade como sendo dados
independentes verdadeiramente e depois vamos pensar futuramente no no
significado matemático da coisa e portanto como nós temos aqui é 6 dados
independentes né porque eu já sei valor da média em cada um desses grupos então
eu tenho seis dados independentes já que o outro esses outros dados aqui é esse e
se esse ou qualquer um outro caso saiba os outros dois dados são dados que você
determinar por isso eu tenho seis graus de liberdade aqui então essa quantidade
é de 6 é o quanto nós temos em relação àquele
30 a soma dos quadrados de dentro desse grupo agora eu vou pensar é na soma dos
quadrados entre esses grupos aqui e eu vou chamar nessa soma de quadrados então
acho que eu fiquei meio sem correr agora seja amarela que de novo então chamar se
á que soma dos quadrados entre os grupos e se é aqui significa entre beleza então
uma outra maneira de pensar sobre isso aqui é saber o quanto dessa variação a
que se deve à variação entre cada uma dessas médias aqui então aqui vou fazer
a seguinte maneira para cada dado dessa tabela aqui ou para cada grupo
eu vou calcular então a distância ao quadrado em que a média neste grupo aqui
isso em relação a cada um dos elementos entre
a média ea média das médias por exemplo pra esse três aqui vou fazer no caso de
fazer de verde ainda para ficar com a mesma cor
vai ser a média 2 - 4 que a média das médias então 2 - 4 ao quadrado isso pra
esse primeiro elemento aqui pra esse aqui é a mesma coisa já que a média de 2
então é ficar mais 2 - 4 ao quadrado e por outro elemento a mesma coisa
vai ser 2 - 4 ao quadrado e se menos com esse esse 4 aqui é a média das médias
estão calcula a diferença à distância no caso entre essa média aqui desse grupo
certo ea média das médias e e levo essa distância ao quadrado estou fazendo aqui
e aí uma outra maneira de a gente calcula isso daqui é perceber que isso
daqui três vezes a mesma coisa um elas são três vezes o mesmo cálculo então
posso fazer isso aqui como sendo igual a três vezes
2 - 4 ao quadrado isso aqui então esse três vezes aqui vai dar 2 - 2 né - 2 ao
quadrado da quatro então três vezes 4 vai dar quanto 12
só que eu posso fazer controle direto é fazer com 3 com os três grupos directo e
em vez de fazer um por um fica mais simples de ver então vamos
fazer daquele outro grupo aí né não sei o que vai ser mais certo essa
média - essa média aqui a média das mulheres ao quadrado então 4 -4 ao
quadrado que dá zero então vamos colocar aqui ó 4 -4 ao quadrado foi pra esse
cara aqui agora pra esse cara vai ser a mesma coisa do que a média mesma tão
mais 4 -4 quadrado mas 4 -4 quadrado de novo porque é pra esse cara aqui beleza
claro então nós calculamos a distância entre essa média aqui ea média das
médias da safra está tranqüilo beleza vamos prosseguir agora para o terceiro
grupo e portanto a que acresce o último grupo fazer aqui em laranja isso vai ser
então já que a média amostral desse grupo aqui foi 6
então se a distância entre os 6 e 7 416 - quatro eu vou levar essa distância ao
quadrado mesma coisa que fiz antes né então vai ser 6 -4 ao quadrado
foi com esse primeiro cara aqui para o outro 6 - 4 ao quadrado mas
16 - 4 ao quadrado e agora nós vamos pensar aquilo os graus de liberdade que
nós temos para esse cálculo aqui a primeira coisa que eu penso é o seguinte
é saber em quanto os dados independentes nós temos nesse necessário nessa tabela
sabendo a média das médias e se quatro aqui na média das metas que nós
calculamos previamente então é o seguinte se eu sei
a média das médias nesse valor aqui o quanto disso daqui em informação nova
ora se eu sei a média das médias e 6 2 nesses valores aqui eu posso sempre de
terminar o terceiro valor é um é bom pensar em ser aqueles dois aliás eu
souber digamos esse valor aqui e esse valor consegue definir esse beleza e
portanto eu posso dizer que eu tenho e grupos
eu vou te m - um grau de liberdade portanto vou escrever isso aqui ó voltei
pra esse cálculo em mim - 1 graus de liberdade graus de liberdade pelo então
nesse caso aqui é como nosso m ele é igual a 3
eu vou até então dois graus de liberdade 1 2 g/l então já conseguiu em dois graus
de liberdade ou calcular o valor dessa soma dos quadrados entre esses termos
aqui beleza e vou fazer esse cálculo aqui em baixo ficando meio sem espaço
aqui no showmetech para baixo um pouquinho isso aqui então vai ser igual
a quanto essa primeira linha que tem verde vai ser três vezes né
a gente viu são três vezes a mesma coisa em cada uma dessas contas aqui vai dar 2
- 4 - 2 - 2 ao quadrado vai dar quatro então três vezes 4
mas essa outra linha kiyota quanto era três vezes 04 - 400 quadrados 0 mesmo né
então vai ser três vezes é nas três vezes e zero e tudo isso aqui mais ainda
a diferença desses aqui é o quadrado são três cálculos iguais também a diferença
que dá 22 ao quadrado é 4 93 vezes 4 novamente então aqui vai ser três vezes
quatro essa linha laranja eu votei que o resultado dessa conta vai ser quanto às
vezes quatro é 12 30 34 a 12 doze mais 12 24 então resultado dessa conta aqui é
24 então posso dizer que a soma dos
quadrados entre aquelas médias ali certo entre essas médias a essa aliança
que a variação de 1 24 e agora vamos colocar tudo isso que nós calculamos que
uma vez só eu descobri que a soma dos quadrados
total a de igual a 30 nós temos tudo aqui embaixo
vamos lá então descobrimos que a soma dos quadrados total isso é igual a 30
nós descobrimos também que a soma dos quadrados dentro de cada um desses
grupos aqui o s que de igual quanto a de igual a 6
então posso dizer aqui ó que a soma dos quadrados soma dos quadrados de dentro
de igual a 6 e aqui os graus de liberdade nós
descobrimos também são seja a liberdade então 6 graus de liberdade que de
maneira generalizada em n vezes em menos 1 m vezes e menos 1 graus de liberdade e
até aqui para a soma dos quadrados total lá em cima
nós descobrimos o que que são m vezes n - um herói de liberdade que deu aqui
nesse nesse caso específico 8 graus de liberdade então vamos lá
como escrevi aqui também uma tarja amarela do macaco mesma cor
aqui são oito graus de liberdade 8 g/l que de maneira generalizada nós
calculamos como sendo mvn -1 beleza multiplicação da quantidade de grupos
vezes a quantidade de itens de cada grupo
menos um então nessa coluna aqui eu estou colocando os graus de liberdade
certo e aqui nesse último caso calculei a soma dos quadrados entre cada um
daqueles entre cada uma daquelas médias ali né enquanto deu deu 24 aqui quando
24 com quantos graus de liberdade a dois graus de liberdade 2 g/l que de maneira
generalizada em -1 e menos um ea coisa bacana daqui que é onde toda essa
análise da variância se ajusta de maneira muito legal olha aqui é que a
soma dos quadrados de dentro mas a soma dos quadrados entre a ilha só 24 mais
seis da soma dos quadrados total perdeu 30 é ou não é olha aí em vídeos futuros
eu quero usar essas ferramentas mas terminamos aqui pra fazer alguns
cálculos alguns testes hipótese então uma maneira de pensar
isso daqui é saber que a variância total desses grupos aqui né
é igual à soma da variância dentro de cada um desses grupos somado isso né é a
soma dessa aliança dentro de cada um dos grupos com a variância entre no caso
aqui a média de cada um desses grupos mas a soma da variância entre cada um
desses grupos aqui então é a soma dos quadrados dentro de cada um dos looks
mais a soma dos quadrados entre cada um dos grupos vai dar então a soma dos
quadrados total beleza inclusive se você reparar bem ó até os graus de liberdade
funciona 6 mais dois da 8 tranqüila a soma dos quadrados entre dois somos
quadrados de dentro deus 66 mais 2 a 8 isso funciona até na maneira
generalizada vamos calcular que é bom para a equipa soma dos quadrados dentro
deu m vezes em menos 1 e próxima dos quadrados entre deu m - vamos somar a
isso e me menos 1 somando isso daqui eu tenho seguinte omvs cnn
mv - 1 - m aqui eu voltei mais m - um certo esse -
m com esse mais em mim aqui simplifica e quando tentam mvn menos 11
reparasse isto aqui não é a mesma coisa que isso aqui ó
certo não deu certinho bateu certinho realmente eu sou mar vai dar os graus de
liberdade da soma dos quadrados total então todo o objetivo desse vídeo aqui
era mostrar que és avaliação total que nós calculamos lá no primeiro vídeo isso
aqui o meu 30 isso é igual à soma das outras duas variações
a soma dos quadrados dentro de cada um desses grupos estão espalhados entre
cada um desses grupos aqui beleza somar essas duas variações soma dos quadrados
dentro do quadrado entre isso vai dar soma dos quadrados total beleza eu
espero que não tenha sido muito confuso pra você ea gente nem tão os próximos
vídeos tal