Preview only show first 10 pages with watermark. For full document please download

Aula 10 - Medidas De Dispersão - Ferramentas úteis Na Análise Estatística (1)

   EMBED


Share

Transcript

Ivone da Silva Salsa

Jeanete Alves Moreira
Marcelo Gomes Pereira
Autores
aula
10
Medidas de dispersão: ferramentas
úteis na análise estatística
Matemática e Realidade
D I S C I P L I N A
2ª Edição
Divisão de Serviços Técnicos
Catalogação da publicação na Fonte. UFRN/Biblioteca Central “Zila Mamede”
Copyright © 2007 Todos os direitos reservados. Nenhuma parte deste material pode ser utilizada ou reproduzida sem a autorização
expressa da UFRN - Universidade Federal do Rio Grande do Norte.
27/06/2007
Salsa, Ivone da Silva.
Matemática e realidade: interdisciplinar / Ivone da Silva Salsa, Jeanete Alves Moreira, Marcelo Gomes
Pereira. – Natal, RN: EDUFRN Editora da UFRN, 2005.
292 p.
1. Métodos estatísticos. 2. Análise estatística. 3. Proporção e porcentagem. 4. Dados estaísticos. 5.
Medidas de dispersão. I. Moreira, Jeanete Alves. II. Pereira, Marcelo Gomes. III. Título.
ISBN 85-7273-287-X CDD 519.5
RN/UF/BCZM 2005/47 CDU 519.22
Governo Federal
Presidente da República
Luiz Inácio Lula da Silva
Ministro da Educação
Fernando Haddad
Secretário de Educação a Distância – SEED
Ronaldo Motta
Universidade Federal do Rio Grande do Norte
Reitor
José Ivonildo do Rêgo
Vice-Reitor
Nilsen Carvalho Fernandes de Oliveira Filho
Secretária de Educação a Distância
Vera Lúcia do Amaral
Secretaria de Educação a Distância- SEDIS
Coordenadora da Produção dos Materiais
Célia Maria de Araújo
Projeto Gráfico
Ivana Lima
Revisores de Estrutura e Linguagem
Eugenio Tavares Borges
Marcos Aurélio Felipe
Pedro Daniel Meirelles Ferreira
Tatyana Mabel Nobre Barbosa
Revisoras de Língua Portuguesa
Janaina Tomaz Capistrano
Sandra Cristinne Xavier da Câmara
Ilustradora
Carolina Costa
Editoração de Imagens
Adauto Harley
Carolina Costa
Diagramadores
Bruno Cruz de Oliveira
Maurício da Silva Oliveira Júnior
Mariana Araújo Brito
Thaisa Maria Simplício Lemos
Imagens Utilizadas
Banco de Imagens Sedis (Secretaria de Educação a Distância) - UFRN
MasterClips IMSI MasterClips Collection, 1895 Francisco Blvd,
East, San Rafael, CA 94901,USA.
MasterFile – www.masterfile.cpom
MorgueFile – www.morguefile.com
Pixel Perfect Digital – www.pixelperfectdigital.com
FreeImages – www.freeimages.co.uk
FreeFoto.com – www.freefoto.com
Free Pictures Photos – www.fre-pictures-photos.com
BigFoto – www.bigfoto.com
FreeStockPhotos.com – www.freestockphotos.com
OneOddDude.net – www.oneodddude.net
1 2ª Edição Aula 10 Matemática e Realidade
Apresentação
a aula 8, vimos como as Medidas de tendência central – média, moda e mediana
– representam, de forma condensada, informações sobre o comportamento de
dados. Entretanto, tais medidas referem-se a valores típicos, centrais do conjunto
estudado e não nos dão informações sobre como os dados estão dispostos ao redor delas.
Daí, podemos ter distribuições bem diferentes, porém com a mesma média, por exemplo. Isso
pode, inclusive, conduzir a interpretações equivocadas. Uma medida de centro – as referidas
acima – não dá esclarecimentos para perguntas do tipo: os dados estão muito concentrados
ao redor da média? Da mediana? Será que eles se apresentaram muito dispersos em relação
a essas medidas? As respostas para tais questionamentos podem ser obtidas através das
Medidas de Dispersão (ou Medidas de Variabilidade).
É justamente esse o assunto que abordaremos nesta aula. Estudaremos as seguintes
medidas de dispersão: amplitude total, desvio quartil, variância e desvio-padrão. Elas,
assim como as medidas de tendência central, são indispensáveis para a descrição do
comportamento dos dados estudados. O conhecimento delas, portanto, nos possibilita
melhor capacidade de análise sobre o fenômeno/fato pesquisado.
N
Objetivos
Buscamos com esta aula, ajudá-lo a construir os conceitos
relacionados às medidas de dispersão, assim como, a compreender
a elaboração de seus cálculos e a forma de interpretá-las.
Procuraremos também fazê-lo apreender a importância de tais
medidas para a descrição e análise de observações numéricas.
2 Aula 10 Matemática e Realidade 2ª Edição
Descobrindo o comportamento
de dados quantitativos
C
Essa é uma das possíveis situações que podem ocorrer quando descrevemos conjuntos
de dados, sobretudo quando precisamos fazer comparações. Ela nos mostra como é
necessário e importante ter as informações sobre a dispersão dos dados que buscamos
analisar. Concluímos então, que mesmo uma descrição mais simples de um conjunto de
observações numéricas deve ser feita a partir de, pelo menos, uma medida de Tendência
Central e uma medida de Dispersão. Analisar dados apoiando-nos apenas no resultado de
onsidere, como exemplo, a seguinte situação: três universitários, A, B e C, se
submetem a um teste de seleção para uma bolsa de apoio técnico. Nesse teste,
aconteceram seis provas, mas foram escolhidas quatro para avaliar os candidatos:
Português, Matemática básica, Inglês elementar e Informática. Esses três concorrentes, no
final, ficaram com a mesma média, x = 6,0 pontos nas quatro disciplinas. Será que, com
essa informação, podemos dizer que as suas notas foram valores não muito diferentes,
nessas provas? Em outras palavras, será que apresentaram desempenho semelhante em
tais matérias? Ora, somente com a informação da média não temos condições de responder
a essa questão. Não podemos saber se as pontuações dos candidatos foram valores muito
próximos da média x = 6,0 ou não.
Imagine, por exemplo, que esses candidatos conseguiram os seguintes resultados para
as provas de Português, Matemática básica, Inglês elementar e Informática, nesta ordem:
A = 6, 0 6, 0 6, 0 6, 0 r =
6 ÷ 6 ÷ 6 ÷ 6
4
= 6, 0
B = 8, 0 10, 0 10, 0 1, 0 r =
8 ÷ 10 ÷ 10 ÷ 1
4
= 6, 0
C = 6, ò 7, 0 ò, ò ò, 0 r =
6, ò ÷ 7 ÷ ò, ò ÷ ò
4
= 6, 0
Observando atentamente as notas, em cada conjunto, vemos que, em relação à média
r , , o candidato A está muito bem representado por essa medida, pois suas notas
coincidem exatamente com ela. Já o candidato B parece ter pouco conhecimento em
Português e, além disso, não teve bom desempenho em Informática. O valor médio somente
foi igual a 6,0 porque suas outras notas (Matemática e Inglês) compensaram esse baixo
rendimento. Portanto, essa medida de tendência central (ao contrário do candidato A) não
representa tão bem o conjunto das notas do candidato B, porque seus valores estão muito
dispersos em relação a ela.
Quanto ao candidato C, suas notas não estão muito afastadas do valor médio, r ,
pontos. Assim, elas também estão bem representadas por essa medida.
3 2ª Edição Aula 10 Matemática e Realidade
uma média (ou moda ou mediana), como vimos, pode nos levar a conclusões equivocadas.
Portanto, as medidas de dispersão são muito importantes e nos ajudam bastante a
entender, com maior clareza, dados estatísticos.
Estudaremos as seguintes:
„ AMPLITUDE TOTAL : A
T
„ DESVIO QUARTIL : D
q
„ VARIÂNCIA :
2
(para dados populacionais) ou
s
2
(para dados amostrais)
„ DESVIO-PADRÃO : (para dados populacionais) ou S (para dados amostrais)
AMPLITUDE TOTAL: A
T
É a medida de dispersão mais simples que existe. Seu cálculo baseia-se apenas em dois
valores de um conjunto numérico, os extremos, e não considera os demais. Por isso, nos
dá apenas uma “rápida” indicação da dispersão e, conseqüentemente, tem pouca utilidade
quando queremos dispor de informações mais apuradas sobre a variabilidade dos dados.
Definimos a Amplitude total (A
T
) de um conjunto numérico como o resultado da
diferença entre o maior e o menor valor, observados nesse conjunto. Ou seja,
A
T
= (maior valor) − (menor valor)
Quando estudamos as distribuições de freqüências, na aula 5 (Dados quantitativos:
como organizá-los?) Vimos essa medida, lembra?
No caso desse exemplo, o resultado dessa medida é:
candidatos: A ŸA
T
= 6,0 − 6,0 = 0
B ŸA
T
= 10,0 − 1,0 = 9,0
C ŸA
T
= 7,0 − 5,0 = 2,0
Como podemos ver, as notas do candidato B apresentaram uma dispersão muito mais
alta que as dos demais, enquanto as do candidato A apresentaram dispersão nula e, em
relação ao C, a dispersão foi pequena. Isso significa que os dados em A não variaram; em B,
apresentaram grande variabilidade; e em C, pouca variação.
Observação – (letra grega – sigma minúsculo)
4 Aula 10 Matemática e Realidade 2ª Edição
DESVIO QUARTIL: D
q
Quando estudamos as separatrizes na aula 9 (As separatrizes na análise de dados
estatísticos), vimos que os quartis dividem um conjunto de dados ordenados em 4 partes
iguais. Esquematicamente, temos:
Vamos ver um exemplo?
Retome a aula 9, que trata das separatrizes. Com base na distribuição das médias de
Matemática na amostra das turmas da manhã (Tabela 1), encontramos:
Q
1
= 6,2 e Q
3
= 8,5.
Então, nesse caso, o desvio quartil será:
Atividade 1
Na auto-avaliação da aula 9, a primeira questão solicitava que você calculasse
algumas separatrizes, entre elas os três quartis para as notas de Matemática da
amostra das turmas da noite. Com esses valores, calcule o desvio quartil para
essa distribuição e compare seu resultado com o da amostra da manhã que
acabamos de calcular. Qual dessas duas amostras apresenta maior variação
em relação a seus dados?

, , 2
2
=
2, 8
2
= 1, 1ò

= 1, 1ò pontos.
Como vemos, entre o 1
o
quartil (

) e o 3
o
(

) se encontram 50/ (a metade) dos
valores centrais de um conjunto de dados.
O desvio quartil (

) se baseia nesses dois quartis:

e

. Ele é o resultado que se
obtém por meio da expressão:
5 2ª Edição Aula 10 Matemática e Realidade
VARIÂNCIA: σ
2
(para dados populacionais) ou
s
2
(para dados amostrais)
Todas as somas foram iguais a zero! Será isso pura coincidência? Não. Isso é uma
propriedade da média. Em qualquer situação, teremos: a soma dos desvios dos valores de
um conjunto, em relação à sua média é sempre igual a zero.
Esse resultado significa que a média é uma medida que reflete o ponto de equilíbrio
dos dados. Diante disso, a soma dos desvios não pode servir como uma medida para nos
informar sobre a dispersão dos dados, em relação à média. Para contornar esse problema,
podemos: ou considerar o valor absoluto desses desvios (função módulo) ou elevar cada
um deles a um expoente par, pois, assim, qualquer resultado negativo passa a ser positivo.
(No caso, podemos considerar os desvios ao quadrado, pois o expoente dois simplifica os
cálculos). Dessa forma, a soma do quadrado de todos os desvios nunca será nula, exceto se,
e somente se, todos os valores do conjunto coincidirem com a média (esse fato indicará que
não há dispersão entre os dados).

= r

média
Parece intuitivo que, quanto mais os valores de uma série se distanciaremda sua média,
maior deve ser a soma desses desvios, não é mesmo? Então, talvez nós pudéssemos usar
essa soma como uma medida de dispersão. Vamos, então, calcular os desvios em relação
à média (r = 6, ) para as notas de cada candidato (A, B e C), somar os desvios em cada
conjunto e ver o que podemos concluir?
Acompanhe os cálculos:
Portanto,

(

média) = 0, sempre.
Essa medida de dispersão, muito utilizada na estatística mais avançada, é baseada nos
desvios de cada valor observado, em relação à média (). Portanto, ela considera, além
dessa medida de tendência central, todas as observações do conjunto estudado. Mas, o que
quer dizer “desvios em relação à média”?
Definimos desvio em relação à média (

) como sendo o valor obtido pela expressão:
Desvios A B C
(x
1
x) (6 6) = 0 (8 6) = 8 (6,ò 6) = 0,ò
(x
2
x) (6 6) = 0 (10 6) = 4 (7 6) = 1
(x
8
x) (6 6) = 0 (10 6) = 4 (ò,ò 6) = 0,ò
(x
4
x) (6 6) = 0 (1 6) = ò (ò 6) = 1
Soma dos Desvios
0 0 0
6 Aula 10 Matemática e Realidade 2ª Edição
Porém, utilizar apenas a soma do quadrado dos desvios para comparar situações pode
nos levar a grandes equívocos, quando os conjuntos de dados tiverem números diferentes de
elementos. Diante disso, como podemos usar os desvios para medir a dispersão dos dados?
Uma maneira simples é utilizar a média aritmética do quadrado desses desvios (isso na
realidade é a média quadrática dos desvios). Daí vem, justamente, a definição matemática
dessa medida de dispersão.
A variância de um conjunto qualquer de valores é a média quadrática dos desvios
tomados em relação à média desse conjunto.
Variância para dados não tabelados
Quando os dados são isolados (não tabelados), o cálculo da variância é obtido através
das fórmulas:
Note que, na equação (2) (dados amostrais), o denominador é n−1. Essa pequena
modificação proporciona uma estimativa melhor para a variância. Entretanto, não
apresentaremos a prova desse fato, visto que requer um nível mais avançado de conhecimentos
na área da Inferência Estatística, e não faz parte dos objetivos deste curso.
Atividade 2
Vamos calcular o quadrado dos desvios para os conjuntos A, B e C e depois
somá-los para obter a variância? Faça os cálculos e em seguida confira com os
resultados apresentados na tabela seguinte.
para dados populacionais:

=

(r

)

(equação 1);
e amostrais:

=

(r

r)

1
(equação 2).
7 2ª Edição Aula 10 Matemática e Realidade
Calcularemos s
2
, pois as quatro disciplinas escolhidas constituem uma amostra das seis.
Portanto, temos:
Podemos ver que o conjunto B apresentou uma variabilidade muito maior que os demais.
Daí concluímos que seus valores não estão muito concentrados ao redor da sua média.
Desenvolvendo-se algebricamente as expressões (1) e (2), e após as devidas
simplificações, podemos reescrevê-las, respectivamente para
2
e s
2
, da forma:
Embora essas novas fórmulas possam parecer mais complicadas, elas, na verdade,
exigem cálculos bastante simples. Você precisa apenas calcular duas somas: uma, referente
ao quadrado de cada observação, e a outra, ao total de todos os dados.
Como exemplo, vamos calcular a variância para os dados do Censo de 2000, relativos às
taxas de Mortalidade Infantil até 1 ano, dos 8 municípios que compõem a região metropolitana
de Natal. Essas taxas representam a mortalidade de crianças menores de 1 ano em 1.000
nascidos vivos.
Obs.: deixe sempre o resultado da variância com pelo menos 4 casas
decimais, pois isso será importante para o cálculo do desvio-padrão que
veremos mais adiante.
\ o:( ) =

(r

r)

n 1
=
0
8
= 0
\ o:() = :

=
77
8
= 22 (pontos)

\ o:() = :

=
2, ò
8
= 0, 8888 (pontos)

.

=

(

)

=

(equação 3) e

=

(

)

1
=

1
(equação 4)
Desvios
2
=(x
1
x)
2
A B C
(x
1
6)
2
0 0 0,2ò
(x
1
6)
2
0 16 1,0
(x
1
6)
2
0 16 0,2ò
(x
1
6)
2
0 2ò 1,0
Soma
0 66 2,ò
8 Aula 10 Matemática e Realidade 2ª Edição
Tabela 1 – Cálculos auxiliares para obtenção da variância.
A variância é uma medida de dispersão que assume valores maiores ou iguais a zero,
porque é uma média quadrática, portanto nunca será um número negativo. Para efeito de
análise, quanto maior a variância (quanto mais distante do zero), maior é a dispersão dos
dados em relação à média.
Atividade 3
Os dados apresentados a seguir foram obtidos do Atlas de Desenvolvimento
Humano no Brasil e referem-se ao percentual
*
de analfabetismo funcional
(menos de quatro anos de estudo) de pessoas com 15 anos ou mais em seis
municípios da microrregião de Sousa (Paraíba), dos anos:
1991: 73 67 70 60 69 77
2000: 57 57 62 53 61 68
*Esses percentuais foram arredondados para facilitar os cálculos.
Calcule a média e a variância para cada ano, comparando os resultados dos
mesmos em relação à variabilidade dos dados.
Os dados são:
48,86 40,16 43,96 36,53 48,41 38,10 35,26 36,99
Para facilitar os cálculos, construímos a tabela a seguir:

=

1
=
(186 8 2)
(828 2 )

8

=
186 8 2 184 0 1=

= 20 08 (óbitos1000)

x
i
x
2
i
8ò,26 1.248,27
86,ò8 1.884,44
86,00 1.868,26
88,10 1.4ò1,61
40,16 1.612,88
48,06 1.082,48
48,41 2.848.ò8
48,86 2.887,80
¦x
i
2
= 828,27 ¦x
i
2
= 18.678,72
9 2ª Edição Aula 10 Matemática e Realidade
Variância para dados agrupados em
tabelas de freqüências
Para dados agrupados em distribuições de freqüências, temos, respectivamente, as
seguintes fórmulas para a variância populacional e para a amostral:
Observe que agora trabalharemos com as freqüências e que a variação do índice no
somatório vai de 1 a k, que representa exatamente a quantidade de valores assumidos
pela variável estudada ou o número de intervalos, quando trabalhamos com dados
agrupados em classes.
Os valores x
i
são substituídos pelos pontos médios dos intervalos quando se
trabalha com dados agrupados em classes.
Vamos acompanhar duas situações através dos exemplos 1 e 2 para que você possa se
familiarizar melhor com as fórmulas apresentadas.
Exemplo 1
Retomaremos a aula 5 em que temos a pontuação no teste objetivo de Matemática numa
amostra de 54 alunos da 8ª série/manhã, exposta na Tabela 2, que a seguir apresentamos.
Observe que as duas últimas colunas da tabela são suficientes para a obtenção dos valores
que serão utilizados na fórmula da variância. Veja também que a variável pontuação (X
i
)
assume 6 valores distintos, isto significa que: k = 6.

(equação 5) e

1
(equação 6)
10 Aula 10 Matemática e Realidade 2ª Edição
Fonte: Dados fictícios
Como se trata de uma amostra, calcularemos s
2
ao invés de .
Agora que temos todos os elementos, deveremos aplicar a equação (6):
Atividade 4
Na aula 8, pedimos para você calcular a média para a pontuação no teste
objetivo de Matemática na amostra das turmas da 8ª série/noite. Agora, calcule
a variância e compare o resultado com o que acabamos de encontrar.
Exemplo 2
A Tabela 3 que segue exibe dados agrupados em intervalos de classe. Vamos aprender
como se calcula a variância, em situações como esta. Você se lembra que, nesse caso (dados
agrupados em classes), x
i
se refere ao ponto médio de cada intervalo e representa todos
os valores contidos em sua respectiva classe? Para facilitar os cálculos da variância, foram
acrescentadas as três últimas colunas, tal como foi feito no exemplo 1.
Tabela 2 – Pontuação no teste objetivo de Matemática, na amostra das turmas da 8
a
série/manhã, na
E. E. Nair Burégio, município de Carapeba, em abril de 2004.

1

77
(87)

ò4
ò8

77 ò7 77
ò8
1 74 (pontos)

.
Pontuação x
i
Nº de alunos f
i
x
i
f
i
x
2
i
f
i
4 2 8 4
2
x 2 = 82
ò 8 40 ò
2
x 8 = 200
6 10 60 6
2
x 10 = 860
7 1ò 10ò 7
2
x 1ò = 78ò
8 12 06 8
2
x 12 = 768
0 7 68 0
2
x 7 = ò67
TOTAL ¦f
i
= f = ò4 ¦x
i
f
i
= 872 ¦x
i
2
f
i
= 2.662
11 2ª Edição Aula 10 Matemática e Realidade
Fonte: Dados fictícios
Atividade 5
A Tabela 4 mostra o percentual de indigentes, com base no Censo de 1991, dos
estados brasileiros. Calcule a variância apresentada por esses dados.
Fonte: Atlas do Desenvolvimento Humano no Brasil
Tabela 3 – Distribuição das médias trimestrais de Matemática, na amostra das turmas da 8
a
série/
manhã, na E. E. Nair Burégio, município de Carapeba, em abril de 2004.
Tabela 4 – Percentual de indigentes dos estados brasileiros, 1991.

1

8011 =
(8 4)

=4
=8

8011 =2 74 74
=8
8 7 (pontos)

.
Notas (médias) Nº de alunos (f
i
)
Ponto
médio (x
i
)
x
i
f
i
x
i
2
x
2
i
f
i
8 ` 4 2 8,ò 7,0 12,2ò 12,2ò

x 2 = 24,ò0
4 ` ò 8 4,ò 18,ò 20,2ò 20,2ò

x 8 = 60,70
ò ` 6 7 ò,ò 88,ò 80,2ò 80,2ò

x 7 = 211,7ò
6 ` 7 8 6,ò ò2,0 42,2ò 42,2ò

x 8 = 888,00
7 ` 8 14 7,ò 10ò,0 ò6,2ò ò6,2ò

x 14 = 787,ò0
8 ` 0 12 8,ò 102,0 72,2ò 72,2ò

x 12 = 867,00
0 ` 10 8 0,ò 76,0 00,2ò 00,2ò

x 8 = 722,00
TOTAL
ò4 804,0 8.011,ò0
% de indigentes
classes
Nº de Municípios
f
i
8 ` 11 8
11 ` 10 8
10 ` 27 ò
27 ` 8ò 6
8ò ` 48 4
48 ` ò1 1
TOTAL
20
12 Aula 10 Matemática e Realidade 2ª Edição
DESVIO-PADRÃO: (para dados populacionais) ou
s (para dados amostrais)
A variância é uma importante medida de dispersão, entretanto, seu resultado é dado
em unidade de medida que é o quadrado da original. Algumas dessas medidas não têm
nenhum sentido prático, como na atividade referente à mortalidade infantil. Como avaliar,
por exemplo, kg
2
, (Salário mínimo)
2
, anos
2
, pontos
2
etc.? Então, como alternativa para
contornar esse problema, existe uma medida denominada desvio-padrão, definida como a
raiz quadrada positiva da variância. Assim,
Considerando todos os cálculos anteriores obtidos para a variância, vamos calcular o
desvio-padrão.
No exemplo, das notas dos candidatos (cujos resultados da variância estão na página
9) temos:
Como podemos observar, o desvio-padrão associado ao candidato B é muito maior
do que os demais. Isso significa que as notas desse candidato apresentaram-se bastante
dispersas ao redor da média 6,0.
Para os dados referentes à Mortalidade Infantil, a variância e o respectivo desvio-padrão são:
Considerando as notas da amostra das turmas da 8
a
série/manhã, no teste objetivo, e
as médias trimestrais em Matemática, teremos os seguintes desvios-padrão:
Obs.: tanto a variância quanto o desvio-padrão são medidas largamente usadas
na Estatística Inferencial. Na Estatística Descritiva, que é o nosso caso, essas
medidas têm sentido, principalmente, quando comparamos conjunto de dados
de mesma natureza e que apresentam médias com valores aproximados.
Desvio-padrão populacional: ÷

;
Desvio-padrão amostral: ÷

.
Var(A)=

=

=

= ;
Var(B)=

=

=

= 4, 60 pontos;
Var(C)=

= , 888

=

, 888 = , 0 pontos.

8 (óbitos).
teste objetivo:

= 1, 2 =

1, 2 = 1, 8 pontos;
médias trimestrais:

= 8, 00 =

8, 00 = 1, 0 pontos.
13 2ª Edição Aula 10 Matemática e Realidade
Atividade 6
Calcule o desvio-padrão para os percentuais (%) de indigentes apresentados na
Tabela 4 (atividade 5).
Para entendermos melhor o desvio-padrão, imagine, por exemplo, o tempo de espera
numa fila de um banco durante uma semana típica. O tempo médio de espera dos clientes
durante esse período independe da fila ser única ou não. Entretanto, os clientes ficam muito
mais satisfeitos quando estão em fila única, uma vez que o tempo de espera, por não depender
de um caixa em particular, se distribui de forma mais homogênea ao redor do tempo médio.
Quando não há fila única, alguns clientes esperam mais do que outros, dependendo do caixa,
fato que causa insatisfação. Essa situação reflete que a tomada de decisão dos bancos ao se
optar por fila única, provavelmente se baseou em um estudo da variabilidade apresentada
pelo tempo de espera dos clientes, que, no caso da fila única, diminui bastante.
O desvio-padrão é a medida de dispersão mais utilizada, universalmente, na análise
de dados, tendo se tornado um apoio indispensável na tomada de decisão.
A seguir, apresentamos a Figura 1 que mostra uma distribuição de dados simétrica, ou
seja, que apresenta média, moda e mediana iguais. Nessas distribuições, verifica-se que cerca
de 68,26% dos dados estão a menos de 1 desvio-padrão da média; 95,45% dos dados estão
a menos de dois desvios padrão e 99,7% dos dados estão a menos de três desvios padrão. Os
valores que estão a mais de 3 desvios-padrão são considerados discrepantes dos demais.
Como entender o desvio-padrão?
95,45%
P
P2V P2V
Figura 1 – Distribuição simétrica
14 Aula 10 Matemática e Realidade 2ª Edição
Resumo
Os fenômenos que pesquisamos e exploramos com ferramentas estatísticas
estão associados a dados que se apresentam de forma variada. Estudar como
as observações coletadas estão se comportando em relação à variabilidade é de
grande importância para o conhecimento da variável pesquisada. Neste texto,
abordamos quatro medidas – amplitude total, desvio quartil, desvio-padrão e
variância – utilizadas no estudo da dispersão ou variabilidade de dados estatísticos.
Apresentamos o conceito e os cálculos referentes a cada uma delas. Mostramos
– com ênfase através de exemplos – o importante papel que elas desempenham
na descrição e análise de dados quantitativos. Encaminhamos várias situações
para auxiliar no estudo e compreensão deste tema.
Auto-avaliação
Abaixo, reproduzimos a tabela que mostra as médias de Matemática da amostra
das turmas da noite, apresentada na aula 6 (Gráficos representativos de uma
distribuição de freqüências):
1
Fonte: Dados Fictícios
Tabela 5 – Distribuição das médias trimestrais de Matemática, na amostra das turmas da 8
a
série/
noite, na E. E. Nair Burégio, município de Carapeba, em abril de 2004.
Assim, o conhecimento de uma medida de tendência central (a média) e de uma medida
de dispersão nos permite descrever com mais detalhes (e muito menor risco de equívocos)
um conjunto de dados.
Notas (médias) Nº de alunos (fi)
8 ` 4 6
4 ` ò 12
ò ` 6 14
6 ` 7 8
7 ` 8 ò
8 ` 0 4
0 ` 10 8
Total
ò2
15 2ª Edição Aula 10 Matemática e Realidade
Com base nessa Tabela, calcule a variância e o desvio-padrão e compare-os com essas
mesmas medidas calculadas no decorrer da aula para a amostra das turmas da manhã. Faça
comentários pertinentes ao contexto.
Os dados a seguir referem-se ao Índice de Desenvolvimento Humano (IDH) de
algumas capitais nordestinas, obtidos com dados dos Censos de 1991 e 2000.
Tabela 6 – Índice de Desenvolvimento Humano nos anos de 1991 e 2000 de algumas capitais
nordestinas.
Capitais IDH-1991 IDH-2000
Fortaleza 0,688 0,767
Maceió 0,660 0,724
Natal 0,689 0,762
Recife 0,715 0,780
Salvador 0,735 0,794
São Luís 0,707 0,766
Fonte: Atlas do Desenvolvimento Humano no Brasil
Obtenha, para cada ano, as seguintes medidas de variabilidade:
a) amplitude total;
b) variância;
c) desvio-padrão.
Faça comparações entre os anos de 1991 e 2000, usando as medidas calculadas.
2
Referências
AZEVEDO, P. R. Introdução à estatística. Natal: EDUFRN, 2005.
BARBETTA, P. A. Estatística aplicada às ciências sociais. Florianópolis: Ed. da UFSC, 2002.
MOORE, D. A estatística básica e sua prática. Tradução de Alfredo Alves de Farias. Rio de
Janeiro: LTC, 2000.
PEREIRA, W.; TANAKA, O. K. Estatística: conceitos básicos. 2.ed. São Paulo:
McGraw-Hill, 1990.
16 Aula 10 Matemática e Realidade 2ª Edição
PROGRAMA DAS NAÇÕES UNIDAS PARA O DESENVOLVIMENTO (PNUD). Atlas do
Desenvolvimento Humano no Brasil. Indicadores de Vulnerabilidade Familiar, 1991 e 2000,
municípios da microrregião Cariri Ocidental (Paraíba). Disponível em: <http://www.pnud.org.
br/> Acesso em 31/05/2005.
TOLEDO, G. L.; OVALLE, I. I. Estatística básica. 2.ed. São Paulo: Atlas, 1985.
TRIOLA, M. F. Introdução à estatística. Tradução de Alfredo Alves de Farias. 7.ed. Rio de
Janeiro: LTC, 1999.
Anotações

USA. Moreira.oneodddude.SEDIS Coordenadora da Produção dos Materiais Célia Maria de Araújo Projeto Gráfico Ivana Lima Revisores de Estrutura e Linguagem Eugenio Tavares Borges Marcos Aurélio Felipe Pedro Daniel Meirelles Ferreira Tatyana Mabel Nobre Barbosa Divisão de Serviços Técnicos Catalogação da publicação na Fonte.freefoto. San Rafael.com – www. 1. 1895 Francisco Blvd. Proporção e porcentagem. 2. . Medidas de dispersão.com FreeStockPhotos.com FreeImages – www. – Natal. Jeanete Alves Moreira.pixelperfectdigital. 5.com Free Pictures Photos – www.net – www. Pereira. 4.morguefile. RN: EDUFRN Editora da UFRN. 292 p. MasterFile – www.com Pixel Perfect Digital – www. Marcelo Gomes. Ivone da Silva. East. UFRN/Biblioteca Central “Zila Mamede” Salsa. CA 94901. 3. Marcelo Gomes Pereira. III.freeimages.com OneOddDude.UFRN MasterClips IMSI MasterClips Collection. Título.bigfoto.com – www. I. Matemática e realidade: interdisciplinar / Ivone da Silva Salsa. ISBN 85-7273-287-X RN/UF/BCZM CDD 519.cpom MorgueFile – www. Nenhuma parte deste material pode ser utilizada ou reproduzida sem a autorização expressa da UFRN . Dados estaísticos. II.fre-pictures-photos.uk FreeFoto.5 CDU 519. 2005.22 2005/47 27/06/2007 Copyright © 2007 Todos os direitos reservados.Governo Federal Presidente da República Luiz Inácio Lula da Silva Ministro da Educação Fernando Haddad Secretário de Educação a Distância – SEED Ronaldo Motta Revisoras de Língua Portuguesa Janaina Tomaz Capistrano Sandra Cristinne Xavier da Câmara Ilustradora Carolina Costa Editoração de Imagens Adauto Harley Carolina Costa Diagramadores Bruno Cruz de Oliveira Maurício da Silva Oliveira Júnior Mariana Araújo Brito Thaisa Maria Simplício Lemos Imagens Utilizadas Banco de Imagens Sedis (Secretaria de Educação a Distância) . Jeanete Alves.freestockphotos.Universidade Federal do Rio Grande do Norte. Métodos estatísticos.masterfile.co. Análise estatística.com BigFoto – www.net Universidade Federal do Rio Grande do Norte Reitor José Ivonildo do Rêgo Vice-Reitor Nilsen Carvalho Fernandes de Oliveira Filho Secretária de Educação a Distância Vera Lúcia do Amaral Secretaria de Educação a Distância.

centrais do conjunto estudado e não nos dão informações sobre como os dados estão dispostos ao redor delas. É justamente esse o assunto que abordaremos nesta aula.Apresentação N a aula 8. informações sobre o comportamento de dados. podemos ter distribuições bem diferentes. 2ª Edição Aula 10 Matemática e Realidade 1 . porém com a mesma média. Entretanto. Isso pode. Uma medida de centro – as referidas acima – não dá esclarecimentos para perguntas do tipo: os dados estão muito concentrados ao redor da média? Da mediana? Será que eles se apresentaram muito dispersos em relação a essas medidas? As respostas para tais questionamentos podem ser obtidas através das Medidas de Dispersão (ou Medidas de Variabilidade). Objetivos Buscamos com esta aula. a compreender a elaboração de seus cálculos e a forma de interpretá-las. Procuraremos também fazê-lo apreender a importância de tais medidas para a descrição e análise de observações numéricas. assim como as medidas de tendência central. ajudá-lo a construir os conceitos relacionados às medidas de dispersão. inclusive. desvio quartil. por exemplo. Daí. variância e desvio-padrão. O conhecimento delas. assim como. Estudaremos as seguintes medidas de dispersão: amplitude total. são indispensáveis para a descrição do comportamento dos dados estudados. portanto. de forma condensada. conduzir a interpretações equivocadas. tais medidas referem-se a valores típicos. moda e mediana – representam. vimos como as Medidas de tendência central – média. Elas. nos possibilita melhor capacidade de análise sobre o fenômeno/fato pesquisado.

Esses três concorrentes.Descobrindo o comportamento de dados quantitativos C onsidere. vemos que.0 pontos nas quatro disciplinas. pois suas notas coincidem exatamente com ela. podemos dizer que as suas notas foram valores não muito diferentes. Concluímos então. A. não teve bom desempenho em Informática. porque seus valores estão muito dispersos em relação a ela.0 porque suas outras notas (Matemática e Inglês) compensaram esse baixo rendimento. além disso. por exemplo.0 ou não. suas notas não estão muito afastadas do valor médio. se submetem a um teste de seleção para uma bolsa de apoio técnico. que mesmo uma descrição mais simples de um conjunto de observações numéricas deve ser feita a partir de. B e C. Será que. em relação à média . Não podemos saber se as pontuações dos candidatos foram valores muito próximos da média x = 6. sobretudo quando precisamos fazer comparações. como exemplo. a seguinte situação: três universitários. com essa informação. mas foram escolhidas quatro para avaliar os candidatos: Português. que esses candidatos conseguiram os seguintes resultados para as provas de Português. O valor médio somente foi igual a 6. pelo menos. Imagine. x = 6. aconteceram seis provas. Assim. Quanto ao candidato C. Inglês elementar e Informática. será que apresentaram desempenho semelhante em tais matérias? Ora. nessas provas? Em outras palavras. Portanto. Já o candidato B parece ter pouco conhecimento em Português e. Nesse teste. essa medida de tendência central (ao contrário do candidato A) não representa tão bem o conjunto das notas do candidato B. no final. em cada conjunto. Analisar dados apoiando-nos apenas no resultado de 2 Aula 10 Matemática e Realidade 2ª Edição . Matemática básica. Essa é uma das possíveis situações que podem ocorrer quando descrevemos conjuntos de dados. ficaram com a mesma média. somente com a informação da média não temos condições de responder a essa questão. elas também estão bem representadas por essa medida. pontos. o candidato A está muito bem representado por essa medida. nesta ordem: A= B= C= Observando atentamente as notas. Ela nos mostra como é necessário e importante ter as informações sobre a dispersão dos dados que buscamos analisar. Inglês elementar e Informática. Matemática básica. uma medida de Tendência Central e uma medida de Dispersão.

0 Como podemos ver. pouca variação. os extremos. 2ª Edição Aula 10 Matemática e Realidade 3 . Ou seja.uma média (ou moda ou mediana). em B. nos dá apenas uma “rápida” indicação da dispersão e.0 − 5. enquanto as do candidato A apresentaram dispersão nula e. tem pouca utilidade quando queremos dispor de informações mais apuradas sobre a variabilidade dos dados. e em C.0 = 9. AT = (maior valor) − (menor valor) Quando estudamos as distribuições de freqüências. pode nos levar a conclusões equivocadas. as notas do candidato B apresentaram uma dispersão muito mais alta que as dos demais. apresentaram grande variabilidade. Estudaremos as seguintes: AMPLITUDE TOTAL : AT DESVIO QUARTIL : Dq VARIÂNCIA : 2 (para dados populacionais) ou s2 (para dados amostrais) DESVIO-PADRÃO : (para dados populacionais) ou S (para dados amostrais) Observação – (letra grega – sigma minúsculo) AMPLITUDE TOTAL: AT É a medida de dispersão mais simples que existe. a dispersão foi pequena. conseqüentemente. Isso significa que os dados em A não variaram. na aula 5 (Dados quantitativos: como organizá-los?) Vimos essa medida. o resultado dessa medida é: candidatos: A B C AT = 6.0 = 2. como vimos.0 = 0 AT = 10. observados nesse conjunto. Seu cálculo baseia-se apenas em dois valores de um conjunto numérico. Portanto. lembra? No caso desse exemplo. Por isso. e não considera os demais. Definimos a Amplitude total (AT) de um conjunto numérico como o resultado da diferença entre o maior e o menor valor.0 AT = 7. dados estatísticos. as medidas de dispersão são muito importantes e nos ajudam bastante a entender. com maior clareza.0 − 6.0 − 1. em relação ao C.

vimos que os quartis dividem um conjunto de dados ordenados em 4 partes iguais. Com esses valores. que trata das separatrizes. ) se encontram 50 (a metade) dos O desvio quartil ( ) se baseia nesses dois quartis: obtém por meio da expressão: e . o desvio quartil será: pontos.2 e Q3= 8. Ele é o resultado que se Vamos ver um exemplo? Retome a aula 9. Qual dessas duas amostras apresenta maior variação em relação a seus dados? 4 Aula 10 Matemática e Realidade 2ª Edição . Com base na distribuição das médias de Matemática na amostra das turmas da manhã (Tabela 1). Esquematicamente. entre elas os três quartis para as notas de Matemática da amostra das turmas da noite. a primeira questão solicitava que você calculasse algumas separatrizes. entre o 1o quartil ( ) e o 3o ( valores centrais de um conjunto de dados.5. encontramos: Q1= 6. Atividade 1 Na auto-avaliação da aula 9.DESVIO QUARTIL: Dq Quando estudamos as separatrizes na aula 9 (As separatrizes na análise de dados estatísticos). temos: Como vemos. calcule o desvio quartil para essa distribuição e compare seu resultado com o da amostra da manhã que acabamos de calcular. Então. nesse caso.

(No caso. em relação à sua média é sempre igual a zero. e somente se. 2ª Edição Aula 10 Matemática e Realidade 5 . Dessa forma. exceto se. Mas. não é mesmo? Então. Diante disso. sempre. Para contornar esse problema. Esse resultado significa que a média é uma medida que reflete o ponto de equilíbrio dos dados. média . talvez nós pudéssemos usar essa soma como uma medida de dispersão.VARIÂNCIA: σ2 (para dados populacionais) ou 2 s (para dados amostrais) Essa medida de dispersão. a soma do quadrado de todos os desvios nunca será nula. qualquer resultado negativo passa a ser positivo. então. em relação à média. todos os valores do conjunto coincidirem com a média (esse fato indicará que não há dispersão entre os dados). pois o expoente dois simplifica os cálculos). ela considera. maior deve ser a soma desses desvios. a soma dos desvios não pode servir como uma medida para nos informar sobre a dispersão dos dados. pois. é baseada nos desvios de cada valor observado. Isso é uma propriedade da média. podemos considerar os desvios ao quadrado. quanto mais os valores de uma série se distanciarem da sua média. calcular os desvios em relação ) para as notas de cada candidato (A. em relação à média ( ). podemos: ou considerar o valor absoluto desses desvios (função módulo) ou elevar cada um deles a um expoente par. todas as observações do conjunto estudado. B e C). assim. Portanto. o que quer dizer “desvios em relação à média”? Definimos desvio em relação à média ( ) como sendo o valor obtido pela expressão: média Parece intuitivo que. Vamos. somar os desvios em cada à média ( conjunto e ver o que podemos concluir? Acompanhe os cálculos: Desvios x x x x x x x x A B C Soma dos Desvios Todas as somas foram iguais a zero! Será isso pura coincidência? Não. Em qualquer situação. muito utilizada na estatística mais avançada. além dessa medida de tendência central. teremos: a soma dos desvios dos valores de um conjunto. Portanto.

o denominador é n−1. o cálculo da variância é obtido através das fórmulas: para dados populacionais: (equação 1). Entretanto. utilizar apenas a soma do quadrado dos desvios para comparar situações pode nos levar a grandes equívocos. Daí vem. a definição matemática dessa medida de dispersão.Porém. Atividade 2 Vamos calcular o quadrado dos desvios para os conjuntos A. justamente. Essa pequena modificação proporciona uma estimativa melhor para a variância. 6 Aula 10 Matemática e Realidade 2ª Edição . Variância para dados não tabelados Quando os dados são isolados (não tabelados). como podemos usar os desvios para medir a dispersão dos dados? Uma maneira simples é utilizar a média aritmética do quadrado desses desvios (isso na realidade é a média quadrática dos desvios). não apresentaremos a prova desse fato. A variância de um conjunto qualquer de valores é a média quadrática dos desvios tomados em relação à média desse conjunto. Note que. e não faz parte dos objetivos deste curso. quando os conjuntos de dados tiverem números diferentes de elementos. Diante disso. e amostrais: (equação 2). B e C e depois somá-los para obter a variância? Faça os cálculos e em seguida confira com os resultados apresentados na tabela seguinte. na equação (2) (dados amostrais). visto que requer um nível mais avançado de conhecimentos na área da Inferência Estatística.

Daí concluímos que seus valores não estão muito concentrados ao redor da sua média. e a outra. elas. Como exemplo. 2ª Edição Aula 10 Matemática e Realidade 7 . exigem cálculos bastante simples. Essas taxas representam a mortalidade de crianças menores de 1 ano em 1. podemos reescrevê-las.Desvios x x x x x x A B C Soma Calcularemos s2.000 nascidos vivos.: deixe sempre o resultado da variância com pelo menos 4 casas decimais. relativos às taxas de Mortalidade Infantil até 1 ano. Você precisa apenas calcular duas somas: uma. respectivamente para 2 e s . temos: (pontos) (pontos) . ao total de todos os dados. Desenvolvendo-se algebricamente as expressões (1) e (2). Obs. pois isso será importante para o cálculo do desvio-padrão que veremos mais adiante. pois as quatro disciplinas escolhidas constituem uma amostra das seis. Portanto. dos 8 municípios que compõem a região metropolitana de Natal. referente ao quadrado de cada observação. da forma: (equação 3) e (equação 4) Embora essas novas fórmulas possam parecer mais complicadas. Podemos ver que o conjunto B apresentou uma variabilidade muito maior que os demais. na verdade. vamos calcular a variância para os dados do Censo de 2000. e após as devidas 2 simplificações.

portanto nunca será um número negativo. 8 Aula 10 Matemática e Realidade 2ª Edição . quanto maior a variância (quanto mais distante do zero). maior é a dispersão dos dados em relação à média.41 38.86 40.53 48. xi xi xi xi óbitos A variância é uma medida de dispersão que assume valores maiores ou iguais a zero. Atividade 3 Os dados apresentados a seguir foram obtidos do Atlas de Desenvolvimento Humano no Brasil e referem-se ao percentual* de analfabetismo funcional (menos de quatro anos de estudo) de pessoas com 15 anos ou mais em seis municípios da microrregião de Sousa (Paraíba). Para efeito de análise. porque é uma média quadrática. dos anos: 1991: 73 67 70 60 69 77 2000: 57 57 62 53 61 68 *Esses percentuais foram arredondados para facilitar os cálculos.26 36. Calcule a média e a variância para cada ano.Os dados são: 48.96 36.16 43.99 Para facilitar os cálculos.10 35. comparando os resultados dos mesmos em relação à variabilidade dos dados. construímos a tabela a seguir: Tabela 1 – Cálculos auxiliares para obtenção da variância.

que representa exatamente a quantidade de valores assumidos pela variável estudada ou o número de intervalos. isto significa que: k = 6. temos. 2ª Edição Aula 10 Matemática e Realidade 9 . Observe que as duas últimas colunas da tabela são suficientes para a obtenção dos valores que serão utilizados na fórmula da variância. Os valores xi são substituídos pelos pontos médios dos intervalos quando se trabalha com dados agrupados em classes. as seguintes fórmulas para a variância populacional e para a amostral: (equação 5) e (equação 6) Observe que agora trabalharemos com as freqüências e que a variação do índice no somatório vai de 1 a k.Variância para dados agrupados em tabelas de freqüências Para dados agrupados em distribuições de freqüências. Exemplo 1 Retomaremos a aula 5 em que temos a pontuação no teste objetivo de Matemática numa amostra de 54 alunos da 8ª série/manhã. Vamos acompanhar duas situações através dos exemplos 1 e 2 para que você possa se familiarizar melhor com as fórmulas apresentadas. Veja também que a variável pontuação (Xi) assume 6 valores distintos. exposta na Tabela 2. respectivamente. quando trabalhamos com dados agrupados em classes. que a seguir apresentamos.

município de Carapeba. em situações como esta. 10 Aula 10 Matemática e Realidade 2ª Edição . E. foram acrescentadas as três últimas colunas. calcularemos s2 ao invés de . Pontuação xi Nº de alunos fi xi fi x i fi TOTAL Fonte: Dados fictícios fi f xi fi xi fi Como se trata de uma amostra. Você se lembra que. Atividade 4 Na aula 8. calcule a variância e compare o resultado com o que acabamos de encontrar. tal como foi feito no exemplo 1. Nair Burégio. em abril de 2004. pedimos para você calcular a média para a pontuação no teste objetivo de Matemática na amostra das turmas da 8ª série/noite. deveremos aplicar a equação (6): pontos . Exemplo 2 A Tabela 3 que segue exibe dados agrupados em intervalos de classe. Agora que temos todos os elementos. xi se refere ao ponto médio de cada intervalo e representa todos os valores contidos em sua respectiva classe? Para facilitar os cálculos da variância.Tabela 2 – Pontuação no teste objetivo de Matemática. nesse caso (dados agrupados em classes). Agora. na E. Vamos aprender como se calcula a variância. na amostra das turmas da 8a série/manhã.

município de Carapeba. 1991. Calcule a variância apresentada por esses dados. na amostra das turmas da 8a série/ manhã. % de indigentes classes Nº de Municípios fi TOTAL Fonte: Atlas do Desenvolvimento Humano no Brasil 2ª Edição Aula 10 Matemática e Realidade 11 . Tabela 4 – Percentual de indigentes dos estados brasileiros. Nair Burégio. E. com base no Censo de 1991. dos estados brasileiros. na E.Tabela 3 – Distribuição das médias trimestrais de Matemática. Atividade 5 A Tabela 4 mostra o percentual de indigentes. Notas (médias) Nº de alunos (fi ) Ponto médio (xi) xi fi xi x i fi TOTAL Fonte: Dados fictícios pontos . em abril de 2004.

que é o nosso caso.DESVIO-PADRÃO: (para dados populacionais) ou s (para dados amostrais) A variância é uma importante medida de dispersão. Algumas dessas medidas não têm nenhum sentido prático. existe uma medida denominada desvio-padrão. pontos. definida como a raiz quadrada positiva da variância. kg2. como na atividade referente à mortalidade infantil. 12 Aula 10 Matemática e Realidade 2ª Edição .0. principalmente. entretanto. seu resultado é dado em unidade de medida que é o quadrado da original. Para os dados referentes à Mortalidade Infantil. a variância e o respectivo desvio-padrão são: (óbitos ). Como avaliar. No exemplo. . Desvio-padrão populacional: Desvio-padrão amostral: . (Salário mínimo)2. das notas dos candidatos (cujos resultados da variância estão na página 9) temos: Var(A) Var(B) Var(C) . quando comparamos conjunto de dados de mesma natureza e que apresentam médias com valores aproximados. teremos os seguintes desvios-padrão: teste objetivo: médias trimestrais: pontos. por exemplo. vamos calcular o desvio-padrão. Considerando as notas da amostra das turmas da 8a série/manhã. Considerando todos os cálculos anteriores obtidos para a variância.? Então. pontos2 etc. Como podemos observar.: tanto a variância quanto o desvio-padrão são medidas largamente usadas na Estatística Inferencial. no teste objetivo. Na Estatística Descritiva. pontos. Obs. e as médias trimestrais em Matemática. o desvio-padrão associado ao candidato B é muito maior do que os demais. Assim. pontos. essas medidas têm sentido. anos2. Isso significa que as notas desse candidato apresentaram-se bastante dispersas ao redor da média 6. como alternativa para contornar esse problema.

imagine. alguns clientes esperam mais do que outros. dependendo do caixa. se distribui de forma mais homogênea ao redor do tempo médio. na análise de dados. Os valores que estão a mais de 3 desvios-padrão são considerados discrepantes dos demais.45% dos dados estão a menos de dois desvios padrão e 99.26% dos dados estão a menos de 1 desvio-padrão da média. no caso da fila única. Nessas distribuições. diminui bastante. universalmente. 95. Como entender o desvio-padrão? Para entendermos melhor o desvio-padrão. que.45% 2 Figura 1 – Distribuição simétrica 2 2ª Edição Aula 10 Matemática e Realidade 13 . moda e mediana iguais.7% dos dados estão a menos de três desvios padrão. por exemplo. fato que causa insatisfação.Atividade 6 Calcule o desvio-padrão para os percentuais (%) de indigentes apresentados na Tabela 4 (atividade 5). O tempo médio de espera dos clientes durante esse período independe da fila ser única ou não. Entretanto. A seguir. por não depender de um caixa em particular. apresentamos a Figura 1 que mostra uma distribuição de dados simétrica. Essa situação reflete que a tomada de decisão dos bancos ao se optar por fila única. uma vez que o tempo de espera. verifica-se que cerca de 68. Quando não há fila única. 95. os clientes ficam muito mais satisfeitos quando estão em fila única. que apresenta média. O desvio-padrão é a medida de dispersão mais utilizada. tendo se tornado um apoio indispensável na tomada de decisão. ou seja. o tempo de espera numa fila de um banco durante uma semana típica. provavelmente se baseou em um estudo da variabilidade apresentada pelo tempo de espera dos clientes.

desvio quartil. apresentada na aula 6 (Gráficos representativos de uma distribuição de freqüências): Tabela 5 – Distribuição das médias trimestrais de Matemática. Mostramos – com ênfase através de exemplos – o importante papel que elas desempenham na descrição e análise de dados quantitativos. reproduzimos a tabela que mostra as médias de Matemática da amostra das turmas da noite.Assim. na E. Notas (médias) Nº de alunos (fi) Total Fonte: Dados Fictícios 14 Aula 10 Matemática e Realidade 2ª Edição . Apresentamos o conceito e os cálculos referentes a cada uma delas. Neste texto. Auto-avaliação 1 Abaixo. Resumo Os fenômenos que pesquisamos e exploramos com ferramentas estatísticas estão associados a dados que se apresentam de forma variada. na amostra das turmas da 8a série/ noite. Estudar como as observações coletadas estão se comportando em relação à variabilidade é de grande importância para o conhecimento da variável pesquisada. E. o conhecimento de uma medida de tendência central (a média) e de uma medida de dispersão nos permite descrever com mais detalhes (e muito menor risco de equívocos) um conjunto de dados. Encaminhamos várias situações para auxiliar no estudo e compreensão deste tema. em abril de 2004. abordamos quatro medidas – amplitude total. Nair Burégio. município de Carapeba. desvio-padrão e variância – utilizadas no estudo da dispersão ou variabilidade de dados estatísticos.

1990. Tradução de Alfredo Alves de Farias.762 0. para cada ano. da UFSC. Tabela 6 – Índice de Desenvolvimento Humano nos anos de 1991 e 2000 de algumas capitais nordestinas. Faça comparações entre os anos de 1991 e 2000. usando as medidas calculadas.. 2 Os dados a seguir referem-se ao Índice de Desenvolvimento Humano (IDH) de algumas capitais nordestinas. MOORE. A.707 IDH-2000 0. variância. BARBETTA. 2000. Referências AZEVEDO. desvio-padrão. 2. 2ª Edição Aula 10 Matemática e Realidade 15 . Estatística aplicada às ciências sociais. as seguintes medidas de variabilidade: a) b) c) amplitude total. Estatística: conceitos básicos. 2002.Com base nessa Tabela. R. W.660 0. K.766 Obtenha. Introdução à estatística.724 0. calcule a variância e o desvio-padrão e compare-os com essas mesmas medidas calculadas no decorrer da aula para a amostra das turmas da manhã. Rio de Janeiro: LTC. Florianópolis: Ed. O. Faça comentários pertinentes ao contexto.ed. 2005.715 0.780 0.688 0. TANAKA. A estatística básica e sua prática.689 0. PEREIRA.767 0. São Paulo: McGraw-Hill. Capitais Fortaleza Maceió Natal Recife Salvador São Luís Fonte: Atlas do Desenvolvimento Humano no Brasil IDH-1991 0.735 0. P. obtidos com dados dos Censos de 1991 e 2000.794 0. Natal: EDUFRN. P. D.

municípios da microrregião Cariri Ocidental (Paraíba). F. Rio de Janeiro: LTC. I. M. 1991 e 2000. Indicadores de Vulnerabilidade Familiar. TRIOLA.pnud. TOLEDO. 1985. G. L. OVALLE. 2.ed.. Atlas do Desenvolvimento Humano no Brasil. Disponível em: <http://www. Estatística básica.PROGRAMA DAS NAÇÕES UNIDAS PARA O DESENVOLVIMENTO (PNUD). Introdução à estatística. Tradução de Alfredo Alves de Farias.org. São Paulo: Atlas. br/> Acesso em 31/05/2005.ed. 7. 1999. Anotações 16 Aula 10 Matemática e Realidade 2ª Edição . I.