Title: Bioestat
1 BIOESTATÍSTICA
Curso de Graduação em Psicologia
Prof. Hubert Chamone
Gesser, Dr.
Graduação em Odontologia - UFSC
Graduação em
Administração - ESAG/UDESC
Especialização em Odontologia em Saúde
Coletiva - ABO/SC
Doutorado e Mestrado em Engenharia de Produção -
UFSC
2 - SUMÁRIO -
Amostragem
Conceitos Básicos em Bioestatística
Tabelas e Gráficos
Conhecendo os Dados
Medidas de Tendência Central
Distribuição Normal
Correlação
Medidas de Ordenamento
Teste de Diferença entre Médias
Medidas de Dispersão
BIOESTATÍSTICA
3 Conceitos Básicos em Bioestatística
Disciplina de Bioestatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
4BIOESTATÍSTICA
ESTATÍSTICA
O primeiro uso da palavra ESTATÍSTICA
parece datar de 1589 e apareceu em um trabalho
do historiador Girolomo Ghilini, quando se
referiu a uma ciência civil, política,
estatística e militar. (Berquó, 1981)
Origem no latim status (estado)
isticum (contar) Informações referentes ao
estado Coleta, Organização, Descrição, Análise e
Interpretação de Dados
5BIOESTATÍSTICA
O Que é Estatística?
Para Sir Ronald A. Fisher (1890-1962)
Estatística é o estudo das populações, das
variações e dos métodos de redução de dados.
6BIOESTATÍSTICA
O Que é Estatística?
- Eu gosto de pensar na Estatística como a
ciência de aprendizagem a partir dos dados...
Jon KettenringPresidente da American
Statistical Association, 1997
7BIOESTATÍSTICA
O Que é Estatística (definição)?
-
- Estatística é um conjunto de técnicas
e métodos que nos auxiliam no processo de tomada
de decisão na presença de incerteza.
8BIOESTATÍSTICA
LIVROS DE ESTATÍSTICA
9BIOESTATÍSTICA
- As diferenças são atribuídas a causas erradas
- As coincidências ocorrem frequentemente
- As pessoas tem dificuldades com probabilidades
- Acrescentam polimento às publicações
- Faz conhecer o grau de confiança das
conclusões.
10BIOESTATÍSTICA
As variabilidades mostram que existem diferenças
Alta Expectativa de Vida Boas Condições
Sanitárias Hábitos de Consumo Assistência em Saúde
Doenças Infecciosas Alta Mortalidade
Infantil Baixa Escolaridade Iniquidades em Saúde
Indicadores Sociais Diferentes
11BIOESTATÍSTICA
EXPECTATIVA DE VIDA - Diferenças entre os países
12BIOESTATÍSTICA
RENDA PER CAPITA NO BRASIL (PNUD, 2000)
13BIOESTATÍSTICA
RENDA PER CAPITA EM SANTA CATARINA (PNUD, 2000)
14BIOESTATÍSTICA
ACESSO AO ENSINO SUPERIOR NO BRASIL (PNUD, 2000)
15BIOESTATÍSTICA
ACESSO AO ENSINO SUPERIOR EM SANTA CATARINA
(PNUD, 2000)
16BIOESTATÍSTICA
GRÁFICO DE DISPERSÃO RENDA x EDUCAÇÃO (PNUD,
2000)
17BIOESTATÍSTICA
FONTES DEMOGRÁFICAS Bancos de Dados (OMS,
OPAS, MS, IBGE, etc) Indicadores Sociais (IDH,
GINI, QV) Pesquisas de Mercado (Hábitos de
Consumo) Censos Demográficos Pesquisa Nacional
por Amostra de Domicílios (PNAD) Programa das
Nações Unidas para o Desenvolvimento (PNUD)
18BIOESTATÍSTICA
POPULAÇÃO Conjunto de elementos que se
deseja estudar AMOSTRA Subconjunto da
população Nem sempre o Censo é viável (questões
econômicas) É mais barato coletar dados de
amostras
19BIOESTATÍSTICA
POPULAÇÃO Também chamada de Universo
AMOSTRA Parte da população
População
Amostra
20BIOESTATÍSTICA
POPULAÇÃO (N) Todos os estudantes
da FESSC AMOSTRA (n) Parte dos
estudantes da FESSC
Plano de Amostragem
21BIOESTATÍSTICA
REQUISITOS DE UMA AMOSTRA 1) Ter um tamanho
adequado (previamente calculado) Existem
fórmulas para o cálculo do adequado tamanho da
amostra 2) Constituintes selecionados ao acaso
(sorteio)
22BIOESTATÍSTICA
CLASSIFICAÇÃO DO TAMANHO DA AMOSTRA Amostras
Grandes n gt 100 Amostras Médias n gt 30
(30 lt n lt 100) Amostras Pequenas n lt 30
(12 lt n lt 30) Amostras Muito Pequenas n lt 12
Observação As amostras com n gt 30 geram
melhores resultados. O tamanho
adequado deve ser pré-calculado.
23BIOESTATÍSTICA
Áreas da Estatística
Amostragem e Planejamento de Experimentos (coleta
dos dados) Estatística Descritiva (organização,
apresentação e sintetização dos
dados) Estatística Inferencial (testes de
hipóteses, estimativas, probabilidades)
24BIOESTATÍSTICA
- Amostragem e Planejamento de Experimentos
- (coleta dos dados)
- - É o processo de escolha da amostra
- - É o início de qualquer estudo estatístico
- Consiste na escolha criteriosa dos elementos a
serem submetidos ao estudo - Exemplos Pesquisa sobre tendência de votação
- Cuidado Perfil da Amostra Perfil da
População
25BIOESTATÍSTICA
- Estatística Descritiva
- (organização, apresentação e sintetização dos
dados) - É a parte mais conhecida
- Diariamente veiculada na mídia (jornais,
televisão, rádio) - Distribuições de frequência, médias, tabelas,
gráficos - Exemplos de Analfabetos em uma comunidade
- Índice de Mortalidade Infantil (por mil
nascimentos) - Índice de Desenvolvimento Humano
26BIOESTATÍSTICA
Estatística Descritiva Distribuição
Populacional de uma Região
27BIOESTATÍSTICA
- Estatística Inferencial, Indutiva ou Analítica
- (testes de hipóteses, estimativas)
- Auxilia o processo de tomada de decisões
- Responde uma dúvida, compara grupos
- Testam-se 2 hipóteses (hipótese nula e hipótese
alternativa), sendo que uma delas será aceita
mediante a aplicação de um teste estatístico
baseado na teoria das probabilidades. - Exemplo O tabagismo está associado à doença
pulmonar? - Hipóteses Nula (não há associação),
Alternativa (há associação)
28BIOESTATÍSTICA
EXERCÍCIO No 1 Em uma cidade de 500.000
habitantes onde 45 das pessoas tem título de
eleitor, realizou-se uma pesquisa eleitoral com
2000 pessoas. Qual o tamanho da população de
estudo e da amostra?
29BIOESTATÍSTICA
EXERCÍCIO No 2 Uma amostra de apenas 3000
eleitores pode fornecer um perfil confiável sobre
a preferência de todo o eleitorado, na véspera de
uma eleição presidencial? Por que?
30BIOESTATÍSTICA
EXERCÍCIO No 3 Você considera a pesquisa
proposta no exercício anterior como experimental
ou de levantamento? Por quê?
31BIOESTATÍSTICA
EXERCÍCIO No 4 Elabore uma situação em que
a estatística possa ser empregada em benefício de
uma organização.
32 Conhecendo os Dados
Disciplina de Bioestatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
33BIOESTATÍSTICA
TIPOS DE DADOS
-
- Dados Nominais (Sexo, Raça, Cor dos Olhos)
- Dados Ordinais (Grau de Satisfação)
- Dados Numéricos Contínuos (Altura, Peso)
- Dados Numéricos Discretos (Número de Filiais)
-
- Estatísticas aplicadas em alguns tipos de dados
- não podem ser aplicadas a outros .
34BIOESTATÍSTICA
TIPOS DE DADOS
-
- Dados Intervalares (Temperatura oC)
- Quando se referem a valores obtidos mediante a
aplicação de uma unidade de medida arbitrária,
porém constante e onde o zero é relativo. Este
tipo de dado tem restrições a cálculos. - 30oC não é três vezes mais quente que 10oC
- Para cálculos se utiliza a escala Kelvin
35BIOESTATÍSTICA
ARREDONDAMENTO DE DADOS CONTÍNUOS
1ª Regra Arredondar para o número mais próximo
2ª Regra Arredondar para o par mais
próximo 5,0 5,5 6,0 6,0 6,5 7,
0
36BIOESTATÍSTICA
EXERCÍCIO No 1 Faça os seguintes
arredondamentos 38,648 para o centésimo
mais próximo 38,65 54,76 para o
décimo mais próximo 54,8 27,465 para o
centésimo mais próximo 27,46 42,455 para o
centésimo mais próximo 42,46 4,5 para o inteiro
mais próximo 4
37BIOESTATÍSTICA
AGRUPAMENTO DE DADOS POR VALORES DISTINTOS
x f (frequência) 2 3 3 3 4 4
5 9 6 6 7 2 8 1 Total 28
8 2 5 6 5 6 5 4 3 7 5 6 5 4 7 2 5
4 6 5 3 6 5 4 2 5 3 6
38BIOESTATÍSTICA
AGRUPAMENTO DE DADOS POR CLASSES
Classes f (frequência) Ponto Médio 39
50 4 44,5 50 61 5 55,5 61
72 5 66,5 72 83 6 77,5 83
94 5 88,5
39BIOESTATÍSTICA
POLÍGONO DE FREQUÊNCIA
f
x f 2 3 3 3 4 4 5 9
6 6 7 2 8 1 Total 28
10 8 6 4 2
x
2 3 4 5 6 7 8
40BIOESTATÍSTICA
EXERCÍCIO No 2 Em uma amostra de estudantes
foram coletadas as seguintes alturas em metros
1,70 1,58 1,67 1,72 1,70 1,71 1,75 1,58
1,64 1,66 1,72 1,70 1,73 1,82 1,79 1,77
1,76 1,75 1,73 1,65 1,64 1,63 1,62 1,66
1,71 1,68 1,69 1,70 1,59 1,61 1,64 1,76
1,64 1,70 1,64 1,65 1,7 1,79 1,8 1,70
1,67 1,71 1,72 1,63 1,70 a) Qual foi o
tamanho da amostra (n)? b) Qual é a altura do
sujeito mais alto e a do mais baixo? c) Faça o
agrupamento de dados por valores distintos. d)
Faça o agrupamento por 6 classes. e) Faça o
polígono de frequência p/ o agrupamento por
classes.
41BIOESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal Análise Vertical
Assimétrica Positiva (esquerda)
Leptocúrtica (alta) Simétrica
Mesocúrtica Assimétrica Negativa (direita)
Platicúrtica (baixa) Análise
Conjunta Assimétrica Positiva Leptocúrtica
Simétrica Mesocúrtica Curva de Gauss Curva
Normal
42BIOESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal Assimétrica Positiva
(esquerda)
f
x
43BIOESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal Simétrica
f
x
44BIOESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal Assimétrica Negativa
(direita)
f
x
45BIOESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical Leptocúrtica (alta)
f
x
46BIOESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical Mesocúrtica
f
x
47BIOESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical Platicúrtica (baixa)
f
x
48BIOESTATÍSTICA
DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS
Apresentam-se os valores absolutos e as
porcentagens Podem ser usadas tabelas ou
gráficos
Gráfico de Barras
Gráfico Circular
49BIOESTATÍSTICA
DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS
Gráfico de Linhas (não é usado restrito a dados
contínuos)
Gráfico de Barras Horizontal
50BIOESTATÍSTICA
DESCRIÇÃO DOS DADOS CONTÍNUOS
Trazem informações que expressam a tendência
central e a dispersão dos dados. Tendência
Central Média ( x ), Mediana ( Md ), Moda ( Mo
) Medidas de Dispersão Desvio Padrão,
Variância, Amplitude, Coeficiente de
Variação, Valor Máximo, Valor Mínimo
51BIOESTATÍSTICA
EXERCÍCIO No 3 Em uma pesquisa com jogadoras de
basquete foram coletados os seguintes pesos
corporais em quilogramas 65 66 62 66 63
61 67 63 64 62 68 67 65 64 65 66 63
64 65 66 64 63 64 66 65 63 64 65 64
63 64 63 64 68 69 70 a) Qual foi o tamanho
da amostra (n)? b) Qual é o maior peso e o
menor? c) Faça o agrupamento de dados por valores
distintos. d) Faça o agrupamento em 3 classes. e)
Faça o polígono de frequência p/ o agrupamento
por classes. f) A curva de frequência encontrada
se assemelha a normal?
52 Medidas de Tendência Central
Disciplina de Bioestatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
53BIOESTATÍSTICA
MEDIDAS DE TENDÊNCIA CENTRAL
Nos dão uma idéia de onde se localiza o
centro, o ponto médio de um determinado conjunto
de dados. Medidas Média, Moda e Mediana.
f
x
54BIOESTATÍSTICA
MÉDIA
É um valor típico representativo de um conjunto
de dados. Fisicamente representa o ponto de
equilíbrio da distribuição. Modos de
calcular 1) para dados simples 2) para
valores distintos 3) para agrupamentos em classes
x S x / n
x S fx / n
x S fx / n
55BIOESTATÍSTICA
MÉDIA
1) Cálculo para dados simples
x S x / n S x Soma dos valores n tamanho
da amostra x (1618232117161920) 8
x 18,75
16 18 23 21 17 16 19 20
56BIOESTATÍSTICA
MÉDIA
2) Cálculo para valores distintos x f
fx 2 3 6 3 3
9 4 4 16 5 9
45 6 6 36 7 2
14 8 1 8 Total 28 134
x S fx / n S fx Soma dos produtos
dos valores distintos com a
frequência n tamanho da amostra x 134
x 4,7857 28
57BIOESTATÍSTICA
MÉDIA
3) Cálculo para agrupamentos em classes
Classes f x fx 39
50 4 44,5 178 50 61
5 55,5 277,5 61 72 5 66,5
332,5 72 83 6 77,5 465
83 94 5 88,5 442,5 Total
25 - 1695,5
x S fx / n S fx Soma dos produtos
dos valores distintos com a
frequência n tamanho da amostra x
1695,5 x 67,82 25
58BIOESTATÍSTICA
MEDIANA
É o valor que ocupa a posição central de um
conjunto de dados ordenados. Para um número par
de termos a mediana é obtida através da média
aritmética dos dois valores intermediários. Inter
pretação 50 dos valores estão abaixo ou
coincidem com a mediana e 50 estão acima ou
coincidem com a mediana.
59BIOESTATÍSTICA
MEDIANA
1) Cálculo da posição da mediana para dados
simples
PMd (n1) / 2 PMd (91) / 2 PMd 5o
Termo Mediana (Md) 6
2 3 4 5 6 7 8 9 10
60BIOESTATÍSTICA
MEDIANA
2) Cálculo da posição da mediana para valores
distintos x f fa 2
3 3o 3 3 6o 4
4 10o 5 9 19o 6
6 25o 7 2 27o 8
1 28o Total 28 -
PMd (n1) / 2 PMd (281) / 2 PMd 14,5 x
entre 14o e 15o Termo Mediana (Md) 5
61BIOESTATÍSTICA
MEDIANA
3) Cálculo da PMd para agrupamentos em classes
Classes f x fa
39 50 4 44,5 4o 50
61 5 55,5 9o 61 72 5
66,5 14o 72 83 6 77,5
20o 83 94 5 88,5 25o
Total 25 - -
PMd (n1) / 2 PMd (251) / 2 PMd 13o Termo
Classe Mediana 61 72 Mediana (Md) 66,5
(estimativa)
62BIOESTATÍSTICA
MEDIANA
3) Cálculo da PMd para agrupamentos em classes
Pode-se fazer a interpolação da classe mediana
Md Li ((PMd - faa) / f ) . A Li limite
inferior da classe mediana PMd posição da
mediana faa frequência acumulada da classe
anterior f frequência da classe mediana A
amplitude da classe mediana
Classe Mediana 61 72
63BIOESTATÍSTICA
MEDIANA
3) Cálculo da PMd para agrupamentos em classes
Interpolação da classe mediana
Md Li ((PMd - faa) / f ) . A Md 61
((13 - 9) / 5) . 11 Mediana
(Md) 69,8
Classe Mediana 61 72
64BIOESTATÍSTICA
MODA
É o valor que ocorre com maior frequência em um
conjunto de dados. Símbolo Mo
1) Moda para dados simples Exemplos 2, 3, 4,
5, 6, 7, 8 AMODAL 2, 3, 3,
4, 5, 6 ,7 MODA 3 2, 3, 3, 4, 5, 5,
6 BIMODAL (Mo 3 e Mo 5)
65BIOESTATÍSTICA
MODA
2) Moda para valores distintos x f
2 3 3 3 4
4 5 9 6 6 7
2 8 1 Total 28
O valor 5 tem o maior número de ocorrências
(9) Mo 5
66BIOESTATÍSTICA
MODA
3) Moda para agrupamentos em classes
Classes f x fa 39
50 4 44,5 4o 50 61 5
55,5 9o 61 72 5 66,5
14o 72 83 6 77,5 20o
83 94 5 88,5 25o Total
25 - -
Moda Bruta Ponto médio da classe de maior
frequência Mo 77,5 É uma estimativa
67BIOESTATÍSTICA
MODA
3) Moda para agrupamentos em classes
Moda de King Mo Li (A . f2 / (f1
f2)) Li limite inferior da classe modal A
amplitude do intervalo da classe modal f1
frequência da classe anterior a modal f2
frequência da classe posterior a modal
Mo 72 (11 . 5) 5 5
Mo 77,5
68BIOESTATÍSTICA
USO DAS MEDIDAS DE TENDÊNCIA CENTRAL
MÉDIA Dados Numéricos e Intervalares
É a medida mais utilizada. MODA Dados
Nominais MEDIANA Dados Ordinais
69BIOESTATÍSTICA
EXERCÍCIO No 1 Determine a média, a mediana e
a moda para o seguinte conjunto de dados
6 5 8 4 7 6 9 7 3
70BIOESTATÍSTICA
EXERCÍCIO No 2 Determine o menor valor, o
maior valor, a média, a mediana e a moda para o
seguinte conjunto de dados
12 32 54 17 82 99 51 11 44 22 22 33
44 52 76 41 37 10 5 87
71BIOESTATÍSTICA
EXERCÍCIO No 3 Dado o seguinte agrupamento em
classes determine
Classes f 1,60 1,65 10 1,65
1,70 15 1,70 1,75 22 1,75
1,80 18 1,80 1,85 3
Total 68
a) os pontos médios de cada classe b) a classe
modal c) a moda bruta d) a moda de King e) a
classe mediana f) a mediana por agrupamento de
classes g) a média por agrupamento de classes
72 Medidas de Ordenamento
Disciplina de Bioestatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
73BIOESTATÍSTICA
MEDIDAS DE ORDENAMENTO
São os valores que subdividem uma disposição em
rol Medidas QUARTIS, DECIS E PERCENTIS Os
Quartis dividem a disposição em 4 partes
iguais Q1, Q2, Q3 Os Decis dividem a disposição
em 10 partes iguais D1, D2, D3, D4, D5, D6, D7,
D8, D9 Os Percentis dividem a disposição em 100
partes iguais P1, P2, P3, P4, P5, P6, ... , P99
74BIOESTATÍSTICA
QUARTIS
Os Quartis dividem a disposição em 4 partes
iguais Q1, Q2, Q3 Entre cada quartil há 25 dos
dados da disposição Posição do Primeiro Quartil
(Q1) (n 1) / 4 Posição do Segundo Quartil
(Q2) 2.(n 1) / 4 Posição do Terceiro Quartil
(Q3) 3.(n 1) / 4 O segundo quartil coincide
com a Mediana (Q2 Md)
75BIOESTATÍSTICA
QUARTIS
Os Quartis dividem a disposição em 4 partes
iguais Q1, Q2, Q3 1, 1, 1, 2, 2, 2, 3, 3, 3, 4,
4, 4, 5, 5, 5, 5, 6, 7, 7, 7, 8, 8, 8, 8, 9, 9, 9
n 27
Q1
Q2
Q3
7o termo
14o termo
21o termo
76BIOESTATÍSTICA
DECIS
Os Decis dividem a disposição em 10 partes
iguais D1, D2, D3, D4, D5, D6, D7, D8, D9 Entre
cada decil há 10 dos dados da disposição Posição
do Primeiro Decil (D1) (n 1) / 10 Posição do
Segundo Decil (D2) 2.(n 1) / 10 Posição do
Nono Decil (D9) 9.(n 1) / 10 O Quinto Decil
coincide com a Mediana (D5 Md)
77BIOESTATÍSTICA
PERCENTIS
Os percentis dividem a disposição em 100 partes
iguais P1, P2, P3, P4, P5, P6, ... , P99 Entre
cada percentil há 1 dos dados da
disposição Posição do Primeiro Percentil (P1)
(n 1) / 100 Posição do Segundo Percentil (P2)
2.(n 1) / 100 Posição do Nonagésimo Nono
Percentil (P99) 99.(n 1) / 100 P50 Md
P25 Q1 P75 Q3
78BIOESTATÍSTICA
EXERCíCIOS
1) Dado o conjunto de dados a) apresente a
disposição em rol b) o Percentil 50, c) o
Primeiro Quartil, d) a Média, e) a Moda e f) a
Mediana
10 13 24 45 66 77 11 14
26 33 65 21 57
79BIOESTATÍSTICA
2) Em uma amostra com 2789 valores qual é a
posição do oitavo decil, da mediana, do segundo
decil, do terceiro quartil e do segundo quartil?
80BIOESTATÍSTICA
3) Determine a média, a moda, a mediana, o 1o
quartil, o 5o decil, o percentil 75 e o percentil
50 para a seguinte distribuição por valores
distintos?
Pesos (kg) f 64 4
65 10 66 12 67 12 68 15
69 14 70 9 71 5 72 2
81 Medidas de Dispersão
Disciplina de Bioestatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
82BIOESTATÍSTICA
DISPERSÃO DOS DADOS
É frequentemente chamada de variabilidade. Medid
as mais comuns Variância, Desvio Padrão,
Amplitude
e Coeficiente de
Variação
Dispersão dos dados na amostra
f
Dispersão dos dados na população
x
83BIOESTATÍSTICA
Dispersão na População
É uma forma de se ver o quanto os dados se
afastam da média. Exemplo Vilarejo com apenas 11
pessoas 135cm 152cm 136cm 152cm
138cm 157cm 141cm 163cm 143cm
170cm 152cm
Média 149cm Mediana e Moda 152cm Valor Máximo
170cm Valor Mínimo 135cm Amplitude 35cm
Alturas de 11 pessoas
84BIOESTATÍSTICA
Alturas (N11)
x - x (x - x)2 135cm 135-149 -14 196 136c
m 136-149 -13 169 138cm 138-149 -11 121 141c
m 141-149 -8 64 143cm 143-149 -6
36 152cm 152-149 3 9 152cm 152-149
3 9 152cm 152-149 3 9 157cm 157-149
8 64 163cm 163-149 14
196 170cm 170-149 21 441 Total
1314
Dispersão na População
- 2 Variância
- 1314 / 11
- 119,454 cm2
- s Desvio Padrão
- 119,454
- 10,92 cm
Soma dos desvios quadráticos
85BIOESTATÍSTICA
VARIÂNCIA E DESVIO PADRÃO NA POPULAÇÃO
Variância da população
s2 S ( x - x )2 / N
Desvio Padrão da população Raiz quadrada da
variância
s s2
Como a dispersão nas amostras é menor do que na
população, se faz um ajuste matemático.
86BIOESTATÍSTICA
VARIÂNCIA E DESVIO PADRÃO NA AMOSTRA
Variância da Amostra ( s2 ou v )
s2 S ( x - x )2 / ( n -1 )
Desvio Padrão da amostra ( s ou DP ) Raiz
quadrada da variância
s s2
A dispersão nas amostras é menor do que na
população, por isso é que se faz este ajuste
matemático
87BIOESTATÍSTICA
DESVIO PADRÃO
SIGNIFICADO É um modo de representar a dispersão
dos dados ao redor da média.
f
x
Média
88BIOESTATÍSTICA
DESVIO PADRÃO
A curva A mostra uma dispersão dos dados
maior do que a curva B, logo o desvio padrão de A
é maior do que o de B.
f
f
Curva A
Curva B
x
x
Média
Média
89BIOESTATÍSTICA
COEFICIENTE DE VARIAÇÃO
O desvio padrão depende da unidade de medida
usada, assim um desvio medido em dias será maior
do que um medido em meses. O coeficiente de
variação expressa o desvio-padrão como
porcentagem do valor da média. COEF.
VARIAÇÃO 100 . DESVIO PADRÃO
MÉDIA Quanto menor for este coeficiente mais
homogênea é a amostra.
90BIOESTATÍSTICA
COEFICIENTE DE VARIAÇÃO
Classificação da proporção que o desvio padrão
apresenta sobre a média. GRAU DE HOMOGENEIDADE
DOS DADOS até 10
? ÓTIMO de 10 a 20 ? BOM
de 20 a 30 ? REGULAR acima de 30
? RUIM
91BIOESTATÍSTICA
EXERCÍCIOS
1) Determine a média, a amplitude, a variância,
o desvio padrão e o coeficiente de variação da
seguinte amostra de dados
4 5 5 6 6 7 7 8
92BIOESTATÍSTICA
2) Determine o valor de n, a amplitude, a
média, o desvio padrão e o coeficiente de
variação da seguinte amostra de dados
22 32 45 22 46 76 24 21 78 43 21 58
92 11 16 28 33 73 11 29 22 47 28 24
21 53 36 88 99 18
93BIOESTATÍSTICA
3) Com base nos coeficientes de variação
calculados nos dois exercícios anteriores
classifique a dispersão encontrada
94 Amostragem
Disciplina de Bioestatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
95BIOESTATÍSTICA
APLICAÇÕES DE AMOSTRAGEM
Pesquisa Mercadológica (Índice de satisfação na
população) Pesquisa Eleitoral (Percentagem de
votos para cada candidato) Perfil Socioeconômico
da População (Grau de escolaridade, Renda)
Na População Parâmetros Na Amostra
Estatísticas
População
Amostra
Inferência Estatística
96BIOESTATÍSTICA
POR QUE USAR A AMOSTRAGEM?
Economia (É mais barato levantar dados de uma
parcela da população) Tempo (É mais
rápido) Quando a população for pequena (n gt
0,8.N) Quando a característica for de fácil
mensuração (Sim ou Não) Quando houver a
necessidade de alta precisão (Censo IBGE)
QUANDO NÃO USAR A AMOSTRAGEM?
97BIOESTATÍSTICA
TIPOS DE AMOSTRAGEM
AMOSTRAGEM ALEATÓRIA SIMPLES (Tem que obedecer
a propriedade de qualquer elemento da população
ter a mesma chance de pertencer à amostra.
Pode-se utilizar uma tabela de números aleatórios
ou sorteios) AMOSTRAGEM ALEATÓRIA
SISTEMÁTICA (Após obter-se a lista dos elementos
da população, sorteia-se a entrada e segue-se a
relação N/n.) AMOSTRAGEM ALEATÓRIA
ESTRATIFICADA (Elabora-se a amostra através do
perfil conhecido da população. Exemplo Se na
UFSC 70 são alunos e 30 Funcionários, a amostra
é confeccionada obedecendo-se estes parâmetros.)
98BIOESTATÍSTICA
OUTROS TIPOS DE AMOSTRAGEM
AMOSTRAGEM NÃO ALEATÓRIA (De fácil
obtenção.) AMOSTRAGEM PARA ESTUDOS
COMPARATIVOS (Não visa a descrição de uma
população, mas a comparação entre grupos
diferentes. Exemplos Comparar as taxas de
tabagismo em indivíduos com câncer de pulmão e
sadios.)
Procure respeitar o Plano de Amostragem para que
seja alcançada uma amostra representativa da
população.
99BIOESTATÍSTICA
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
Sejam n0 Primeira aproximação para o
tamanho da amostra E0 Erro Amostral
Tolerável n Tamanho da Amostra
N Tamanho da População
n0 1 / (Eo)2
n (N . n0) / (N no)
100BIOESTATÍSTICA
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
Populações Finitas com Parâmetros de Prevalência
Conhecidos
(N . z2 . p . (1-p))
(E02 . (N-1) z2 . p . (1-p))
n
Onde N Tamanho da População z Nível de
confiança expresso em desvio padrão (95)
1,96 E0 Erro Amostral Tolerável p
Prevalência do evento na População
101BIOESTATÍSTICA
RELAÇÃO ENTRE (n) E (N)
Relação entre o tamanho da população e o tamanho
da amostra
n
600 500 400 300 200 100 0
N
0 500 1000 1500 2000
2500 3000 3500
102BIOESTATÍSTICA
EXERCÍCIOS
1) Determine o tamanho da amostra para uma
pesquisa eleitoral em uma cidade com 200.000
eleitores, adotando uma margem de erro de 2
pontos percentuais.
103 Tabelas e Gráficos
Disciplina de Bioestatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
104BIOESTATÍSTICA
TABELAS
Tabela é a forma não discursiva de apresentar
informações, das quais o dado numérico se destaca
como informação central. Uma tabela estatística
conterá necessariamente uma série ou uma
distribuição de frequência. Vantagens -
Permitem a síntese dos resultados - Auxiliam o
pesquisador na análise dos dados e - Facilitam a
compreensão das conclusões do autor.
105BIOESTATÍSTICA
NORMAS PARA A CONFECÇÃO DE TABELAS
São numeradas consecutivamente com algarismos
arábicos Os números são precedidos da palavra
Tabela No topo deve estar o título que indica
a natureza e as abrangências geográficas e
temporal dos dados numéricos O centro da tabela
é representado por uma série de colunas e
subcolunas onde são alocados os dados No rodapé
deve-se colocar a fonte (o responsável pelos
dados) e opcionalmente uma nota geral ou uma nota
específica A moldura deve conter no mínimo 3
traços horizontais Não se deve fechar uma tabela
com traços verticais em suas extremidades.
106BIOESTATÍSTICA
CLASSIFICAÇÃO DAS TABELAS
Séries Cronológicas (temporais ou
históricas) Variável Tempo Constantes Lugar e
Espécie Séries Geográficas (territoriais) Variáv
el Lugar Constantes Tempo e Espécie Séries
Especificativas Variável Espécie Constantes
Tempo e Lugar Séries Mistas Quando há mais de
uma variável. Distribuição de Frequência
107BIOESTATÍSTICA
Séries Cronológicas (Temporais ou Históricas)
Tabela 1 Proporções de doentes X na Cidade Y
Anos Percentual 2005 25,74 2006
26,85 2007 27,94 2008 32,45 Fonte
Hipotética
108BIOESTATÍSTICA
Séries Geográficas (Territoriais)
Tabela 2 Proporção de doentes X no Ano de 2008
Cidades Percentual Itajaí 10,44 La
ges 29,45 Florianópolis 8,66 Blumenau
9,82 Fonte Hipotética
109BIOESTATÍSTICA
Séries Especificativas
Tabela 3 Proporção de doentes X no Ano de 2008
em Florianópolis
Segmento populacional
Percentual Infantil 60,25 Juvenil 20,72 A
dulto 2,75 3a Idade 5,82 Fonte
Hipotética
110BIOESTATÍSTICA
Séries Mistas (Ex Especificativa-Cronológica-Geo
gráfica)
Tabela 4 Volume de internações hospitalares por
ano e cidade (valores em milhares)
Doenças 2007 2008
Fpolis Lages Fpolis Lages Pulmonares
24,24 9,34 25,95
9.98 Infecciosas 112,72
27,45 111,75 29,48 Cardíacas
86,75 18,45 79,37 19,57 Outras
1,95 0,85 2,01
0,84 Fonte Hipotética
111BIOESTATÍSTICA
Distribuições de Frequência
Tabela 5 Distribuição de frequência dos pesos
corporais de uma amostra (valores em quilogramas)
Pesos Frequência Frequência Acumulada
64 51 51 65 100 151
66 22 173 67 14
187 Total 187 - Fonte
Hipotética
112BIOESTATÍSTICA
GRÁFICOS
Gráfico é a forma geométrica de apresentação dos
dados e respectivos resultados de sua análise. A
escolha do modelo ideal de representação gráfica
depende das preferências e do senso estético do
elaborador. Vantagens - Permitem a síntese
dos resultados - Auxiliam o pesquisador na
análise dos dados e - Facilitam a
compreensão das conclusões do autor.
113BIOESTATÍSTICA
NORMAS PARA A CONFECÇÃO DE GRÁFICOS
Deve facilitar a interpretação dos dados para um
leigo Não há a necessidade de se colocar título
se estiver na mesma página da tabela
correspondente Há a necessidade de se colocar o
título se a tabela correspondente não estiver na
mesma página. O senso estético individual
determina o espaço do gráfico (L x A) As
colunas, barras, linhas e áreas gráficas devem
ser ordenadas de modo crescente ou decrescente,
mas a ordem cronológica prevalece
114BIOESTATÍSTICA
ORIGEM DOS GRÁFICOS
O diagrama cartesiano é a figura geométrica
que deu origem à técnica de construção de
gráficos estatísticos. Utiliza-se o
primeiro quadrante do sistema de eixos
coordenados cartesianos ortogonais.
Ordenadas (eixo y)
1o Quadrante
Abscissas (eixo x)
Eixo y Frequências Eixo x Valores
da Variável
115BIOESTATÍSTICA
GRÁFICO EM COLUNAS OU DE BARRAS
Tabela 1 Quantidade de exames realizados em um
determinado laboratório em 2003.
Exames Quantidade
Hematologia 9824
Bioquímica 21534
Imunologia 15432
Parasitologia 4310 Fonte
Hipotética
Figura 1 Gráfico em colunas do número de exames
em um determinado laboratório em 2003.
116BIOESTATÍSTICA
GRÁFICO DE BARRAS HORIZONTAL
Tabela 2 Quantidade de exames realizados em um
determinado laboratório em 2003.
Exames Quantidade
Hematologia 9824
Bioquímica 21534
Imunologia 15432
Parasitologia 4310 Fonte
Hipotética
Figura 2 Gráfico em barras horizontais do
número de exames realizados em um determinado
laboratório no ano de 2003.
117BIOESTATÍSTICA
GRÁFICO DE SETORES OU CIRCULAR
Tabela 3 Quantidade de exames realizados em um
determinado laboratório em 2003.
Exames Quantidade
Hematologia 9824
Bioquímica 21534
Imunologia 15432
Parasitologia 4310 Fonte
Hipotética
Figura 3 Gráfico circular do número de exames
realizados em um determinado laboratório no ano
de 2003.
118BIOESTATÍSTICA
HISTOGRAMA DE FREQUÊNCIA
Tabela 4 Notas dos alunos na disciplina de
Estatística no curso de Administração (ano x)
Notas Frequência
0 2
2 2 4
7 4 6
11 6 8
10 8 10
5 Fonte Dados Fictícios
Figura 4 Histograma das notas dos alunos
119BIOESTATÍSTICA
HISTOGRAMA DE FREQUÊNCIA
- A área do histograma é proporcional à soma das
frequências - Para comparar duas distribuições, o ideal é
utilizar números percentuais
Figura 5 Histograma dos percentuais das notas
dos alunos
120BIOESTATÍSTICA
POLÍGONO DE FREQUÊNCIA
- É um Gráfico em Linha de uma distribuição de
frequência - Para se obter um polígono (linha fechada),
deve-se completar a figura, ligando os extremos
da linha obtida aos pontos médios da classe
anterior à primeira e posterior à última, da
distribuição.
Figura 6 Polígono de Frequência percentual de
das notas dos alunos
121BIOESTATÍSTICA
POLÍGONO DE FREQUÊNCIAS ACUMULADAS
(Sinônimo Ogiva)
Tabela 5 Notas dos alunos na disciplina de
estatística no ano x Notas
Frequência F. Acumulada 0 2
2 5,7 2 4
7 25,7 4 6
11 57,1 6 8 10
85,7 8 10 5
100,0 Fonte Dados Fictícios
Figura 7 Polígono de frequências acumuladas
das notas dos alunos
122BIOESTATÍSTICA
GRÁFICO STEM AND LEAF (TRONCO E FOLHAS)
Tronco (Stem) Folha (Leaf)
1 3455 2 2389 3 356799
4 57 5 37889 6 235
7 12
13 14 15 15 22 23 28 29 33 35 36 37 39
39 45 47 53 57 58 58 59 62 63 65 71 72
Figura 8 Gráfico Stem-Leaf onde o primeiro
dígito é o tronco e o segundo é a folha
Conjunto de Dados
123BIOESTATÍSTICA
GRÁFICO DE BARRAS COM DESVIO PADRÃO
Figura 9 Gráfico de barras com os valores
médios e o desvio padrão das alturas de
estudantes da faculdade x (valores fictícios).
124BIOESTATÍSTICA
GRÁFICO BOX AND WISKER (Caixa e Fio de Bigode)
1,95m 1,90m 1,85m 1,80m 1,75m 1,70m 1,65m 1,60m 1,
55m
Valor Máximo
Percentil 75
Percentil 50
Percentil 25
Valor Mínimo
Figura 10 Gráfico Box and Wisker das alturas
dos estudantes de medicina (valores fictícios).
125BIOESTATÍSTICA
EXERCÍCIOS
1) Construa uma série cronológica com os dados
da mortalidade infantil de uma determinada região.
126BIOESTATÍSTICA
2) Construa o Gráfico de Barras com os dados do
exercício anterior.
127BIOESTATÍSTICA
3) Construa o Gráfico em Setores do seguinte
agrupamento em classes
- Pesos (Kg) f
- 60 15
- 80 26
- 100 38
- 120 9
- Total 88
128 Distribuição Normal
Disciplina de Bioestatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
129BIOESTATÍSTICA
CURVA NORMAL
- É descrita pela média e pelo desvio padrão.
- A mediana, a média e a moda coincidem.
- A curva é simétrica ao redor da média.
- A curva é mesocúrtica.
Média, Moda e Mediana
130BIOESTATÍSTICA
CURVA NORMAL
- As inferências em pesquisas em saúde estão
baseadas em dados, cuja distribuição é normal. - A curva normal (Gauss) é simétrica, unimodal e
tem forma de sino. - É assintótica em relação ao eixo horizontal
(eixo x).
Média, Moda e Mediana
131BIOESTATÍSTICA
A ESTATÍSTICA Z
- A estatística Z standard score, baseia-se na
curva normal. - Mede o afastamento de um valor em relação a
média em unidades de desvios padrão. - Z x - x
- s
132BIOESTATÍSTICA
A ESTATÍSTICA Z
y
- Exemplo
- A altura média dos estudantes da FESSC é de 1,70m
com desvio padrão de 10cm - Z x - x
- s
x
160
180
150
140
190
200
170
z
0
-1
1
-2
2
3
-3
133BIOESTATÍSTICA
ÁREAS DA CURVA NORMAL
Áreas -1DP a 1DP ? 68,27 -2DP a 2DP
? 95,45 -3DP a 3DP ? 99,73 -1,96DP a
1,96DP ? 95 Média a 1DP ? 34,13 Média a 2
DP ? 47,72 Média a 3DP ? 49,86
134BIOESTATÍSTICA
ÁREAS DA CURVA NORMAL
34,13
47,72
49,86
135BIOESTATÍSTICA
ÁREAS DA CURVA NORMAL
68,27
95,45
99,73
136BIOESTATÍSTICA
Média, Moda e Mediana
137ESTATÍSTICA
EXERCÍCIOS
1) Um determinado estudo populacional apresentou
a média dos pesos corporais igual a 100kg e
desvio padrão de 1,5kg. Qual é a proporção de
pessoas entre 100kg e 102kg?
Z (x - média) / desvio padrão (102 - 100) /
1,5 1,33 na tabela qdo z 1,33 a área é de
50 - 9,18 40,82
?
100 102
x
0 ?
z
138BIOESTATÍSTICA
2) Calcule as seguintes proporções de
pessoas (a) com peso entre 98 e 102kg (b)
abaixo de 98kg (c) acima de 102kg (d) abaixo
de 100kg (e) abaixo de 95kg
139 Correlação
Disciplina de Bioestatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
140BIOESTATÍSTICA
DIAGRAMA DE DISPERSÃO
Mostra o comportamento de duas variáveis
quantitativas (com dados numéricos).
a
a
a
b
b
b
141BIOESTATÍSTICA
CORRELAÇÃO LINEAR POSITIVA
Quando valores pequenos da variável a tendem a
estar relacionados com valores pequenos de b,
enquanto que valores grandes de a tendem a estar
relacionados com valores grandes de b.
a
Exemplos Peso x Altura Nível socioeconômico x
Volume de vendas Consumo de Álcool x Preval.
Cirrose Hepática
b
142BIOESTATÍSTICA
CORRELAÇÃO LINEAR NEGATIVA
Quando valores pequenos da variável a tendem a
estar relacionados com valores grandes de b,
enquanto que valores grandes de a tendem a estar
relacionados com valores pequenos de b.
a
Exemplos Renda Familiar x Número de
Filhos Escolaridade x Absenteísmo Volume de
vendas x Passivo circulante
b
143BIOESTATÍSTICA
CORRELAÇÃO NÃO LINEAR
O diagrama de dispersão mostra um conjunto de
pontos aproximando-se mais de uma parábola do que
de uma reta.
a
Exemplos Coef. de Letalidade (a) x Dose do
Medicamento (b) Custo (a) x Lote Econômico de
Compra (b)
b
144BIOESTATÍSTICA
r n . ? (X.Y) - ? X . ? Y
n . ? X2 - (? X)2 . n . ? Y2 - (?
Y)2 ?(X.Y) Fazem-se os produtos X.Y p/ cada
par e depois efetua-se a soma ?X Somatório dos
valores da variável X ?Y Somatório dos valores
da variável Y ?X2 Elevam-se ao quadrado cada
valor de X e depois efetua-se a soma ?Y2
Elevam-se ao quadrado cada valor de Y e depois
efetua-se a soma
145BIOESTATÍSTICA
Cálculo do coeficiente de correlação para os
dados das variáveis X população residente e Y
taxa de cresc. populacional, em 12 vilarejos.
X Y X2 Y2 X . Y 101 3,2
10201 10,24 323,2 193 4,6 37249 21,16 887,8
. . . .
. . . .
. .
. . . .
. 42 2,8 1764 7,84 117,6
1452 39,3 251538 153,55
5706,2
146BIOESTATÍSTICA
r n . ? (X.Y) - ? X . ? Y
n . ? X2 - (? X)2 . n . ? Y2 - (?
Y)2 r 12 . 5706,2 -
1452 . 39,3 12 . 251538 - (1452)2 .
12 . 153,55 - (39,3)2 r 0,69
(Correlação Linear Positiva r gt 0)
147BIOESTATÍSTICA
- O Valor de r (Correlação Linear de Pearson)
varia de -1 a 1. - O sinal indica o sentido (correlação positiva ou
negativa). - O valor indica a força da correlação (Fraca,
Moderada ou Forte)
valor de r
Ausência
Fraca
Fraca
Moderada
Forte
Forte
Moderada
0
- 1
1
- 0,7
0,3
0,7
- 0,3
148BIOESTATÍSTICA
1) Coloque V (Verdadeiro ou F (Falso) ( )
Quando o valor de r for maior que 0,7 ou menor
que -0,7 a correlação entre as duas variáveis em
estudo é forte ( ) O sinal negativo de r indica
que as variáveis em estudo são inversamente
proporcionais ( ) Ao se encontrar um valor de r
0,6 não se pode afirmar que as variáveis sejam
diretamente proporcionais. ( ) O coeficiente de
correlação de Pearson pode ser aplicado em dados
nominais
149Teste de Diferença entre Médias
Disciplina de Bioestatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
150BIOESTATÍSTICA
TEST T Serve para comparar as médias de
dois grupos amostrais Duas hipóteses
possíveis
As
médias são iguais
As médias são diferentes
H0 ma - mb zero
H1 ma - mb ? zero
151BIOESTATÍSTICA
Testes de duas amostras
As médias das duas amostras são iguais?
152Analisando duas amostras
BIOESTATÍSTICA
?
?
?
153Teste da diferença!
BIOESTATÍSTICA
diferença 0
H0 ma-mbzero
H1 ma-mb?zero
Médias iguais
154Teste da diferença!
BIOESTATÍSTICA
diferença 0
H0 ma-mbzero
H1 ma-mb?zero
Médias iguais
Cuidado!!! Antes do emprego do Teste T deve ser
testada a homogeneidade das variâncias.
155Roteiro do Teste da diferença entre médias
BIOESTATÍSTICA
1) Testar a homogeneidade das variâncias
Quando pgt0,05 ? temos variâncias homogêneas
Quando plt0,05 ? temos variâncias
diferentes 2) Se as variâncias forem homogêneas
realizar o Teste T para homogeneidade das
variâncias. 3) Se as variâncias forem diferentes
realizar o Teste T para variâncias
diferentes. 4) Quando o Teste T apresentar
pgt0,05 ? As médias são iguais
plt0,05 ? As médias são diferentes
156Comparando as médias no Microsoft Excel
BIOESTATÍSTICA
157Comparando as médias no SPSS
BIOESTATÍSTICA
158Output do SPSS
BIOESTATÍSTICA
Como pgt0,05 as variâncias são semelhantes
Como plt0,05 as médias são diferentes
plt0,05 Diferentes!
159 Fonte Bibliográfica
- BARBETA, P. A. Estatística Aplicada às Ciências
Sociais. 5.ed. Florianópolis UFSC, 2006. - DAWSON, B. TRAPP, R.G. Basic Clinical
Biostatistical. 3.ed. New York Lange Medical
Books/McGraw-Hill, 2006. - LEVIN, J. Estatística Aplicada às Ciências
Humanas. 7.ed. São Paulo Harbra, 2007. - SPIEGEL, M. R. Estatística. 8.ed. São Paulo
Makron Books, 2006. - STEVENSON, W. J. Estatística Aplicada à
Administração. São Paulo Harbra, 2007.
Retornar