Title: INTRODU
1INTRODUÇÃO À ESTATÍSTICAAPLICADA
Definição Técnica de recolha, organização,
sintetização e apresentação de dados numéricos
(E. descritiva). Compreende, ainda, as técnicas
por meio das quais são tomadas decisões sobre uma
população, baseadas unicamente na observação de
amostras , pelo uso de conceito de probabilidade
(E. inferencial).
- Exemplos
- E. descritiva estudo da idade da população dos
alunos da ESTV. - E. inferencial a partir da pesquisa amostral da
população escolar, inferir a sua estrutura etária.
2ESTATÍSTCA DESCRITIVA
- Distribuição de Frequência
- Definir um n.º de classes ímpar
- Amplitude da classe R / n.º de classes
- R Amplitude (Range)
- R Maior valor (H) Menor valor (L)
- Quadro de distribuição de frequência
- Numa coluna as classes e na outra o n.º de
casos correspondentes. - Histograma
- Gráfico de barras com classes nas abcissas
e n.º casos nas ordenadas. - Polígono de frequências
- Linha constituída por segmentos de recta
que unem os pontos médios dos topos das barras. - Curva de frequência
- Suavização curvilínea do polígono de freq.
- Distribuição de frequência acumulada
- Identifica o .º de casos () até cada
classe.
3ESTATÍSTCA DESCRITIVA
Numa turma do 10º ano foram perguntou-se a cada
aluno a sua idade.
Os dados não classificados são 14, 15, 16, 17,
18, 19, 14, 15, 16, 17, 14, 15, 16, 14, 15, 16,
15, 16, 15, 15
Os dados classificados e agrupados numa tabela de
frequências
Idade (em anos) Frequência
14 4
15 7
16 5
17 2
18 1
19 1
Total 20
4ESTATÍSTCA DESCRITIVA
Frequência absoluta ou efectiva (fi) de um valor
da variável é o numero de vezes que esse valor
foi observado
Frequência relativa (fri) de um valor da variável
é o quociente entre a frequência absoluta do
valor da variável e o número total de observações
Frequência (relativa ou absoluta) acumulada de
um valor da variável é igual à soma das
frequências anteriores com a frequência desse
valor
Xi fi fri Fi Freq. Absoluta acumulada Fri Freq. relativa acumulada
14 4 0,20 4 0,20
15 7 0,35 11 0,55
16 5 0,25 16 0,80
17 2 0,10 18 0,90
18 1 0,05 19 0,95
19 1 0,05 20 1
5ESTATÍSTCA DESCRITIVA
Gráfico de barras - frequências absolutas
Gráfico de barras - frequências absolutas
acumuladas
6ESTATÍSTCA DESCRITIVA
Na mesma turma do 10º ano perguntou-se a cada
aluno a sua altura em centímetros 147, 167, 171,
172, 151, 154, 150, 155, 156, 160, 160, 164, 163,
159, 158, 162, 169, 170, 174
- Para 20 observações vamos usar 6 classes.
Consideram-se ainda as seguintes convenções - O extremo esquerdo do intervalo (classe) será
fechado e o extremo direito aberto - aos extremos do intervalo chamam-se limites da
classe à diferença dos limites, amplitudes do
intervalo da classe à semi-soma dos limites
chama-se ponto médio ou marca da classe
Xi fi fri Fi Freq. Absoluta acumulada Fri Freq. relativa acumulada
145 , 150 1 0,05 1 0,05
150 , 155 3 0,15 4 0,20
155 , 160 4 0,20 8 0,40
160 , 165 5 0,25 13 0,60
165 , 170 2 0,10 15 0,75
170 , 175 5 0,25 20 1
7ESTATÍSTCA DESCRITIVA
Histograma das frequências absolutas
8- 2. Medidas de Posição
- Valor calculado para um grupo de dados,
usado para o descrever. - Média aritmética
- Para dados não classificados
- µ - M. A. da população µ S X / N
- x - M. A. amostral x S x /
n - - Para dados classificados
- X (f1x1f2x2fnxn)/n
- Mediana
- Corresponde ao valor do item médio quando
todos os valores foram organizados de forma
crescente ou decrescente. - Se n é ímpar Med Xk com K (n1)/2
- Se n é par Med (Xk Xk1 )/2 com K n/2
- Moda
- Valor mais frequente.
-
ou de tendência central
9ESTATÍSTCA DESCRITIVA
- Calcule a média de idade da turma do 10º ano
- Calcule a média das alturas da turma
- Calcule a mediana das idades da turma
- Calcule a moda das idades da turma
10ANÁLISE As diferenças de valores assumido pela
média aritmética, mediana e moda indicam-nos o
tipo de curva de distribuição de frequência, sem
a desenhar.
Coeficiente de Pearson Dá-nos informação sobre a
simetria da curva de distribuição de frequência
(Medida de simetria). C. Pearson 3 (µ Med) /
s ou 3 (x Med) / s
11- 3. Medidas de Variabilidade
- Amplitude total
- R H - L
- H Maior valor da população (ou amostra)
- L Menor valor da população (ou amostra)
- Variância e desvio padrão
- s2 (S(X- µ)2) / N s2 (S(x -
x)2) / n - s (S(X- µ)2) / N s (S(x -
x)2) / n - s2 Variância populacional
- s2 Variância amostral
- s - Desvio padrão populacional
- s - Desvio padrão amostral
12Uma variável aleatória utiliza-se para expressar
os resultados de uma experiência aleatória. Em
algumas situações, o conjunto de valores que uma
variável toma confunde-se com o próprio conjunto
de resultados, isto é, com o espaço amostral.
Experiência aleatória Medição da altura de uma
pessoa escolhida ao acaso Espaço amostral
Conjunto de todas as alturas atribuíveis a uma
pessoa Variável aleatória Altura (que pode tomar
qualquer um dos valores que constituem o espaço
amostral
13ESTATÍSTCA INFERENCIAL
Uma variável quantitativa classifica-se como
discreta ou contínua, conforme os elementos do
contradomínio da aplicação que a define forem
numeráveis ou não numeráveis.
Exemplo A variável resultado do lançamento de um
dado é discreto (podendo tomar os valores
1,2,3,4,5 ou 6) A variável distância a percorrer
diariamente por um vendedor será contínua, se se
admitir que tal distância é medida com precisão
absoluta.
14DISTRIBUIÇÃO NORMAL DE PROBABILIDADE
f(X)
Maior precisão
s 10
s 5
µ
X
f(X)
µ
µ-3s
µ-2s
µ-1s
µ-3 s
µ-2s
µ-1s
X
68,27
95,45
99,73
15- A distribuição normal é importante
- Grande número de fenómenos e processos segue
esta distribuição - Pode ser usada com aproximação a outras
distribuições (binomial e de Poisson) - A distribuição estatística de amostras, tais
como a média, seguem a D. normal.
16- Distribuição Normal Padronizada
- Tem por finalidade potenciar o uso de tabelas
- Obtém-se pela introdução de
- Z (X µ) / s
f(Z)
Z
0
17APROXIMAÇÃO PELA NORMAL À PROB. BINOMIAL
Esta aproximação é possível sempre que o número
de observações ou tentativas for relativamente
elevado. n 30 e n p 5 µ n p s n p
(1 p) n N.º de provas p Probabilidade de
sucesso
18INTERVALOS DE CONFIANÇA
95
z
0
-1,96
-1,96
Interpretação Para um determinado nível de
confiança (a) será calculado o intervalo que
contém a verdadeira média da população (µ).
I a µ X Z s / n
P. e., temos 95 de confiança que a verdadeira
média da população está contida no intervalo. I
0,95 µ X 1,96 s / n A dimensão do
intervalo depende do nível de confiança e do
tamanho da amostra.