Sin t - PowerPoint PPT Presentation

1 / 42
About This Presentation
Title:

Sin t

Description:

Title: Sin t tulo de diapositiva Author: INTA Last modified by: Instituto de Matematicas Created Date: 3/14/2003 6:40:01 PM Document presentation format – PowerPoint PPT presentation

Number of Views:61
Avg rating:3.0/5.0
Slides: 43
Provided by: INTA151
Category:
Tags: absoluta | funcion | sin | valor

less

Transcript and Presenter's Notes

Title: Sin t


1
Qué es una Variable Aleatoria??????????
Ejemplo Consideremos los datos de un estudio
donde se les mide la talla en centímetros a 20
jugadores del equipo Nacional de Handbol de EE.
UU. seleccionados al azar. La ley que asocia a
cada hombre con su talla es una variable
aleatoria (continua).
A esta función que asocia a cada deportista con
su talla la llamaremos variable aleatoria y la
denotaremos por X.
184.2 191.8 188.0 196.2 178.4 .... etc
X Talla
2
Ejemplo
X Talla
184.2 191.8 188.0 196.2 178.4 184.2 195.
4 189.2 186.0 194.3 190.5 190.5 198.1 188.0
184.2 176.5 184.2 193.5 195.6 186.3
3
Cómo ordenamos los datos???????????
En una Tabla de Distribución de Frecuencia
Qué es ?????
Es un arreglo de los distintos valores que toma
la variable con sus respectivas frecuencias (nº
de veces que aparece cada valor de la variable en
la muestra).
4
Distribución de frecuencia de ejemplo (TALLA)
Tabla de frecuencias
Talla
173.5-179.5
179.5-185.5
185.5-191.5
191.5-197.5
197.5-203.5

f
2
4
7
6
1
20
F
2
6
13
19
20


5
Distribución de frecuencia de ejemplo (TALLA)
Histograma
6
Medidas de Resumen
Los fenómenos biológicos no suelen ser constantes
Necesitamos conocer
  • La tendencia central de los datos
  • La dispersión o variación respecto de este centro
  • Los datos que ocupan ciertas posiciones
  • La simetría de los datos
  • La forma en que los datos se agrupan

7
Medidas representativas de un conjunto de datos
estadísticos
8
Medidas de Tendencia Central
Son medidas alrededor de las cuales se concentran
los datos
Las tres medidas más usuales de tendencia central
son
Media
Mediana
Moda
9
1.-Media Aritmética (?X) de una variable
aleatoria (o Promedio)
Es la suma de todos sus posibles valores dividida
por el n total de datos (n)
(Ejemplo TALLA)
Datos
184.2 191.8 188.0 196.2 178.4 184.2 195.4 189.2 18
6.0 194.3 190.5 190.5 198.1 188.0 184.2 176.5 184.
2 193.5 195.6 186.3
10
2.- Mediana(Med) de una variable aleatoria
Es el primer valor de la variable que deja por
debajo y por sobre de sí al 50 de las
observaciones.
Primero !!!!! Ordenamos los valores de menor a
mayor
Si n es el número de observaciones
a) n impar mediana es el único valor central
b) n par mediana es el promedio de los dos
valores centrales
11
Si la variable es la talla
12
(Ejemplo TALLA)
Datos ordenados
176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0,
186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8,
193.5, 194.3, 195.4, 195.6, 196.2, 198.1
10 datos
n 20
par
  • Mediana
  • Promedio de 2 valores centrales
  • Dejan aproximadamente 50 de los datos bajo y
    sobre sí (aprox. 10 datos)

13
(Ejemplo PESO)
Datos ordenados
39, 40, 42, 49, 51, 54, 56, 57, 58, 58, 58, 59,
63, 64, 66, 68, 69, 70, 70, 71,72
n 21
impar
Med58
  • Mediana
  • valor central único
  • Deja aproximadamente 50 de los datos bajo y
    sobre sí (aprox. 10 datos)

14
Sea X una variable discreta con los siguientes
valores
X 2, 5, 7, 12
Mediana
(57)/2 6
Media
(25712)/46.5
Si cambiamos la última observación por otra
extrañamente grande
X 2, 5, 7, 125
(257125)/434.75
Media
Mediana
(57)/2 6
Conclusión
La Media es afectada por valores extremos, no
así, la Mediana
15
Ejercicio
Cuál de los dos valores es más adecuado para la
distribución de los datos, la Media o la
Mediana???
Límite real f
0-10 60
10-20 80
20-30 30
30-100 20
100-500 10
200
c
5
15
25
65
300

F
60
140
170
190
200

16
La medida de tendencia central más adecuada para
describir estos datos es la MEDIANA
17
3.- Moda de una variable aleatoria
Es aquel valor de la variable con mayor
frecuencia absoluta.
  • Puede no ser única

18
(Ejemplo TALLA)
Como conocemos cada uno de los datos, podemos ver
el que más se repite
Moda 184.2
19
Medidas de Posición
Dividen el conjunto de datos ordenados en partes
iguales
Las dos medidas de posición más usuales son
Percentiles
Cuartiles
20
1.-Percentiles
Son 99 valores que dividen en 100 partes iguales
el conjunto de datos ordenados. Ejemplo, el
percentil de orden 67 deja por debajo de sí el
67 de las observaciones, y por encima queda el
33
PERCENTIL DE ORDEN k
Es la observación, Pk, que deja por debajo de sí
el k de la población.
P25
Deja debajo de sí el 25 de los datos ordenados
Deja debajo de sí el 50 de los datos ordenados
P50
Mediana
P75
Deja debajo de sí el 75 de los datos ordenados
21
Si n es el número de observaciones
1º) Primero ordenamos las observaciones de menor
a mayor
2º) Calculamos el k de n
3º)Contando los datos desde el valor menor al
mayor, el percentil de orden k será aquel valor
de la variable ubicado en la posición número
22
(Ejemplo TALLA)
Datos ordenados
n 20
Calculemos el percentil de orden 67
176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0,
186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8,
193.5, 194.3, 195.4, 195.6, 196.2, 198.1
  • P67
  • Deja aproximadamente 67 de los datos bajo de sí
    (aprox. 13 datos), y el 33 sobre sí

23
2.-Cuartiles
Son los 3 valores que dividen al conjunto de
datos ordenados en cuatro partes iguales
P25
Primer cuartil (Q1)
Segundo cuartil (Q2)
P50Mediana
P75
Tercer cuartil (Q3)
24
Medidas de Dispersión
  • Cuantifican la separación o la variabilidad de
    los valores de la distribución respecto al valor
    central.
  • Nos dicen hasta qué punto las medidas de
    tendencia central son representativas como
    síntesis de la información.

Las más usadas son
Rango(Recorrido)
Desviación Estándard
25
1.-Rango o Recorrido
RANGO (RECORRIDO) Valor Máximo - Valor Mínimo.

Inconvenientes del RANGO (RECORRIDO)
  • No utiliza todas las observaciones (sólo dos de
    ellas).
  • Se puede ver muy afectado por alguna observación
    extrema.
  • El rango aumenta con el número de observaciones,
    o bien se
  • queda igual. En cualquier caso, nunca disminuye.

26
(Ejemplo TALLA)
176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0,
186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8,
193.5, 194.3, 195.4, 195.6, 196.2, 198.1
Valor Mínimo
176.5
198.1
Valor Máximo
Rango o Recorrido
198.1 176.5
21.6
Sólo depende del valor máximo (198.1) y del valor
Mínimo (176.5)
27
(Ejercicio Concentración urinaria de plomo en
niños
Concentración de plomo (µmol/24hr)
0.2
1.5
0.6
2.0
0.8
2.1
(x-promedio)
0.2 - 1.2 -1
1.5 - 1.20.3
0.6 - 1.2 -0.6
2.0 - 1.20.8
0.8 - 1.2-0.4
2.1 - 1.20.9
0
28
solución
S2
29
2.-Varianza (S2) y desviación estándar(S)
Es la media de las diferencias cuadrática de n
puntua- ciones con respecto a su media
aritmética.
Desviación Estándar (S)
30
(Ejemplo TALLA)
Datos
184.2 191.8 188.0 196.2 178.4 184.2 195.4 189
.2 186.0 194.3 190.5 190.5 198.1 188.0 184.2 176.5
184.2 193.5 195.6 186.3
31
En SPSS
32
Medidas de Forma
1.- Asimetría
Coef. de Asimetría 0
Coef. de Asimetría lt0
Coef. de Asimetría gt0
33
Ejemplo
Moda ltMedianaltMedia
34
En SPSS
Si bien se nota una leve cola hacia la
izquierda, la asimetría es sutil por ello que
los valores son cercanos
Moda ltMediana?Media
35
2.- Apuntamiento o curtosis
Curtosis gt0
Curtosis 0
Curtosis lt0
Distribución mesocúrtica presenta un grado de
concentración medio alrededor de los valores
centrales de la variable (el mismo que presenta
una distribución normal). Distribución
leptocúrtica presenta un elevado grado de
concentración alrededor de los valores centrales
de la variable. Distribución platicúrtica
presenta un reducido grado de concentración
alrededor de los valores centrales de la
variable.
36
En SPSS
37
En SPSS
38
Ejercicio
Datos I
Promedio Mediana
2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5
Datos II
Promedio Mediana
3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6
Datos III
Promedio Mediana
2, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 6
Datos IV
3, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 5
Promedio Mediana
39
Datos ?x Med Moda Rango P25 P75 P75-P25 S
I 4 4 5 3 3 5 2 1
II 4 4 3 3 3 5 2 1
III 4 4 4 4 4 4 0 1
IV 4 4 3 y 5 2 3 5 2 1
40
Importante para describir los datos!!!!!!!!!!!!..
....
Medidas de Tendencia Central

Medidas de Dispersión

Medidas de posición

GráficosHistograma, BoxPlot
41
RESUMEN Medidas descriptivas
  • Posición
  • Dividen un conjunto ordenado de datos en grupos
    con la misma cantidad de datos
  • . Percentiles, cuartiles
  • Centralización
  • Indican valores respecto alos cuales los datos
    parecen agrupares
  • . Media, mediana y moda
  • Dispersión
  • Indican la mayor o menor concentración de los
    datos con respecto a las medidas de
    centralización
  • . Varianza, desviación estándar, rango o
    recorrido
  • Forma
  • Asimetría y apuntamiento

42
Elección de medidas de tendencia central y de
dispersión
Variable Nominal
Moda
  • Moda

Variable Ordinal
  • Mediana
  • Percentiles

Variable Contínua
  • Mediana
  • Con distribución desconocida o asimétrica
  • Percentiles
  • Con distribución simétrica y unimodal (Ej Normal)
  • Media
  • Desviación estándard
Write a Comment
User Comments (0)
About PowerShow.com