Title: Sin t
1Qué es una Variable Aleatoria??????????
Ejemplo Consideremos los datos de un estudio
donde se les mide la talla en centímetros a 20
jugadores del equipo Nacional de Handbol de EE.
UU. seleccionados al azar. La ley que asocia a
cada hombre con su talla es una variable
aleatoria (continua).
A esta función que asocia a cada deportista con
su talla la llamaremos variable aleatoria y la
denotaremos por X.
184.2 191.8 188.0 196.2 178.4 .... etc
X Talla
2Ejemplo
X Talla
184.2 191.8 188.0 196.2 178.4 184.2 195.
4 189.2 186.0 194.3 190.5 190.5 198.1 188.0
184.2 176.5 184.2 193.5 195.6 186.3
3Cómo ordenamos los datos???????????
En una Tabla de Distribución de Frecuencia
Qué es ?????
Es un arreglo de los distintos valores que toma
la variable con sus respectivas frecuencias (nº
de veces que aparece cada valor de la variable en
la muestra).
4Distribución de frecuencia de ejemplo (TALLA)
Tabla de frecuencias
Talla
173.5-179.5
179.5-185.5
185.5-191.5
191.5-197.5
197.5-203.5
f
2
4
7
6
1
20
F
2
6
13
19
20
5Distribución de frecuencia de ejemplo (TALLA)
Histograma
6Medidas de Resumen
Los fenómenos biológicos no suelen ser constantes
Necesitamos conocer
- La tendencia central de los datos
- La dispersión o variación respecto de este centro
- Los datos que ocupan ciertas posiciones
- La forma en que los datos se agrupan
7Medidas representativas de un conjunto de datos
estadísticos
8Medidas de Tendencia Central
Son medidas alrededor de las cuales se concentran
los datos
Las tres medidas más usuales de tendencia central
son
Media
Mediana
Moda
91.-Media Aritmética (?X) de una variable
aleatoria (o Promedio)
Es la suma de todos sus posibles valores dividida
por el n total de datos (n)
(Ejemplo TALLA)
Datos
184.2 191.8 188.0 196.2 178.4 184.2 195.4 189.2 18
6.0 194.3 190.5 190.5 198.1 188.0 184.2 176.5 184.
2 193.5 195.6 186.3
102.- Mediana(Med) de una variable aleatoria
Es el primer valor de la variable que deja por
debajo y por sobre de sí al 50 de las
observaciones.
Primero !!!!! Ordenamos los valores de menor a
mayor
Si n es el número de observaciones
a) n impar mediana es el único valor central
b) n par mediana es el promedio de los dos
valores centrales
11Si la variable es la talla
12(Ejemplo TALLA)
Datos ordenados
176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0,
186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8,
193.5, 194.3, 195.4, 195.6, 196.2, 198.1
10 datos
n 20
par
- Mediana
- Promedio de 2 valores centrales
- Dejan aproximadamente 50 de los datos bajo y
sobre sí (aprox. 10 datos)
13(Ejemplo PESO)
Datos ordenados
39, 40, 42, 49, 51, 54, 56, 57, 58, 58, 58, 59,
63, 64, 66, 68, 69, 70, 70, 71,72
n 21
impar
Med58
- Mediana
- valor central único
- Deja aproximadamente 50 de los datos bajo y
sobre sí (aprox. 10 datos)
14Sea X una variable discreta con los siguientes
valores
X 2, 5, 7, 12
Mediana
(57)/2 6
Media
(25712)/46.5
Si cambiamos la última observación por otra
extrañamente grande
X 2, 5, 7, 125
(257125)/434.75
Media
Mediana
(57)/2 6
Conclusión
La Media es afectada por valores extremos, no
así, la Mediana
15Ejercicio
Cuál de los dos valores es más adecuado para la
distribución de los datos, la Media o la
Mediana???
Límite real f
0-10 60
10-20 80
20-30 30
30-100 20
100-500 10
200
c
5
15
25
65
300
F
60
140
170
190
200
16La medida de tendencia central más adecuada para
describir estos datos es la MEDIANA
173.- Moda de una variable aleatoria
Es aquel valor de la variable con mayor
frecuencia absoluta.
18(Ejemplo TALLA)
Como conocemos cada uno de los datos, podemos ver
el que más se repite
Moda 184.2
19Medidas de Posición
Dividen el conjunto de datos ordenados en partes
iguales
Las dos medidas de posición más usuales son
Percentiles
Cuartiles
201.-Percentiles
Son 99 valores que dividen en 100 partes iguales
el conjunto de datos ordenados. Ejemplo, el
percentil de orden 67 deja por debajo de sí el
67 de las observaciones, y por encima queda el
33
PERCENTIL DE ORDEN k
Es la observación, Pk, que deja por debajo de sí
el k de la población.
P25
Deja debajo de sí el 25 de los datos ordenados
Deja debajo de sí el 50 de los datos ordenados
P50
Mediana
P75
Deja debajo de sí el 75 de los datos ordenados
21Si n es el número de observaciones
1º) Primero ordenamos las observaciones de menor
a mayor
2º) Calculamos el k de n
3º)Contando los datos desde el valor menor al
mayor, el percentil de orden k será aquel valor
de la variable ubicado en la posición número
22(Ejemplo TALLA)
Datos ordenados
n 20
Calculemos el percentil de orden 67
176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0,
186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8,
193.5, 194.3, 195.4, 195.6, 196.2, 198.1
- P67
- Deja aproximadamente 67 de los datos bajo de sí
(aprox. 13 datos), y el 33 sobre sí
232.-Cuartiles
Son los 3 valores que dividen al conjunto de
datos ordenados en cuatro partes iguales
P25
Primer cuartil (Q1)
Segundo cuartil (Q2)
P50Mediana
P75
Tercer cuartil (Q3)
24Medidas de Dispersión
- Cuantifican la separación o la variabilidad de
los valores de la distribución respecto al valor
central.
- Nos dicen hasta qué punto las medidas de
tendencia central son representativas como
síntesis de la información.
Las más usadas son
Rango(Recorrido)
Desviación Estándard
251.-Rango o Recorrido
RANGO (RECORRIDO) Valor Máximo - Valor Mínimo.
Inconvenientes del RANGO (RECORRIDO)
- No utiliza todas las observaciones (sólo dos de
ellas).
- Se puede ver muy afectado por alguna observación
extrema.
- El rango aumenta con el número de observaciones,
o bien se - queda igual. En cualquier caso, nunca disminuye.
26(Ejemplo TALLA)
176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0,
186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8,
193.5, 194.3, 195.4, 195.6, 196.2, 198.1
Valor Mínimo
176.5
198.1
Valor Máximo
Rango o Recorrido
198.1 176.5
21.6
Sólo depende del valor máximo (198.1) y del valor
Mínimo (176.5)
27(Ejercicio Concentración urinaria de plomo en
niños
Concentración de plomo (µmol/24hr)
0.2
1.5
0.6
2.0
0.8
2.1
(x-promedio)
0.2 - 1.2 -1
1.5 - 1.20.3
0.6 - 1.2 -0.6
2.0 - 1.20.8
0.8 - 1.2-0.4
2.1 - 1.20.9
0
28solución
S2
292.-Varianza (S2) y desviación estándar(S)
Es la media de las diferencias cuadrática de n
puntua- ciones con respecto a su media
aritmética.
Desviación Estándar (S)
30(Ejemplo TALLA)
Datos
184.2 191.8 188.0 196.2 178.4 184.2 195.4 189
.2 186.0 194.3 190.5 190.5 198.1 188.0 184.2 176.5
184.2 193.5 195.6 186.3
31En SPSS
32Medidas de Forma
1.- Asimetría
Coef. de Asimetría 0
Coef. de Asimetría lt0
Coef. de Asimetría gt0
33Ejemplo
Moda ltMedianaltMedia
34En SPSS
Si bien se nota una leve cola hacia la
izquierda, la asimetría es sutil por ello que
los valores son cercanos
Moda ltMediana?Media
352.- Apuntamiento o curtosis
Curtosis gt0
Curtosis 0
Curtosis lt0
Distribución mesocúrtica presenta un grado de
concentración medio alrededor de los valores
centrales de la variable (el mismo que presenta
una distribución normal). Distribución
leptocúrtica presenta un elevado grado de
concentración alrededor de los valores centrales
de la variable. Distribución platicúrtica
presenta un reducido grado de concentración
alrededor de los valores centrales de la
variable.
36En SPSS
37En SPSS
38Ejercicio
Datos I
Promedio Mediana
2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5
Datos II
Promedio Mediana
3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6
Datos III
Promedio Mediana
2, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 6
Datos IV
3, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 5
Promedio Mediana
39Datos ?x Med Moda Rango P25 P75 P75-P25 S
I 4 4 5 3 3 5 2 1
II 4 4 3 3 3 5 2 1
III 4 4 4 4 4 4 0 1
IV 4 4 3 y 5 2 3 5 2 1
40Importante para describir los datos!!!!!!!!!!!!..
....
Medidas de Tendencia Central
Medidas de Dispersión
Medidas de posición
GráficosHistograma, BoxPlot
41RESUMEN Medidas descriptivas
- Posición
- Dividen un conjunto ordenado de datos en grupos
con la misma cantidad de datos - . Percentiles, cuartiles
- Centralización
- Indican valores respecto alos cuales los datos
parecen agrupares - . Media, mediana y moda
- Dispersión
- Indican la mayor o menor concentración de los
datos con respecto a las medidas de
centralización - . Varianza, desviación estándar, rango o
recorrido - Forma
- Asimetría y apuntamiento
-
42Elección de medidas de tendencia central y de
dispersión
Variable Nominal
Moda
Variable Ordinal
Variable Contínua
- Con distribución desconocida o asimétrica
- Con distribución simétrica y unimodal (Ej Normal)