Title: VARIABLES Descriptores parte I
1VARIABLESDescriptores parte I
- Mario Briones L.
- MV, MSc
- 2005
2Variables
- Son la materia prima de la estadística.
- Es un atributo que varía entre un individuo y
otro. - Ejemplo peso, estatura, color de pelaje, etc.
3Variables
Algunas variables en un sistema productivo
ovino -Raza -Peso de las ovejas -Peso del vellón
a la esquila -Peso de los corderos al
nacimiento -Peso de los corderos a venta -Valor
del kilo de peso vivo -Color de la
lana -Producción de forraje -Precipitación
anual -Forrajeras más comunes -Calidad del suelo
4Variables
Algunas variables relacionadas con la dificultad
de parición en vacas -Peso del ternero al
nacer -Peso de la vaca -Edad de la
vaca -Perímetro toráxico -Perímetro de la
cabeza -Perímetro de la articulación del
carpo -Area de la cavidad pélvica -Grado de
dificultad del parto -Condición corporal de la
vaca
5Variables
- Tipos de variables
- Cuantitativas expresadas en números. Pueden ser
de dos tipos - Continuas (peso, estatura)
- Discretas (tamaño de camada)
- Cualitativas
- No son mediciones sino más bien una
característica del individuo. Por ejemplo,
sexo, color de pelaje. Puede ser codificada con
números (ej sexo 1 hembra sexo 2 macho) pero
sigue siendo una característica no una medición.
6Escalas de medición
VALORES ORDENADOS VALORES EQUIDISTANTES PUNTO CERO NATURAL
NOMINAL
ORDINAL X
INTERVALO X X
RAZÓN X X X
7Escalas de medición
- Nominal el atributo es sólo un nombre, no hay
relación de precedencia entre las diferentes
categorías. Ej sexo, color. - Ordinal existe relación de precedencia pero no
hay garantía de un intervalo constante entre las
categorías. Ej dificultad de parición. - De intervalo Existe relación de precedencia y un
intervalo constante entre categorías pero no hay
cero absoluto. Ej temperatura en grados Celsius - De razón Existe un cero absoluto que indica
ausencia de valor. Ej. mediciones de peso,
tamaño, etc.
8Escala nominal
- Sexo de animales
- Macho, Hembra
- Color de capa en ganado Angus
- Negro, Rojo
- Presencia de un alelo
- Positivo, Negativo
9Escala ordinal
- Dificultad de parición
- (0) Sin dificultad
- (1) Con dificultad leve
- Asistencia de una persona
- (2) Con dificultad severa
- Asistencia de más de una persona
- (3) Cesárea
- Imposibilidad de parto normal
10Escala de intervalo
No es el doble de temperatura que 10 grados
40 30 20 10 0 - 10 - 20 - 30 - 40
No indica ausencia de temperatura
11Escala de razón
Por ejemplo el peso Existe un cero absoluto para
indicar ausencia de valor. Diez miligramos es el
doble de peso comparado con 5 miligramos
0.00000 mg
12Manejo y presentación de datos a programas
computacionales. Estructura básicas de base de
datos registros (individuos) y campos (variables)
13Resumen y descripción de datos.
- Cada vez que se obtienen datos a partir de una
muestra, uno de los primeros procesos es la
obtención de DESCRIPTORES, los cuales son una
especie de valores representativos de los datos. - Los descriptores obtenidos en una muestra se
denominan ESTIMADORES. Estos son un reflejo de
los mismos descriptores en la población, donde se
denominan PARAMETROS.
14Resumen y descripción de datos.
- También los gráficos y tablas son formas
resumidas de entregar el significado de los
datos - Estas representaciones numéricas y/o gráficas
constituyen lo que se denomina ESTADISTICA
DESCRIPTIVA
15Uso de la descripción
- La ESTADISTICA DESCRIPTIVA es la base de la
ESTADISTICA INFERENCIAL - Inferencias en estadística son las extensiones o
conclusiones que, a partir de los datos de la
muestra, se hacen sobre la población.
16Uso de la descripción
- Estadística descriptiva
- resume o describe una muestra.
- Ej promedio de lluvia caída en cada uno de los
doce meses del año en Chillán. - Estadística infererencial
- hace generalizaciones a partir de la muestra,
sobre una población mayor - Ej la probabilidad de lluvia en un periodo
determinado del año.
17Descripción básica
A continuación se presentan los datos de
producción de leche corregida a 305 días, de un
grupo de vaquillas de primer parto. Se observa
que los datos están ordenados de acuerdo con el
número de identificación de los animales, que
es como normalmente se obtiene esta
información. Se puede ver que no es muy fácil
tener una buena percepción de la variable, cuando
los datos están presentados de esta forma.
18(No Transcript)
19ARREGLO ORDENADO
20Distribución de frecuencia
El primer paso de análisis de la variable es la
construcción de la distribución de frecuencia de
la variable en la muestra. Consiste, simplemente,
en agrupar los datos a lo largo del recorrido o
rango de la variable para de esta manera ubicar
el número de observaciones que se encuentra
en cada categoría. Existen fórmulas para
determinar el mejor número de categorías que
conviene para describir mejor una variable pero
en general, las reglas básicas son dividir el
rango (valor más grande menos el más pequeño) en
una cantidad de intervalos iguales. En la
práctica, se puede también lograr esto por prueba
y error. El número de categorías no debe ser muy
grande ni muy pequeño, aunque también depende del
número de datos.
21RECORRIDO DE LA VARIABLE
3890
7015
Rango 7015 - 3890 3125
INTERVALOS DE CLASE
3125/5 625 UNIDADES ANCHO DEL INTERVALO
22LÍMITES SUPERIOR E INFERIOR DE LA CLASE
NUMERO DE OBSERVACIONES EN LA CLASE 2 6 9
10 3
3890 4415 4416 5141 5142 5767 5768 6393 6394 7
019
3890 3890625 4415 4416 625 5141 5142 625
5767 5768 625 6393 6394 625 7019
23OBSERVACIONES FRECUENCIA RELATIVA 2 2/30
0,066 6 6/30 0,2 9 9/30
0,3 10 10/30 0,33 3 3/30 0,1
CLASE
3890 4414 4415 5149 5140 5764 5764 6389 6390 7
015
1 2 3 4 5
24HISTOGRAMA DE FRECUENCIA
FRECUENCIA RELATIVA
0,30
0,20
0,10
0
CLASE
1 2 3 4 5
25Notación matemática
X simboliza la variable x (minúscula), simboliza
los valores individuales x1, x2, valores
particulares de la variable xi, valor típico de
la variable xN, último valor de una población
finita S sumatoria
26Tipos de descriptores
- Descriptores de tendencia central
- Descriptores de dispersión
27Medidas de tendencia central
- Media aritmética o promedio
En la población En la muestra
28Ejemplo arreglo ordenado de 134 valores
de alzada en caballos de raza chilena (en cm)
29Histograma de frecuencia
30Media aritmética
139.27
31Mediana
- EN UN CONJUNTO DE VALORES ES AQUEL VALOR QUE
DIVIDE AL CONJUNTO EN DOS PARTES IGUALES. IGUAL
NÚMERO DE VALORES MAYORES Y MENORES QUE LA
MEDIANA
EN EL EJEMPLO 134/2 67 posición 67
139.5 Posición 68 140 (139.5140)/2 139.75
CANTIDAD IMPAR x1 x2 x3 x4
x5 CANTIDAD PAR x1 x2 x3 x4 x5
x6
32Mediana
(139.5140)/2139.75
33Moda
- LA MODA EN UN CONJUNTO DE VALORES ES AQUEL VALOR
QUE OCURRE CON MAS FRECUENCIA. - SI NINGUN VALOR SE REPITE, NO EXISTE MODA
- SI DOS VALORES SE REPITEN LA MISMA CANTIDAD DE
VECES, HAY DOS MODAS - EN EL EJEMPLO LA MODA ES 140 CM.
34Resumen de descriptores de tendencia central
- MEDIA 139.27 cm.
- MEDIANA 139.75 cm.
- MODA 140 cm.