Title: ACP: Gr
1ACP Gráfica de Entradas (p1/p3)
Temporada
2Conclusiones p3
Verano
INTERPRETACIÓN Componente 3 Astillas de verano
vs. astillas de invierno
Invierno
3Qué hemos logrado?
Usando el ACP, hemos determinado que el 45 de la
variabilidad en las 130 variables originales
pueden ser representadas usando sólo 3 variables
o componentes. Estos tres componentes son
ortogonales, lo que significa que la variación en
cada uno ocurre independientemente de los otros.
En otras palabras, los nuevos componentes están
no correlacionados uno con otro.
Componente 3 Ajusta el 6
VERANO / INVIERNO
RENDIMIENTO DE REFINADO
Componente 1 Ajusta el 32
BRILLO
Componente 2 Ajusta el 7
Ejemplo 1
4Qué tan exactos son los nuevos componentes?
Cada nuevo componente es una combinación linear
simple de las variables originales. Por ejemplo,
en este caso el componente 3 es nada más y nada
menos que la siguiente ecuación Componente 3
0.242472 x TEMPORADA 0.159948 x
85LCS320.AI varios términos positivos
0.224472 x 52ZI144.AI 0.214372 x
52TR964.AI varios términos negativos
Obviamente esta ecuación, cuando se escribe
completa, tiene 130 términos, uno para cada
variable original. Varios de éstos, sin embargo,
tienen coeficientes cercanos a cero, lo que
indica que tienen un impacto muy pequeño en ese
componente.
Ejemplo 1
5Qué hay sobre la varianza no ajustada?
- Nuestro modelo de ACP ha capturado el 45 de la
variabilidad en el conjunto original de datos.
Qué hay del otro 55? - La varianza no ajustada tiene varias fuentes
- Sólo retenemos tres componentes. Mayor varianza
es capturada por componentes de mayor orden, pero
mucho de éste es ruido y no tiene uso para los
ingenieros de proceso. - Nuestro modelo linear es una simplificación del
conjunto original de datos, y por lo tanto no
puede ajustar el 100 de la varianza. - Desviaciones y otros problemas con el conjunto
original de datos puede debilitar seriamente el
modelo (Basura dentro, basura fuera) - Algunas de las variables que impactan el proceso
no fueron medidas ( o hasta podrían ser
inmedibles) - El último punto es muy importante para nuestro
ejemplo, ya que muchas características clave de
las astillas, incluyendo la especie de madera,
nunca fueron medidas.
Ejemplo 1
6Uso del PEL
Ahora daremos una pequeña mirada al uso del PEL,
usando los mismos datos. Una característica
importante de la pulpa es la longitud promedio de
la fibra, porque mientras más largas sean las
fibras se obtendrá un papel más resistente. Esta
característica está representada en nuestros
datos por tres variables Pex_L1_LMF,
Pex_L1_R28 y Pex_L1_R28. Designaremos estas
tres variables como Ys. El resto de las
características de la pulpa fueron excluidas del
análisis PEL. Todas las otras variables fueron
designadas como Xs.
PEL
Ejemplo 1
7Resultados para el Modelo PEL
Esta es la gráfica de R2 y Q2 para el modelo PEL.
Los valores de R2 nos indican que el primer
componente ajusta el 23 de la variabilidad en
las Ys originales, el segundo otro 13 y el
tercero otro 8, para un total de 44. Los
valores de Q2 son sólo un poco más bajos, lo que
indica que el modelo trabaja relativamente bien
en la predicción de los nuevos valores de Y.
Ejemplo 1
8PEL Gráfica Resultado/Entradas
Al realizar el PEL, una de las principales cosas
por saber son cuáles Xs son importantes para el
modelo. En otras palabras, qué Xs están
correlacionadas con nuestras Ys? Esto se puede
determinar estudiando las gráficas de resultados
y entradas que muestran las Xs e Ys en relación
a los nuevos componentes. Sin embargo, estas
gráficas pueden ser muy desordenadas y
complicadas de leer, como se muestra en la
siguiente página. Observe que los ejes están
etiquetados diferente para las gráficas PEL. En
lugar de p(1), por ejemplo, la absisa es
designada como wc(1). Esto refiere la naturaleza
dual de la gráfica, mostrando en el mismo espacio
a X e Y.
Ejemplo 1
9Gráfica de Entradas de PEL
La interpretación de esta gráfica revuelta y
confusa no es obvia. Por lo cual recurrimos a
otras salidas
10PEL Otras gráficas
- Ahora veremos el número de diferentes gráficas
que nos pueden ayudar para interpretar los
resultados del PEL. - La primera es la gráfica general X/Y, que da R2
y Q2 para cada X original. Esto nos dice qué tan
bien fue modelada cada variable original.
Ejemplo 1
11X/Y General
Ejemplo 1
12PEL Otras gráficas
- El siguiente tipo de gráfica es la gráfica de
coeficiente, que muestra la ecuación del PEL en
forma gráfica. Los coeficientes para X son
mostrados como barras positivas y negativas.
Ejemplo 1
13Coeficientes PEL
Ejemplo 1
14PEL gráficas GIV
Otra gráfica útil es la Gráfica de Importancia
de Variable (GIV) que cataloga las Xs en
términos de importancia al modelo. Observe que,
como no se ha utilizado un ejemplo planeado, no
podemos deducir que estas Xs influencian las
Ys. El AMV por sí solo no prueba la causa y
efecto. Todo lo que podemos decir es que están
correlacionados, lo que indica que tienen a
cambiar al mismo tiempo. La causa real puede ser
externa, como un cambio en la calidad de la
materia prima. Veamos la gráfica GIV.
Ejemplo 1
15Gráfica de Importancia de Variable
Xs
Estas son las Xs que tienen la correlación más
fuerte con nuestras Ys.
Ys
Variaciones de la longitud de la fibra
Ejemplo 1
16Las Xs más importantes
La X más importante, de a cuerdo a la gráfica
GIV, es la Temporada. Esto significa que la
longitud de la longitud de la fibra varía más con
la temporada que con cualquier otra variable
X. Las otras Xs en la lista son
principalmente parámetros de las operaciones de
refinado como el flujo del agua de dilución,
presión hidráulica y las entradas de energía. Un
experto en operaciones de refinado encontraría
estos resultados interesantes, pero no los
examinaremos a detalle en este ejercicio.
Ejemplo 1
17Los Límites del PEL
Los resultados del PEL son difíciles de
interpretar. Siempre es preferible efectuar
primero un ACP en todo el conjunto de datos, para
predecir la tendencia general. Uno de los
aspectos más complicados es que el primer
componente en el espacio X debe corresponder al
primer componente en el espacio Y, el segundo con
el segundo, y así sucesivamente. Encontrar una
explicación física para esto puede ser
extremadamente difícil. Es crítico para el
estudiante entender que sólo estas Xs que fueron
medidas pueden ser incluidas en la gráfica del
modelo PEL. No hay nada mágico en el ACP o PEL.
Estas técnicas pueden sólo encontrar patrones y
correlaciones existentes en los datos originales
en primer lugar.
El AMV no es mágico
Ejemplo 1
18Fin del Ejemplo 1 Estamos empezando a
domar al león del AMV!
192.2 Ejemplo (2) Uso de Pocas Variables
20Por qué usar pocas variables?
Un problema obvio con el ejemplo anterior es que
las gráficas son muy difíciles de leer, porque
tienen muchas variables. Por lo tanto, buscaremos
un número menor de variables para el mismo
conjunto de datos. Existe otra buena razón para
hacer esto. En el ejemplo anterior, nuestro
primer componente de rendimiento dominaba a los
otros, probablemente porque varias variables del
proceso están asociadas directa o indirectamente
con el flujo total a través del sistema. En
otras palabras, existía una gran redundancia en
la elección de variables. Esto no es
intrínsicamente malo, fuimos capaces de aprender
algunas cosas útiles a cerca de nuestro proceso,
pero quizá al reducir el número inicial de
variables podemos aprender más cosas aún.
Ejemplo 2
21Naturaleza Iterativa del AMV
- En este punto, nuestra aproximación es probable
que parezca CONFUSA. El estudiante debe estar
preguntándose - Usamos todos los datos o primero removemos las
desviaciones? - Trabajamos con ACP o PEL?
- Usamos todas las variables o pocas variables?
- La respuesta es que el AMV es muy iterativo y no
es infalible. Los resultados de un paso guían al
siguiente. Algunas veces se deben tratar cosas
diferentes para obtener resultados útiles,
teniendo en mente lo que sabe usted del proceso y
del conjunto de datos. - Los expertos en el AMV tienen la costumbre de
tratar todo tipo de cosas, todo de diferente
manera. De hecho, el hacer un ACP básico es una
parte sencilla. La parte difícil es decidir que
hacer después, porque hay un sinfín de
posibilidades. El conocimiento del proceso es la
clave, por lo tanto este trabajo es para los
ingenieros químicos y no para los estadistas.
Ejemplo 2
22Qué variables usar?
Volviendo al ejemplo, hicimos una lista corta
de las variables clave basada en nuestro
conocimiento del proceso. Sólo porque cientos de
variables están disponibles no significa que
estamos obligados a usarlas todas para el
AMV. Las variables relacionadas íntimamente a la
calidad de las astillas (densidad y contenido de
humedad) y a la calidad de la pulpa (brillo,
consistencia,), también se incluye la
TEMPORADA, debido a su importancia en el
análisis anterior de ACP, consumo de blanqueador
y la energía específica de refinado. Con todo,
sólo 14 variables fueron usadas.
?
Ejemplo 2
23ACP con 14 variables
Esta es la gráfica R2 y Q2 para las 14 variables.
El software del AMV sólo encontró 2 componentes,
lo cual no es común cunado se tienen tan pocas
variables iniciales. El primer componente ajusta
el 28 de la variabilidad en los datos
originales, el segundo otro 16 para un total de
44. Los valores de Q2 son mucho más pequeños,
con un casi un 24 acumulado. Esto significa que
el valor predictivo del modelo es mucho más
pequeño que antes. Esto no es sorprendente, ya
que la información inherente contenida dentro de
las 116 variables excluidas está ahora
desaparecida.
Ejemplo 2
24Gráfica de Resultados para 14 variables
La gráfica de resultados para 14 variables se
muestra en la siguiente página. Es imposible
crear una gráfica de resultados en 3-D en este
caso porque sólo se tienen 2 componentes. L
a gran mayoría de los días caen dentro o cerca
del primer componente. Es bastante obvio en esta
gráfica que el primer componente está relacionado
a las temporadas individuales, con una clara
segregación entre los tres años. Observe cómo
este primer componente se parece al segundo
componente del ejemplo 1 (más de esto después)
Otoño Sep 1 Nov 30 Invierno Dic 1 Feb
28 Primavera Mar 1 May 31 Verano Jun 1 Ago
31
Ejemplo 2
25Gráfica de Resultados
2do componente altamente influenciado por estos
tres puntos
Otoño Sep 1 Nov 30 Invierno Dic 1 Feb
28 Primavera Mar 1 May 31 Verano Jun 1 Ago
31
1
4
Jun 25 Jul 1, 01
1
2
Ago 8 12, 01
2002
2000
2001
2000
2001/2002
VERANO
INVIERNO
INTERPRETACIÓN Componente 1 Temporadas
individuales
26Segundo componente
El segundo componente es ampliamente influenciado
por las observaciones en el cuadrante superior
derecho (recuerde, son las observaciones que
influencian los componentes, y no al revés).
Volviendo a observar los datos originales, vemos
que estas observaciones cayeron dentro de ciertos
periodos específicos en Junio y Agosto del
2001. Qué diferencia a estos periodos del resto
del marco de los tres años? Tratar de
comprender esto observando los datos originales
seria tedioso, o hasta imposible. Por lo tanto,
hacemos uso de la Gráfica de contribución para
los mismos datos de interés. La gráfica de
contribución muestra los valores de las variables
originales para ese punto de observación (Junio
29, 2001) relativo al promedio de todas las
observaciones tomadas juntas. Esto nos da un
respuesta visual rápida a Cuál es la diferencia
sobre esta observación?
Ejemplo 2
27Gráfica de Contribución Junio 29, 2001
Más finas que el promedio
Fibras más cortas que el promedio
28Resultados de la Gráfica de contribución
Las barras en la gráfica de contribución dicen
una historia importante durante el periodo de
interés, los refinadores generaron fibras más
finas y menos largas que lo usual. Pareciera que
los refinadores cortaron las fibras, eliminando
las fracciones largas y generando fragmentos
finos. Este no es el comportamiento deseable del
proceso y por lo tanto, es un descubrimiento
importante. Un estudio de la gráfica de entrada
confirma que el segundo componente está
definitivamente relacionado a la longitud de la
fibra (variables en óvalos rojos). Observe que
una variable no cae directamente en un componente
para influenciarlo en este caso, muy pocas de
las variablesestán cerca de la línea del
componente, claramente la afectan. Si distancia
desde el eje podría significar que están
relacionadas al segundo componente. Observe que
la energía específica también está relacionada al
segundo componente (óvalo verde). Esto es muy
importante, ya que es la energía que corta las
fibras. El consumo de blanqueador, brillo de la
pulpa y la temporada están relacionadas al primer
componente (óvalos azules). Otra vez, es similar
al ejemplo 2.
Ejemplo 2
29Gráfica de Entradas
INTERPRETACIÓN Componente 2 Longitud de la fibra
-
_Blan
30Los mismos dos componentes?
La diferencia más obvia entre los resultados del
ejemplo 1 y 2 es que el componente rendimiento
ha desaparecido. Esto se debe a que hemos
removido todas las variables relacionadas a los
parámetros del proceso. Esto nos hace
preguntarnos si los dos componentes que
encontramos en el ejemplo 2 son el segundo y
tercer componente del ejemplo 1. En otras
palabras, ahora que hemos eliminado el
rendimiento, el siguiente componente en
importancia ha sido promovido para ser el
primer componente y el tercero al segundo. Como
todos los componentes son estadísticamente
independientes, esto es plausible. 1 2
3 La interpretación física de estos componentes
parece ser compatible, así que este cambio es
totalmente positivo. Por lo tanto, una
comparación entre los ejemplos 1 y 2 podría
darnos una mayor comprensión del proceso.
X
Ejemplo 2
31Vale la pena intentar con menos variables?
Absolutamente! Somos capaces de generar
gráficas más limpias y fácil de interpretar,
mientras nos enfocamos en las variables de
interés. Otra vez, vimos la importancia de la
Temporada, dando crédito a nuestra interpretación
física en el Ejemplo 1. Otras similitudes con los
resultados del ejemplo 1, particularmente con los
dos componentes, podría permitir una mayor
comprensión de lo que está sucediendo en el
proceso. Sin embargo, la Q2 para este caso de
huesos-expuestos es baja, lo que indica que el
modelo tiene un pobre valor predictivo. También,
muchas variables importantes no fueron
consideradas en lo absoluto, así que no se obtuvo
una imagen completa, pero provee de una vista
adicional al conjunto original de datos.
Ejemplo 2
32Fin del Ejemplo 2 Haciéndote más listo