Title: Metodi Quantitativi per Economia, Finanza e Management Lezione n
1Metodi Quantitativi per Economia, Finanza e
ManagementLezione n11
2Analisi fattoriale
- Quando le variabili considerate sono numerose
spesso risultano tra loro correlate. - Numerosità e correlazione tra variabili porta a
difficoltà di analisi gt ridurre il numero
(semplificando lanalisi) evitando, però, di
perdere informazioni rilevanti. - LAnalisi Fattoriale è una tecnica statistica
multivariata per lanalisi delle correlazioni
esistenti tra variabili quantitative. - A partire da una matrice di dati X(nxp), con
n osservazioni e p variabili originarie,
consente di sintetizzare linformazione in un set
ridotto di variabili trasformate (i fattori
latenti).
3Analisi fattoriale
- Le ipotesi del Modello Fattoriale
Variabili Quantitative x1, x2, ......, xi,
......... xp
Info xi Info condivisa Info
specifica Var xi Communality Var
specifica xi f(CF1, ....,CFk) UFi
Corr (UFi , UFj) 0 per i j Corr (CFi ,
CFj) 0 per i j Corr (CFi , UFj) 0
per ogni i,j
4Analisi fattoriale
- Factor Loadings Factor Score Coefficients
xi li1CF1 li2CF2 .... likCFk
UFi li1, li2,........,lik factor loadings i
1, ........., p significato fattori
CFj sj1x1 sj2x2 ..............
sjpxp sj1, sj2,........,sjp factor score
coeff. j 1, ....., k ltlt p costruzione fattori
5Analisi fattoriale
Metodo delle Componenti Principali
- I fattori calcolati mediante il metodo delle CP
sono combinazioni lineari delle variabili
originarie -
- Sono tra loro ortogonali (non correlate)
- Complessivamente spiegano la variabilità delle p
variabili originarie - Sono elencate in ordine decrescente rispetto alla
variabilità spiegata
CPj sj1x1 sj2x2 .............. sjpxp
6Analisi fattoriale
Metodo delle Componenti Principali
- Il numero massimo di componenti principali è pari
al numero delle variabili originarie (p). - La prima componente principale è una combinazione
lineare delle p variabili originarie ed è
caratterizzata da varianza più elevata, e così
via fino allultima componente, combinazione
sempre delle p variabili originarie, ma a
varianza minima. - Se la correlazione tra le p variabili è elevata,
un numero kltltp (k molto inferiore a p) di
componenti principali è sufficiente rappresenta
in modo adeguato i dati originari, perché
riassume una quota elevata della varianza
totale.
7Analisi fattoriale
- I problemi di una analisi di questo tipo sono
- a) quante componenti considerare
- b) come interpretarle
8Analisi fattoriale
- Quante componenti considerare?
- metodo degli autovalori gt1
- rapporto tra numero di componenti e variabili
(circa 1/3) - percentuale di varianza spiegata (almeno 60)
- lo SCREE PLOT (plot di autovalore vs il numero di
fattori) - Se il plot mostra un gomito è plausibile
ipotizzare lesistenza di una struttura latente,
se la forma è quasi rettilinea significa che i
fattori sono solo una trasformazione delle
variabili manifeste. I fattori rilevanti sono
quelli al di sopra del gomito (a discrezione
anche quello in corrispondenza del gomito). Se
non ci sono fattori predominanti il criterio è
inadatto. - le comunalità
- interpretabilità delle componenti e loro
rilevanza nella esecuzione dellanalisi
successive
9Analisi fattoriale
- Come interpretarle?
- rotazione delle componenti
- La rotazione ortogonale nello spazio dei fattori
non influenza la validità del modello sfruttiamo
questa caratteristica per ottenere dei fattori
più facilmente interpretabili. - correlazioni tra componenti principali e
variabili originarie
10Analisi Fattoriale
- Qualità degli ingredienti
- Genuinità
- Leggerezza
- Sapore/Gusto
- Caratteristiche Nutrizionali
- Attenzione a Bisogni Specifici
- Lievitazione Naturale
- Produzione Artigianale
- Forma/Stampo
- Richiamo alla Tradizione
- Grandezza della Confezione (Peso Netto)
- Funzionalità della Confezione
- Estetica della Confezione
- Scadenza
- Nome del Biscotto
- Pubblicità e Comunicazione
- Promozione e Offerte Speciali
- Consigli per lUtilizzo
- Prezzo
- Sono stati individuati 20 attributi
caratterizzanti il prodotto-biscotto - È stato chiesto allintervistato di esprimere un
giudizio in merito allimportanza che ogni
attributo esercita nellatto di acquisto -
11Analisi fattoriale
121. The ratio between the number of components and
the variables One out of Three 20 original
variables 6-7 Factors
132. The percentage of the explained variance
the higher the better! between 60-75 is good
14Factor Analysis
3. The scree plot The point at which the scree
begins
154. Eigenvalue Eigenvaluesgt1
16Factor Analysis
17Analisi Fattoriale
185. Communalities The quote of explained
variability for each input variable must be
satisfactory In the example the overall
explained variability (which represents the mean
value) is 0.61057
19Factor Analysis
- 6. Interpretation Component Matrix (factor
loadings) - The most relevant output of a factorial analysis
is the so called component matrix, which shows
the correlations between the original input
variables and the obtained components (factor
loadings) - Each variable is associated specifically to the
factors (components) with which there is the
highest correlation - The interpretation of the each factor has to be
guided considering the variables with the highest
correlations related to single factor
206. Interpretation Correlation between Input
Vars Factors The new Factors must have a
meaning based on the correlation structure
216. Interpretation The correlation structure
between Input Vars Factors In this case
the correlation structure is well defined and the
interpretation phase is easier
22Factor Analysis
- Issues of the Factor Analysis are the following
- a) How many Factors (or components) need to be
considered - 6. The degree of the interpretation of the
components and how they affect the next analyses - b) How to interpret
- The correlation between the principal components
and the original variables - The rotation of the principal components
23Factor Analysis
- 6. Interpretation The rotation of factors
- There are numerous outputs of factorial analysis
which can be produced through the same input data - These numerous outputs dont provide
interpretation that are remarkably different from
one another, as matter of fact they differ only
slightly and there are areas of ambiguity
24Factor Analysis
x4
x3
Interpretation of the factors
25Factor Analysis
- 6. Interpretation The rotation of factors
- The Varimax method of rotation, suggested by
Kaiser, has the purpose of minimizing the number
of variables with high saturations (correlations)
for each factor - The Quartimax method attempts to minimize the
number of factors tightly correlated to each
variable - The Equimax method is a cross between the
Varimax and the Quartimax - The percentage of the overall variance of the
rotated factors doesnt change, whereas the
percentage of the variance explained by each
factors shifts
26Analisi Fattoriale
Before the rotation step
27Analisi Fattoriale
After the rotation step
285. Communalities The communalities dont change
after the Rotation Step
296. Interpretation The correlation structure
between Input Vars Factors improves after
the rotation step
306. Interpretation The correlation structure
between Input Vars Factors The variable
with the lowest communality is not well explained
by this solution
31Factor Analysis
- Once an adequate solution is found, it is
possible to use the obtained factors as new macro
variables to consider for further analyses on the
phenomenon under investigation, thus replacing
the original variables - Again taking into consideration the example, we
may add six new variables into the data file, as
follows - Health,
- Convenience Practicality,
- Image,
- Handicraft,
- Communication,
- Taste.
- They are standardized variables zero mean and
variance equal to one. - They will be the input for further analyses of
Dependence or/and Interdependence.
32Factor Analysis