Title:
1Analiza wielowymiarowa sytuacji ekonomicznej
Polski oraz krajów Azji i Europy Wschodniej
- Anna Zemojtel
- Leszek Boguszewski
- Kolo Naukowe Metod Ilosciowych
- Katedra Statystyki
- Wydzial Zarzadzania
- Uniwersytet Gdanski
- Praca napisana pod opieka naukowa dr hab.
Andrzeja Balickiego, prof. UG oraz dr Kamili
Migdal Najman i dr Krzysztofa Najman.
2Cele badan
- pogrupowanie panstw w jednorodne podzbiory ze
wzgledu na kondycje ekonomiczna, - wskazanie panstwa o najlepszej i najgorszej
kondycji ekonomicznej, - przedstawienie statystycznych metod analizy
wielowymiarowej sluzacych obiektywnej ocenie
kondycji ekonomicznej.
3Wybór cech diagnostycznych
- X1 - Import- cif (ceny biezace) na 1
mieszkanca w USA, - X2 - Eksport- fob (ceny biezace) na 1 mieszkanca
w USA, - X3 - Wydatki w PKB,
- X4 - Rezerwy dewizowe w mln USA,
- X5 - Dlugi zagraniczne na 1 mieszkanca w USA,
kraje powyzej 10 mld USA, - X6 - Zagraniczne inwestycje bezposrednie w kraju
w mln USA, - X7 - Krajowe inwestycje bezposrednie za granica
w mln USA, - X8 - PKB na 1 mieszkanca w USA,
- X9 - Procent bezrobotnych majacych wyksztalcenie
wyzsze, - X10 - Pracujacy w posrednictwie finansowym i
innych uslugach (w tys.) /ogól pracujacych.
4Analiza Glównych Skladowych
- wskazanie istotnych zaleznosci, jakie zachodza
miedzy zmiennymi opisujacymi zjawiska
wielowymiarowe, - redukcja wymiaru przestrzeni cech,
- podzial cech na podgrupy (glówne skladowe),
- interpretacja relacji miedzy skladowymi.
5 Etapy Analizy Glównych Skladowych
- standaryzacja danych macierzy obserwacji,
- utworzenie macierzy korelacji,
- wyznaczenie wektorów wartosci wlasnych,
- wyznaczenie ladunków skladowych,
- obliczenie wspólczynników korelacji j-tej
zmiennej z l-ta skladowa glówna. -
6Pozostawione glówne skladowe lacznie
wyjasniaja ponad 82 calkowitej zmiennosci
porównywanych cech, co prezentuje ponizsza
tablica.
Tablica 1. Wartosci wlasne.
Zmienne Wartosc wlasna ogólu wyjasnionej wariancji Skumulowana wartosc wlasna Skumulowany ogólu wyjasnionej wariancji
X1 3,9925 39,9249 3,9925 39,9249
X2 1,8687 18,6873 5,8612 58,6121
X3 1,2818 12,8177 7,1430 71,4299
X4 1,0970 10,9701 8,2400 82,3999
X5 0,8568 8,5680 9,0968 90,9679
X6 0,3882 3,8816 9,4850 94,8495
X7 0,2707 2,7072 9,7557 97,5567
X8 0,2031 2,0311 9,9588 99,5878
X9 0,0375 0,3748 9,9963 99,9625
X10 0,0038 0,0375 10,0000 100,0000
Zródlo Opracowanie
wlasne- Statistica 6.0
7 Etapy Analizy Glównych Skladowych
- Pozostawiono 4 glówne skladowe, gdyz celem tej
analizy jest - wyjasnienie jak najwiekszej czesci zmiennosci
przez jak najmniejsza - liczbe skladowych. Ilustracja istotnosci glównych
skladowych jest - wykres osypiska.
8Wykres 1. Wykres osypiska
Zródlo Opracowanie wlasne - Statistica 6.0.
9Kolejne etapy Analizy Glównych Skladowych
- wyznaczenie ladunków skladowych,
- obliczenie wspólczynników korelacji j-tej
zmiennej z l-ta skladowa glówna. - Powyzsze dzialania przedstawione sa w tablicy.
10Tablica 2. Wyniki analizy glównych skladowych po
dokonaniu normalizacji.
ZMIENNE LADUNKI SKLADOWE LADUNKI SKLADOWE LADUNKI SKLADOWE LADUNKI SKLADOWE KORELACJE MIEDZY ZMIENNYMI A SKLADOWYMI KORELACJE MIEDZY ZMIENNYMI A SKLADOWYMI KORELACJE MIEDZY ZMIENNYMI A SKLADOWYMI KORELACJE MIEDZY ZMIENNYMI A SKLADOWYMI
ZMIENNE w1 w2 w3 w4 KORELACJE MIEDZY ZMIENNYMI A SKLADOWYMI KORELACJE MIEDZY ZMIENNYMI A SKLADOWYMI KORELACJE MIEDZY ZMIENNYMI A SKLADOWYMI KORELACJE MIEDZY ZMIENNYMI A SKLADOWYMI
X1 0,4830 -0,0649 0,0383 -0,0229 0,9652 -0,0887 0,0434 -0,0240
X2 0,4779 0,0516 0,0444 0,1749 0,9549 0,0706 0,0503 0,1832
X3 0,2179 -0,1314 -0,4276 -0,4725 0,4354 -0,1796 -0,4841 -0,4949
X4 0,1085 0,6348 -0,0809 0,0683 0,2167 0,8677 -0,0916 0,0716
X5 0,0467 -0,1821 -0,4051 0,7768 0,0932 -0,2489 -0,4587 0,8136
X6 0,1963 -0,4344 0,1990 -0,2251 0,3922 -0,5938 0,2253 -0,2358
X7 0,4054 -0,1985 0,2152 0,2351 0,8100 -0,2713 0,2436 0,2463
X8 0,3230 0,5283 -0,1344 -0,0987 0,6453 0,7221 -0,1521 -0,1034
X9 0,0802 0,1481 0,7193 0,1075 0,1603 0,2024 0,8144 0,1126
X10 0,4040 -0,1035 -0,1472 -0,1017 0,8073 -0,1415 -0,1667 -0,1065
Zródlo Obliczenia wlasne.
11Analiza skupien
Celem analizy skupien jest organizowanie
obserwowanych danych w sensowne grupy
poprzez analize podobienstw w obszarach poddanych
badaniu.
12Analiza skupien c.d.
- Kryteria postepowania
- Elementy wewnatrz grup powinny byc maksymalnie
podobne, - Elementy róznych grup powinny byc maksymalnie
zróznicowane.
13Metody Grupowania
- Najczesciej stosuje sie dwie metody
- Hierarchiczne - sekwencyjne laczenie obiektów w
jednorodne grupy, - Podzialowe (k-srednich) - podzial obiektów na, z
góry okreslona, ilosc skupisk .
14Metody Grupowania
- Ilustracja wyników grupowania hierarchicznego
jest - diagram drzewka polaczen,
- tzw. dendrogram.
15Dendrogram
Zródlo Opracowanie wlasne - Statistica 6.0.
16Powstale podgrupy
- Malezja i Republika Korei,
- Estonia i Izrael,
- Litwa, Lotwa, Turcja, oraz Polska,
- Indonezja, Pakistan, Rosja, Bialorus, Indie,
Chiny oraz Tajlandia, - Japonia (outlier).
17Wykres Srednich
- W wyniku grupowania metoda k-srednich na piec
podgrup otrzymano identyczne, w porównaniu z
metoda hierarchiczna, skupiska. - Ciekawych informacji na temat wartosci zmiennych
w podgrupach dostarcza wykres srednich. -
18Metoda k-srednich
Japonia
Malezja i Republika Korei
Estonia i Izrael
Litwa, Lotwa, Turcja i Polska
Indonezja, Pakistan, Rosja, Bialorus, Indie,
Chiny i Tajlandia,
Zródlo Opracowanie wlasne - Statistica 6.0
19Porzadkowanie liniowe
Celem porzadkowania liniowego jest
zhierarchizowanie panstw ze wzgledu na poziom
rozpatrywanych cech oraz odnalezienie obiektu
pierwszego i ostatniego.
20Tablica 3. Wyniki porzadkowania liniowego.
Pozycja Kraj Miara rozwoju
1 Japonia 0.5231
2 Izrael 0.5133
3 Estonia 0.4306
4 Malezja 0.3878
5 Republika Korei 0.3512
6 Lotwa 0.3357
7 Polska 0.3232
8 Litwa 0.3125
9 Turcja 0.2525
10 Chiny 0.2434
11 Tajlandia 0.2028
12 Rosja 0.1897
13 Pakistan 0.1711
14 Indonezja 0.1576
15 Bialorus 0.1469
16 Indie 0.1290
- Porzadkowanie liniowe
- Metoda wzorca
- rozwoju
21http//knmi.wzr.pl