Kontakty

Príprava údajov. Faktorová analýza. Hlavné rovnice a postupy metódy faktorovej analýzy hlavnej zložky. Účty Matrix

Existuje súbor štatistických postupov zameraných na výber variabilných premenných z daného súboru premenných, úzko spojených (korelácia) medzi sebou. Premenné zahrnuté v jednej podmnožine a korelácii medzi sebou, ale do značnej miery nezávisle od premenných z iných podmnožín faktorov. Účelom faktorovej analýzy je identifikovať jasne nie je pozorovateľné faktory s použitím množstva pozorovaných premenných. Ďalším spôsobom, ako skontrolovať počet vybraných faktorov, je výpočet korelačnej matrice, ktorá je blízko pôvodného, \u200b\u200bak sú faktory správne zvýraznené. Táto matica sa nazýva reprodukovaný korelačná matrica. Aby sa zistilo, ako sa táto matica odchyľuje od počiatočnej korelačnej matrice (z ktorej začala analýza), je možné vypočítať rozdiel medzi nimi. Zvyšková matrica môže indikovať "nesúhlas", t.j., že pri posudzovaní korelačných koeficientov nemožno získať s dostatočnou presnosťou na základe existujúcich faktorov. V metódach hlavných zložiek a faktorovej analýzy neexistuje takéto vonkajšie kritérium, ktoré umožňuje posúdiť správnosť riešenia. Druhým problémom je, že po výbere faktorov, nekonečný súbor možností otáčania vzniká na základe rovnakých počiatočných premenných, ale dávajú rôzne riešenia (faktorové štruktúry sú trochu infreagle). Konečná voľba medzi možnými alternatívami v nekonečnej súbore matematicky ekvivalentných riešení závisí od zmysluplného chápania výsledkov výkladov výskumných pracovníkov. A keďže neexistuje objektívne kritérium na hodnotenie rôznych riešení, navrhované odôvodnenia výberu riešení sa môžu zdať neopodstatnené a nekontrolované.


Treba poznamenať, že jasné štatistické kritériá úplnosti faktorizácie neexistuje. Avšak, jeho nízke hodnoty, napríklad menej ako 0,7, označujú vhodnosť znižovania počtu značiek alebo zvýšenie počtu faktorov.

Splnil vzťah medzi vzťahu medzi určitým znakom a všeobecným faktorom vyjadrujúcim opatrenie vplyvu faktora na označenie sa nazýva faktor zaťaženie tejto funkcie na tento všeobecný faktor.

Matrica pozostávajúca z faktorových zaťažení a má množstvo stĺpcov, ktoré sa rovná počtu bežných faktorov a počet riadkov, ktoré sa rovná počtu zdrojových značiek, sa nazýva faktor matrix.

Základom pre výpočet faktorovej matrice je matrica párovaných koeficientov korelácie počiatočných príznakov.

Korelačná matica zaznamenáva stupeň vzťahu medzi každou dvojicou značiek. Podobne faktor matrica zaznamenáva stupeň lineárnej komunikácie každej vlastnosti s každým spoločným faktorom.

Veľkosť faktorového zaťaženia nepresahuje jednotku a jeho označenie označuje pozitívnu alebo negatívnu väzbu s faktorom.

Čím väčšia je absolútna hodnota faktorového zaťaženia nápisu na určitom faktore, tým viac sa tento faktor určuje.

Hodnota faktorového zaťaženia na niektorých faktoroch blízke nule, naznačuje, že tento faktor neovplyvňuje toto označenie.

Faktorový model umožňuje vypočítať príspevky faktorov do celkovej disperzie všetkých značiek. Zhrnutie štvorcov faktorových zaťažení pre každý faktor vo všetkých značkách získavame svoj príspevok k celkovému rozptýleniu systému symptómov: Čím vyššia je podiel tohto príspevku, tým významnejšia je významná.

Zároveň je možné identifikovať optimálny počet spoločných faktorov, celkom dobre popisovať systém počiatočných značiek.

Hodnota (prejav) faktora v samostatnom objekte sa nazýva faktorová hmotnosť predmetu na tento faktor. FACKING HMOTNOSTI Umožňuje vám usporiadať, zefektívniť objekty pre každý faktor.

Čím väčšia je faktorová hmotnosť určitého objektu, tým viac sa v prípade fenoménu alebo vzoru prejavuje, čo sa prejavuje v tomto faktore.

Skutočné váhy môžu byť pozitívne aj negatívne.

Vzhľadom k tomu, že faktory sú štandardizované hodnoty s priemernou hodnotou rovnajúcou sa nula, továrne v blízkosti nula, hovoriť o priemernom stupni prejavu faktora, pozitívny - že tento stupeň je vyšší ako priemer, negatívny - o tom . Čo potom je pod priemerom.

Prakticky, ak je počet hlavných zložiek, ktoré už boli nájdené (alebo faktory) nie je viac ako m./ 2, disperzia vysvetlená aspoň 70% a ďalšia zložka prispieva k celkovej disperzii najviac 5%, model faktora sa považuje za veľmi dobrý.

Ak chcete nájsť hodnoty faktorov a uložíte ich vo forme ďalších premenných, použite skóre prepínača ... (hodnoty) faktorovej hodnoty, spravidla leží v rámci -3 až +3.

Faktorová analýza je silnejšie a komplexnejšie zariadenie ako hlavná metóda

komponent, takže sa používa, ak výsledky

analýza komponentov nie je celkom vhodná. Ale pretože tieto dve metódy

vyriešiť rovnaké úlohy, je potrebné porovnať výsledky komponentov a


analýzy faktora, t.j. na zaťaženie matice, ako aj regresné rovnice

hlavné komponenty a všeobecné faktory, komentár k podobnosti a rozdiely

výsledky.

Maximálny možný počet faktorov m. na daný počet funkcií ročník Definovaná nerovnosť

(P + m)<(р-m)2,

Na konci celého postupu faktorovej analýzy pomocou matematických transformácií sú FJ faktory vyjadrené počiatočnými príznakmi, to znamená, že parametre lineárneho diagnostického modelu sú explicitne.

Metódy hlavných zložiek a faktorovej analýzy sú súborom štatistických postupov zameraných na pridelenie variabilných premenných z daného súboru premenných, úzko súvisiacich (korelácia) medzi sebou. Premenné zahrnuté v jednej podmnožine a korelácii medzi sebou, ale do značnej miery nezávislé od premenných z iných podmnožín Forma 1 . Účelom faktorovej analýzy je identifikovať jasne nie je pozorovateľné faktory s použitím množstva pozorovaných premenných.

Všeobecný výraz pre j.-Kozeľovač môže byť zaznamenaný takto:

kde Fj. (j. sa líši od 1 do k.) - Toto sú spoločné faktory Ui - charakteristika Aij. - Konštanty používané v lineárnej kombinácii k. faktory. Charakteristické faktory nesmú navzájom korelovať a so spoločnými faktormi.

Postupy spracovania faktorov Analyticky aplikované na získané údaje sú odlišné, ale štruktúra (algoritmus) analýzy pozostáva z rovnakých veľkých stupňov: 1. Príprava počiatočnej matici dát. 2. Výpočet matice vzťahu značiek. 3. Faktorizácia (V tomto prípade je potrebné špecifikovať počet faktorov pridelených počas rozhodnutia o faktoroch a metóda výpočtu). V tomto štádiu (ako aj ďalšie) je tiež možné odhadnúť, ako dobre výsledný faktor riešenie prináša zdrojové údaje. 4. Rotácia je transformácia faktorov uľahčujúcich ich interpretáciu. päť. Počítanie tovární Pre každý faktor pre každé pozorovanie. 6. Interpretácia dát.

vynález faktorovej analýzy bol spojený s potrebou súčasne analyzovať veľký počet korelačných koeficientov rôznych šupín. Jedným z problémov spojených s metódami hlavných zložiek a faktorovej analýzy je, že kritériá, ktoré by umožnili overiť správnosť nájdeného riešenia, neexistuje. Napríklad s regresnou analýzou je možné porovnať ukazovatele pre závislé premenné získané empiricky, pričom ukazovatele vypočítali teoreticky na základe navrhovaného modelu a používajú koreláciu medzi nimi ako kritérium pre správnosť riešenia podľa korelácie Analýza pre dve sady premenných. V diskriminačnej analýze je správnosť založená na tom, ako presne predpovedá príslušnosť predmetov jednej alebo inej triedy (v porovnaní so skutočnou príslušnosťou, ktorá je v živote). Bohužiaľ, v metódach hlavných zložiek a analýzy faktorov, nie je takéto externé kritérium, ktoré umožňuje posúdiť správnosť rozhodnutia, druhým problémom je, že po výbere faktorov vzniká nekonečný súbor možností otáčania, Na základe rovnakých zdrojových premenných, ale dávajú rôzne riešenia (faktorové štruktúry sú trochu odlišné). Konečná voľba medzi možnými alternatívami v nekonečnej súbore matematicky ekvivalentných riešení závisí od zmysluplného chápania výsledkov výkladov výskumných pracovníkov. A keďže neexistuje objektívne kritérium na hodnotenie rôznych riešení, navrhované odôvodnenia výberu riešení sa môžu zdať neopodstatnené a nekontrolované.

Tretím problémom je, že analýza faktora je pomerne častá na záchranu slabo premyslenej štúdie, keď sa zistí, že žiadny štatistický postup neposkytuje požadovaný výsledok. Sila metód hlavnej zložky a faktorovej analýzy umožňuje chaotické informácie vybudovať objednaný koncept (ktorý vytvára pochybnú reputáciu).

Druhá skupina termínov sa vzťahuje na matrice, ktoré sú postavené a interpretované ako súčasť riešenia. Otáčať sa Faktory sú vyhľadávanie na najjednoduchšie interpretabilné riešenie pre tento počet faktorov. Existujú dve hlavné triedy otáčok: ortogonálne a koshogol. V prvom prípade sú všetky faktory a prioriálne zvolené ortogonálne (nie sú navzájom korelované) a sú postavené matrix faktor, čo predstavuje matricu vzťahov medzi pozorovanými premennými a faktormi. Veľkosť zaťaženia odráža mieru komunikácie každej pozorovanej premennej a každého faktora a je interpretovaný ako korelačný koeficient medzi pozorovanou premennou a faktorom (latentná premenná), a preto sa líši v rozsahu od -1 do 1. Riešenie Získané po ortoonálnom odbočení je interpretovaný na základe analýzy zaťaženia továrenských maticiek identifikáciou, ako sú faktory spojené s maximálnym stupňom stupňa. Každý faktor sa teda ukáže, že je daná skupina primárnych premenných, ktoré majú na ňom najväčší faktor.

Ak sa vykonáva rotácia rocgolu (t.j., priori je dovolené korelovať faktory medzi sebou), potom je vybudovaných niekoľko ďalších matríc. Faktorová korelácia Matrix Obsahuje korelácie medzi faktormi. Matrix faktoruvedené vyššie, rozdelí do dvoch: konštrukčné matricové prepojenie medzi faktormi a premennými a factor Display MatrixVyjadrenie lineárnych vzťahov medzi každou pozorovanou premennou a každým faktorom (bez zohľadnenia vplyvu uloženia jedného faktorov na strane druhej, vyjadrené koreláciou faktorov medzi sebou). Po otáčaní veslovania sa výklad faktorov vyskytuje na základe zoskupenia primárnych premenných (presne tak, ako je opísané vyššie), ale použitím primárneho matrice faktora.

Nakoniec sa vypočíta na oba otáčky matrica koeficientu faktoraPoužíva sa v špeciálnych regresných rovniciach na výpočet hodnôt faktora (faktorové body, ukazovatele podľa faktorov) pre každé pozorovanie na základe hodnôt pre nich primárne premenné.

Porovnanie metód hlavných zložiek a faktorovej analýzy, poznamenávame nasledovné. Počas analýzy metódou hlavnej zložky je model postavený pre najlepšie vysvetlenie (maximálna reprodukcia) úplnej disperzie experimentálnych údajov získaných vo všetkých premenných. V dôsledku toho "komponenty" vyniknú. V analýze faktory sa predpokladá, že každá premenná je vysvetlená (určená) určitým počtom hypotetických spoločných faktorov (ovplyvňujúcich všetky premenné) a charakteristické faktory (pre každú premennú s vlastnou). A výpočtové postupy sa vykonávajú takým spôsobom, aby boli voľné od oboch disperzie získanej v dôsledku chyby merania a disperzie v dôsledku špecifických faktorov a analyzovali len disperzie vysvetlené hypoteticky existujúcimi spoločnými faktormi. V dôsledku toho sa objekty nazývajú faktory. Avšak, ako už bolo spomenuté, z vecného psychologického hľadiska, tento rozdiel v matematických modeloch nezáleží, preto v budúcnosti, ak nie je uvedené špeciálne vysvetlenia, aký druh prípadu nie je daný, použijeme termín "faktor "Rovnako ako vo vzťahu k zložkám a vo vzťahu k faktorom.

Veľkosti vzorky a zmeškané údaje. Čím viac vzorky, tým väčšia je presnosť indikátorov prepojenia. Preto je veľmi dôležité mať dosť veľkú vzorku. Požadovaná veľkosť vzorky tiež závisí od stupňa prepojenia ukazovateľov v populácii ako celku a počet faktorov: so silným a spoľahlivým vzťahom a malým počtom jasne definovaných faktorov, bude dostatok a nie veľmi veľká vzorka.

Tak, vzorka, ktorej veľkosť 50 subjektov sa odhaduje ako veľmi zlé, 100 - Bad, 200 - priemer, 300 - dobrý, 500 je veľmi dobrý a 1000 - vynikajúci ( Comrey, Lee., 1992). Na základe týchto úvah je možné odporučiť preskúmať vzorky najmenej 300 subjektov ako spoločná zásada. Na vyriešenie, na základe dostatočného počtu markerových premenných s vysokým faktorovým zaťažením (\u003e 0,80), je dostatok vzorky približne 150 subjektov ( Guadagnoli, velicer., 1988). Normálnosť pre každú premennú je samostatne kontrolovaná asymetria (Koľko je krivka študovanej distribúcie posunutá doprava alebo vľavo v porovnaní s teoreticky normálnou krivkou) a prebytok (Stupeň predĺženia smerom nahor alebo obnoviteľnosť "Bell" existujúcej distribúcie vizuálne znázornená vo frekvenčnom diagrame, v porovnaní s "zvonom" plánu hustoty charakteristického pre normálnu distribúciu). Ak má premenná základnú asymetriu a prebytok, môže byť prevedený zadaním novej premennej (ako jedinečná funkcia z uvažovaného), takže táto nová premenná je normálne distribuovaná (viac o ňom. Pozri: \\ t Tabachnik, Fidell., 1996, CH. štyri).

Vlastné vektory a zodpovedajúce vlastné vlastnosti
pre posudzovaný príklad vzdelávania

Vlastný vektor 1.

Vlastné vektor 2.

Vlastná hodnota 1.

Vlastná hodnota 2.

Vzhľadom k tomu, korelačná matica je diagonalizovaná, potom na získanie výsledkov faktorovej analýzy k nemu, môže byť použitý matricový algebra svojich vlastných vektorov a vlastných hodnôt (pozri dodatok 1). Ak je matrica diagonalizovaná, potom všetky podstatné informácie o štruktúre faktora sú obsiahnuté v jeho diagonálnej forme. V analytickej analýze, vlastné vlastnosti zodpovedajú disperzii v dôsledku faktorov. Faktor s najväčším selkom vysvetľuje najväčšiu disperziu atď., Až do dosiahne faktory s malými alebo zápornými hodnotami, ktoré sa zvyčajne neberú do úvahy pri analýze. Matrix faktorov je matica vzťahov (interpretovaná ako korelačné koeficienty) medzi faktormi a premennými. Prvý stĺpec je korelácia medzi prvým faktorom a každou premennou zase: náklady na prášok (-.400), pohodlný komplex (.251), teplota vzduchu (.932), teplota vody (.956). Druhým stĺpcom je korelácia medzi druhým faktorom a každou premennou: náklady na prášok (.900), pohodlný komplex (-.947), teplota vzduchu (.348), teplota vody (.286). Faktor sa interpretuje na základe vysoko súvisiacej s ním (t.j. s vysokým zaťažením) premenných. Prvý faktor je teda hlavne "klimatický" ( teplota vzduchu a vody), zatiaľ čo druhý "ekonomický" ( náklady na poukážky a komplex Comfort).

Tvrdenie týchto faktorov by malo venovať pozornosť skutočnosti, že premenné majú vysoké zaťaženie na prvý faktor ( teplota vzduchu a teplota vody) sú pozitívne vzájomne prepojené, zatiaľ čo premenné majú vysoké zaťaženie druhého faktora ( náklady na prášok a pohodlný komplex), vzájomne prepojený (z lacného rezortu nemôže očakávať veľké pohodlie). Prvý faktor sa nazýva UNIPOLAR (všetky premenné sú zoskupené na jednom póle) a druhý - bipolárny (Premenné sa rozišli do dvoch opačných skupín v zmysle skupiny - dva póly). Premenné, ktoré majú faktorové zaťaženie s podpisom plus tvoria pozitívny pól a s mínusovým znakom - negatívne. Zároveň sa názvy pólu "pozitívne" a "negatívne" v interpretácii faktora nemajú odhadovaný význam "zlého" a "dobrého". Výber znaku sa vyskytuje počas výpočtu náhodne. Ortogonálne otáčanie

Rotácia sa zvyčajne aplikuje po výbere faktorov s cieľom maximalizovať vysoké korelácie a minimalizovať nízke. Existuje mnoho metód rotácie, ale najčastejšie používané varimax, ktorý je postupom na maximalizáciu disperzií. Toto odbočenie maximalizuje disperziu faktorového zaťaženia, takže vysoké zaťaženia vyššie, a nízke nižšie pre každý z faktorov. Tento cieľ sa dosiahne konverzné matrice Λ:

Konverzná matrica - Jedná sa o matricu dutín a kosínus uhla ψ, ku ktorému sa zase vykonáva. (Teda názov transformácie - otáčať saVzhľadom k tomu, že z geometrického hľadiska je obrat osí okolo pôvodu súradníc faktorálneho priestoru. 4). Spoločná premenná - Toto je disperzia vypočítaná s použitím faktorového zaťaženia. Ide o kvadratickú viacnásobnú koreláciu premennej predpovedanej faktorovým modelom. Komunita sa vypočíta ako súčet štvorcov faktorových nákladov (SCN) pre premennú pre všetky faktory. V Tab. 4 komunity pre náklady na poukážky rovná (-086) 2 + (. 981) 2 \u003d .970, t.j. 97% disperzia náklady na poukážky Vysvetlené faktormi 1 a 2.

Frakcia disperzie faktora vo všetkých premenných je SCN na faktor rozdelenej počtom premenných (v prípade ortogonálnej rotácie) 7 . Pre prvý faktor je podiel disperzie:

[(-.086)2+(-.071)2+(.994)2+(.997)2]/4 = 1.994/4 = .50,

t.j. Prvý faktor vysvetľuje 50% variabilnú disperziu. Druhý faktor vysvetľuje 48% disperziu premenných a (na základe ortogonality rotácie), dva faktory vo výške vysvetlite 98% variabilnú disperziu.

Komunikácia medzi faktorovými nákladmi, spoločenstvami, SKN, \\ t
disperzia a kovariancia ortogonálnych faktorov po otočení

Spoločenstvo ( h2.)

Náklady na prášok

ΣA2.=.970

Úroveň pohodlia

ΣA2.=.960

Teplota vzduchu

ΣA2.=.989

Teplota vody

ΣA2.=.996

ΣA2.=1.994

ΣA2.=1.919

Podiel disperzie

Podiel kovariancie

Podiel riešenej disperzie vysvetleného faktorom je podiel covaria - Je SCN pre faktor vydelený množstvom spoločenstiev (množstvo SCN v premenných). Prvým faktorom vysvetľuje 51% disperziu riešenia (1.994 / 3.915); Druhá je 49% (1.919 / 3,915); Dva faktory spolu vysvetľujú všetku kovarianciu.

Eigenval - odrážajú množstvo disperzie zodpovedajúceho počtu faktorov. Ako cvičenie odporúčame písať všetky tieto vzorce na získanie hodnôt vysporiadania podľa premenných. Napríklad pre prvý respondent:

1.23 = -.086(1.12) + .981(-1.16)

1.05 = -.072(1.12) - .978(-1.16)

1.08 = .994(1.12) + .027(-1.16)

1.16 = .997(1.12) - .040(-1.16)

Alebo v algebraickej forme:

Z Hodnota poukážok = a.11F.1 + a.12F.2

Z pohodlný komplex = a.2l F.1 + a.22F.2

Z Teplota vzduchu Z = a.31F.1 + a.32F.2

Z Teplota vody = a.41F.1 + a.42F.2

Čím väčšia je zaťaženie, tým väčšia dôvera môžeme predpokladať, že premenná určuje faktor. Kursi a Lee ( Comrey, Lee., 1992) Predpokladá sa, že zaťaženie nad 0,71 (vysvetľuje 50% disperziu) - vynikajúce, 0% disperzia) - veľmi dobré, 0%) - dobré, 0%) - uspokojivé a 0,32 (vysvetľuje 10% disperziu) - slabý.

Predpokladajme, že trávite (do určitej miery "hlúpy") štúdia, v ktorej sa merajú rast sto ľudí v palcoch a centimetroch. Máte teda dve premenné. Ak potom chcete preskúmať napríklad vplyv rôznych výživových prídavných látok na rast, budete pokračovať v používaní obaja Premenné? Pravdepodobne nie, pretože rast je jednou z charakteristikou osoby, bez ohľadu na to, ktoré jednotky sa meria.

Závislosť medzi premennými môže byť zistená pomocou rozptylové diagramy. Regresná línia získaná montážou poskytuje grafické znázornenie závislosti. Ak určíte novú premennú na základe regresnej čiary uvedenej na tomto diagrame, potom takáto premenná bude obsahovať najzákladnejšie vlastnosti oboch premenných. Takže v skutočnosti ste zmenšili počet premenných a nahradil dva. Nový faktor (premenná) je vlastne lineárnou kombináciou dvoch zdrojových premenných.

Fáza faktorovej analýzy

Môžete priradiť deväť štádií faktorovej analýzy. Pre jasnosť si predstavte tieto stupne diagramu a potom im dajte stručný popis.

Fázy faktorovej analýzy sú znázornené na obr.

Obr.

Znenie problému a výstavba korelačnej matrice

Formulácie problému.Je potrebné jasne definovať ciele faktorovej analýzy. Premenné vystavené faktorovej analýze sú špecifikované na základe minulých štúdií, teoretických výpočtov alebo podľa uváženia výskumníka. Je potrebné, aby sa premenné merali v interval alebo relatívnystupnice. Skúsenosti ukazujú, že veľkosť vzorky by mala byť viac ako štyri až päťkrát ako počet premenných.

Budovanie korelačnej matrice.Analýza je založená na korelačnej matrici medzi premennými. Možnosť uskutočňovania faktorovej analýzy je určená prítomnosťou korelácií medzi premennými. Ak je korelácia medzi všetkými premennými malými, potom je analýza faktora zbytočná. Premenné sú medzi sebou úzko prepojiť medzi sebou, úzko korelujú s rovnakým faktorom alebo faktormi.

Na overenie účelnosti používania modelu faktora existuje niekoľko štatistík. Pomocou kritéria Bartlette Sfhericity sa nulová hypotéza skontroluje o absencii korelácie medzi premennými vo všeobecnej populácii. To znamená, že vyhlásenie sa domnieva, že korelačná matica z agregátu je jednoduchá matrica, v ktorej sú všetky diagonálne prvky rovné jednej, a všetky ostatné sú nula. Overenie s pomocou kritéria sféricita je založené na transformácii determinantovania korelačnej matrice v štatistikách Chi-Square. S veľkou hodnotou štatistiky sa nulová hypotéza odlišuje. Ak nulová hypotéza nie je vychýlená, implementácia faktorovej analýzy je nevhodná. Ďalšie užitočné štatistiky - Critia-Maeier-Alkina (CO) Kritérium primeranosti vzorky. Tento koeficient porovnáva hodnoty pozorovaných korelačných koeficientov s hodnotami súkromných korelačných koeficientov. Malé KMO-štatistické hodnoty ukazujú, že korelácie medzi variabilnými pármi nemožno vysvetliť inými premennými, čo znamená, že používanie faktorovej analýzy je nevhodné.

Analýza faktora

Myšlienka faktorovej analýzy

V štúdii komplexných objektov, javov, systémov, faktorov, ktoré určujú vlastnosti týchto objektov, sú veľmi často nemožné merať priamo, a niekedy aj ich počet a význam nie je známy. Ale pre meranie môžu byť k dispozícii iné hodnoty, jednosmerné alebo iné faktory, ktoré sa nás zaujímajú. Okrem toho, keď je vplyvom neznámeho faktora záujmu na nás sa prejavuje v niekoľkých meraných vlastnostiach alebo vlastnostiach objektu, tieto vlastnosti môžu detekovať úzky vzťah medzi sebou a celkový počet faktorov môže byť oveľa menej ako počet premenných premenných .

Na identifikáciu faktorov, ktoré určujú merané príznaky objektov, používajú sa metódy faktorovej analýzy.

Ako príklad použitia faktorovej analýzy je možné uviesť štúdium vlastností osobnosti na základe psychologických testov. Vlastnosti osobnosti nie sú prístupné na priame meranie. Môžu byť posudzované len ľudským správaním alebo charakterom odpovedí na otázky. Na vysvetlenie výsledkov experimentov sú podrobené faktorovej analýze, ktorá vám umožní identifikovať tie osobné nehnuteľnosti, ktoré ovplyvňujú správanie jednotlivca.
V srdci rôznych metód faktorovej analýzy je nasledujúca hypotéza založená na: pozorovaných alebo meraných parametroch sú len nepriame charakteristiky objektu, ktorý sa bude študovať, v skutočnosti existujú interné (skryté, latentné, nepozorovateľné) parametre a vlastnosti, číslo, číslo z nich je malé a ktoré definujú hodnoty pozorovaných parametrov. Tieto interné parametre sa nazývajú faktory.

Účelom faktorovej analýzy je sústrediť počiatočné informácie, vyjadrenie veľkého počtu známok, ktoré sa posudzujú po menšom počte viac hradných vnútorných charakteristík tohto fenoménu, ktorý však nie je možné priamo merať

Bolo zistené, že pridelenie a následné pozorovanie úrovne spoločných faktorov umožňuje zistiť prednastavené stavy objektu na veľmi skorých štádiách vývoja chýb. Analýza faktora vám umožňuje monitorovať stabilitu korelačných väzieb medzi jednotlivými parametrami. Sú to korelácie medzi parametrami, ako aj medzi parametrami a spoločnými faktormi, obsahujú základné diagnostické informácie o procesoch. Použitie štatistického balíka Toolkit pri vykonávaní faktorovej analýzy, eliminuje potrebu použitia dodatočnej výpočty a robí analýzu vizuálne a zrozumiteľné pre používateľa.

Výsledky faktorovej analýzy budú úspešné, ak je možné interpretovať identifikované faktory na základe zmyslu ukazovateľov charakterizujúcich tieto faktory. Táto fáza práce je veľmi zodpovedná; Vyžaduje si jasnú predstavu o zmysluplnú zmysel pre ukazovatele, ktoré sú priťahované na analýzu a na základe ktorých sa zdôrazňujú faktory. Preto, s predbežným dôkladným výberom ukazovateľov faktorovej analýzy, ich význam by mal byť vedený, a nie túžbou na zaradenie do analýzy čo najviac.

Essence faktorovej analýzy

Predstavujeme niekoľko základných ustanovení analýzy faktorov. Nechajte matricu H. Merané parametre objektu je matrica s kovarianinou (korelácia) C.kde ročník - počet parametrov, \\ t n. - počet pripomienok. Lineárnou transformáciou X.=Qy.+U. Môžete znížiť rozmer pôvodného faktorového priestoru H. na úrovni Y., kde ročník"<<ročník. To zodpovedá bodu konverziu charakterizujúcu stav objektu v j.- rozmerový priestor, v novom rozmerovom priestore s menším rozmerom ročník". Samozrejme, geometrická blízkosť dvoch alebo mnohých bodov v novom faktorovom priestore znamená stabilitu stavu objektu.

Matrica Y. Obsahuje nepozorovateľné faktory, ktoré sú v podstate hyperparametre charakterizujúce najbežnejšie vlastnosti analyzovaného objektu. Všeobecné faktory Najčastejšie si vyberajú štatisticky nezávislé, čo uľahčuje ich fyzickú interpretáciu. Vektorové pozorované znaky H. Má zmysel účinnosť zmien týchto hyperparametov.

Matrica U. pozostáva zo zvyškových faktorov, ktoré zahŕňajú hlavne chyby na meranie značiek x.(i.). Obdĺžniková matrica Q. Obsahuje faktorové zaťaženie, ktoré určujú lineárny vzťah medzi vlastnosťami a hyperparametrami.
Faktorové zaťaženia sú hodnoty korelačných koeficientov každej z počiatočných príznakov s každým z identifikovaných faktorov. Čím bližšie je pripojenie tejto funkcie s posudzovaným faktorom, tým vyššia je hodnota faktorového zaťaženia. Pozitívne znamenie faktorového zaťaženia označuje priamy (a negatívny označenie - na reverznom) spojenie tejto funkcie s faktorom.

Údaje o faktorovom zaťažení tak umožňujú formulovať závery o sade zdrojových značiek, ktoré odrážajú konkrétny faktor a relatívnu hmotnosť samostatného vlastníka v štruktúre každého faktora.

Model analýzy faktora je podobný modelom multidimenzionálnej regresnej a disperznej analýzy. Základným rozdielom medzi modelom faktorovej analýzy je, že vektor Y je nepozorovateľné faktory a v regresnej analýze sú registrované parametre. Na pravej strane rovnice (8.1), matrica faktorových zaťažení q a matricu hodnôt všeobecných faktorov Y nie sú známe.

Ak chcete nájsť matricu faktorovej zaťaženia, rovnica sa používa rovnicaQQ t \u003d S - V, kde Q t je transponovaná matica Q, V - Kovaridsiatko Matrix reziduálnych faktorov U, t.j. . Rovnica je riešená iteráciami pri určovaní nulovej aproximácie kovariančnej matice v (0). Po zistení matice faktorovej záťaže Q, všeobecné faktory (hyperparametre) vypočítavajú rovnicou
Y \u003d (q t v -1) q -1 q t v -1 x

Balenie štatistického statistického štatistického analýzy umožňuje vypočítať matricu zaťaženia faktora v dialógovom okne, ako aj hodnoty niekoľkých vopred určených hlavných faktorov, najčastejšie dva - na prvých dvoch hlavných zložkách počiatočnej matrice parametra.

Faktorová analýza v systéme štatistiky

Zvážte postupnosť faktorovej analýzy v príklade spracovania výsledkov osobného prieskumu zamestnancov podniku. Je potrebné identifikovať hlavné faktory, ktoré určujú kvalitu pracovného života.

V prvej fáze musíte vybrať premenné pre analýzu faktora. Pomocou korelačnej analýzy sa výskumník snaží identifikovať vzťah študovaných funkcií, ktoré na druhej strane dáva možnosť prideliť úplnú a odvíjanú sadu značiek kombináciou silne korelácie označení.

Ak máte faktorovú analýzu vo všetkých premenných, výsledky nemusia byť úplne objektívne, pretože niektoré premenné sú určené inými údajmi, a nemôžu byť regulované zamestnancami posudzovanej organizácie.

S cieľom pochopiť, ktoré ukazovatele by mali byť vylúčené, budeme konštruovať podľa dostupnej dátovej matice korelačných koeficientov v štatistike: štatistika / základné štatistiky / korelačné záležitosti / OK. Vo východiskovom okne tohto postupu, produkt-moment a čiastočné korelácie (obr. 4.3), sa na výpočet štvorcovej matrice používa. Vyberte všetky premenné (Vybrať všetko), OK, zhrnutie. Získame korelačnú maticu.

Ak korelačný koeficient sa líši v rozsahu od 0,7 do 1, znamená to silná korelácia ukazovateľov. V tomto prípade sa môže odstrániť jedna premenná so silnou koreláciou. Naopak, ak je korelačný koeficient malý, môžete vylúčiť premennú z dôvodu skutočnosti, že nebude pridávať nič do celkovej sumy. V našom prípade nie je pozorovaná silná korelácia medzi všetkými premennými a analýza faktora sa vykoná pre kompletnú sadu premenných.

Ak chcete spustiť analýzu faktora, musíte nazvať štatistiky / multivariačné prieskumné techniky modulu (multidimenzionálne metódy výskumu) / analýza faktora (analýza faktora). Na obrazovke sa zobrazí okno Modul faktorovej analýzy.



Analyzovať všetky premenné tabuľky; Premenné (premenné): Vyberte All, OK. Vstupný súbor (typ vstupného súboru) označuje surové dáta (zdrojové údaje). V module je možné dva typy zdrojových údajov v module - surové dáta (zdrojové dáta) a korelačná matica je korelačná matrica.

Sekcia vymazania MD bude definovať spôsob spracovania chýbajúcich hodnôt:
* Písomne \u200b\u200bje spôsob, ako vylúčiť zmeškané hodnoty (predvolené);
* PACEWISHY - PÁNU AKTUÁLNYMI PROSTREDNÍCTVOM
* Priemerná substitúcia - nahradenie priemeru namiesto zmeškaných hodnôt.
Metóda písmenného osôb je, že v tabuľke obsahujúcej údaje obsahujúce všetky čiary sú ignorované, v ktorom je aspoň jedna zmeškaná hodnota. Týka sa to všetkých premenných. V párovej metóde sú zmeškané hodnoty ignorované pre všetky premenné, ale len pre vybraný pár.

Vyberte spôsob spracovania zmeškaných hodnôt ccawise.

Statistica zvládne zmeškané hodnoty spôsobom, ktorý je špecifikovaný, vypočítala korelačnú maticu a ponúkne výber z niekoľkých metód faktorovej analýzy.

Po stlačení tlačidla OK sa objaví definovacia metóda okna extrakcie faktora (určiť spôsob výberu faktorov).

Horná časť okna sú informácie. Uvádza sa, že zmeškané hodnoty sú spracované pomocou písmennej metódy. Pre ďalšie výpočtové sa prijíma 17 pozorovaní a 17 pripomienok. Korelačná matica sa vypočíta pre 7 premenných. Spodná časť okna obsahuje 3 karty: Rýchle, pokročilé, popisy.

V popisnej karte (opisná štatistika) sú dva tlačidlá:
1- pohľad na korelácie, stredné a štandardné odchýlky;
2- Vytvorte viacnásobnú regresiu.

Kliknutím na tlačidlo Prvé tlačidlo si môžete prezrieť Stredné a štandardné odchýlky, korelácie, Covovarions, vytvárať rôzne grafy a histogramy.

Na karte Rozšírené, na ľavej strane, vyberte metódu faktorovej analýzy: Hlavné komponenty (metóda hlavnej zložky). V pravej časti vyberte maximálny počet faktorov (2). Maximálny počet faktorov (max nie faktorov) je nastavený, alebo minimálne vlastné vlastníctvo: 1 (EigenValue).

Kliknite na tlačidlo OK a Statistica rýchlo vyrába výpočty. Na obrazovke sa zobrazí okno Výsledky faktorovej analýzy. Ako už bolo spomenuté, výsledky faktorovej analýzy sú vyjadrené množinou faktorového zaťaženia. Preto budeme pokračovať v práci s kartu zaťaženia.

Horná časť okna - Informácie:
Počet premenných (počet analyzovaných premenných): 7;
Metóda: hlavné komponenty (hlavné komponenty);
Denník (10) Determinant korelačnej matrice (desatinný logaritmus Determinant Corlation Matrix): -1 6248;
Počet extrahovaných faktorov (počet vybraných faktorov): 2;
EigenValues \u200b\u200b(vlastné hodnoty): 3.39786 a 1,19130.
V spodnej časti okna sú funkčné tlačidlá, ktoré umožňujú komplexne zobraziť výsledky analýzy, numerické a graficky.
Faktor Rotácia je otáčaním faktorov, v tomto rozbaľovacom okne môžete vybrať rôzne otáčky osí. Pomocou otáčania súradnicového systému môžete získať rôzne riešenia, z ktorého potrebujete vybrať interpretovateľné riešenie.

Existujú rôzne spôsoby otáčania súradníc priestoru. Balík štatistiky ponúka osem takýchto metód prezentovaných v module faktora analýzy. Napríklad metóda varimaxu zodpovedá konverzii súradníc: rotácie, maximalizačnú disperziu. V metóde varimaxu sa získa zjednodušený opis kolóny faktorovej matrice, priveďte všetky hodnoty na 1 alebo 0. Disperzia štvorcov faktorových zaťažení. Faktorová matrica získaná pomocou metódy rotácie Vimimax je do značnej miery invariantná s ohľadom na výber rôznych sadov premenných.

Rotácia podľa metódy PCB stanovuje účel podobného zjednodušenia len s ohľadom na rady faktorovej matrice. EquiMAX zaberá medziľahlú pozíciu? Keď sa faktory otáčajú, zároveň sa vyrába pokus o zjednodušenie a stĺpce a stĺpiky. Metódy rotácie sa týkajú ortogonálnych rotácií, t.j. V dôsledku toho sa získajú nekorientované faktory. Metódy priamej refundácie a rýchle rotácie sa týkajú rockovačov, v dôsledku ktorého faktory sú korelované. Termín? Normalized? V mesiacich metód ukazuje, že sa normalizuje zaťaženie faktorov, to znamená, že sú rozdelené do oddývaného koreňa zo zodpovedajúcej disperzie.

Zo všetkých navrhovaných metód najprv vidíme výsledok analýzy bez otáčania súradnicového systému - rozpisované. Ak sa výsledok získal, ktorý sa má interpretovať, a bude usporiadaný, potom sa môže zastaviť. Ak nie, môžete osi otáčať a vidieť iné riešenia.

Kliknite na tlačidlo "Factor Loading" a číselne zobrazí faktor zaťaženie.



Pripomeňme, že faktorové zaťaženia sú hodnoty korelačných koeficientov každej z premenných s každým z identifikovaných faktorov.

Hodnota zaťaženia faktora, väčšia ako 0,7 ukazuje, že táto funkcia alebo premenná úzko súvisí s posudzovaným faktorom. Čím bližšie je pripojenie tejto funkcie s posudzovaným faktorom, tým vyššia je hodnota faktorového zaťaženia. Pozitívne znamenie faktorového zaťaženia označuje priamy (a negatívny znak? Na reverznom) spojenie tejto funkcie s faktorom.
Z tabuľky faktorového zaťaženia boli odhlásené dva faktory. Prvá definuje OSB - pocit sociálnej pohody. Zostávajúce premenné sú spôsobené druhým faktorom.

V prieskume. Var (obr. 8.5) ukazuje disperziu na jeden alebo iný faktor. V reťazci PRP. TOTL ukazuje podiel disperzie na prvý a druhý faktor. V dôsledku toho prvý faktor predstavuje 48,5% celkovej disperzie a na druhý faktor - 17,0% celkovej disperzie, všetko ostatné spadá na iné nezodpovedné faktory. Výsledkom je, že dva identifikované faktory vysvetľujú 65,5% celkovej disperzie.



Tu vidíme aj dve skupiny faktorov - OSB a zvyšok premenných, z ktorých je ZHS pridelená - túžba zmeniť prácu. Zdá sa, že to dáva zmysel preskúmať túto túžbu dôkladne na základe zberu dodatočných údajov.

Výber a objasnenie počtu faktorov

Akonáhle boli informácie prijaté, koľko disperzie bol každý faktor pridelený, môžete sa vrátiť k otázke, koľko faktorov by malo byť ponechané. Príroda je toto riešenie ľubovoľné. Existujú však niektoré spoločné odporúčania a v praxi, nasleduje ich najlepšie výsledky.

Počet spoločných faktorov (hyperparameters) sa stanoví výpočtom vlastných vlastností (obr. 8.7) matríc X v module faktora analýzy. Ak to chcete urobiť, v TABUĽKE VYHĽADUJE VYKONÁVATEĽA (Obr. 8.4), musíte kliknúť na tlačidlo Scree Plot.


Maximálny počet spoločných faktorov sa môže rovnať počtu vlastníctva parametrickej matrice. S nárastom počtu faktorov sa však výrazne zvýšia ťažkosti pri ich fyzickej interpretácii.

Môžete najprv vybrať iba faktory s EigenValues, veľké 1. V podstate to znamená, že ak faktor nevyberá disperziu ekvivalentnú aspoň disperzii jednej premennej, potom sa zníži. Toto kritérium sa používa najčastejšie. Vo vyššie uvedenom príklade by sa na základe tohto kritéria mali zachovať iba 2 faktory (dve hlavné zložky).

Môžete nájsť také miesto na harmonograme, kde sa zníženie vlastných hodnôt zľava doprava spomalí čo najviac. Predpokladá sa, že právo tohto bodu je len "faktoriálna prierečka". V súlade s týmto kritériom môžete odísť v príklade 2 alebo 3 faktoroch.
Z obr. Je možné vidieť, že tretí faktor mierne zvyšuje podiel celkovej disperzie.

Faktorová analýza parametrov vám umožňuje identifikovať v počiatočnom štádiu, narušenie pracovného toku (výskyt chyby) v rôznych objektoch, čo je často nemožné upozorniť priamym pozorovaním parametrov. To je vysvetlené skutočnosťou, že porušenie korelačných väzieb medzi parametrami vzniká oveľa skôr ako zmena v jednom parametri. Takéto skreslenie korelačných väzieb vám umožní okamžite detegovať faktorovú analýzu parametrov. Na to stačí mať rad registrovaných parametrov.

Môžete poskytnúť všeobecné odporúčania na použitie faktorovej analýzy bez ohľadu na oblasť predmetu.
* Každý faktor by mal predstavovať aspoň dve merané parametre.
* Počet meraní parametrov by mal byť väčší ako počet premenných.
* Počet faktorov by mal byť odôvodnený na základe fyzickej interpretácie procesu.
* Mal by sa vždy dosiahnuť, že počet faktorov je oveľa menej ako počet premenných.

Kritérium KAIZER niekedy šetrí príliš veľa faktorov, zatiaľ čo kritérium Rocky Scrych niekedy šetrí príliš málo faktorov. Obidve kritériá sú však veľmi dobré za normálnych podmienok, keď je relatívne malý počet faktorov a mnoho premenných. V praxi je otázka dôležitejšia, keď je možné vykladať riešenie. Preto sa niekoľko riešení zvyčajne skúma s veľkým alebo menším počtom faktorov, a potom je zvolený jeden zvolený.

Priestor zdrojových značiek by mal byť zastúpený v homogénnych meracích váhach, pretože to umožňuje použitie korelačných matríc pri výpočte. V opačnom prípade vzniká problém "váh" rôznych parametrov, čo vedie k potrebe používať pri výpočte matríc kovaristiky. Odtiaľ môže existovať ďalší problém opakovateľnosti výsledkov faktorovej analýzy pri zmene počtu značiek. Treba poznamenať, že špecifikovaný problém sa jednoducho rieši v balíku štatistiky prepnutím na štandardizovanú formu reprezentácie parametrov. V tomto prípade sa všetky parametre stanú rovnocenným stupni ich spojenie s procesmi v študijnom objekte.

Zlyhané určené matrice

Ak existujú redundantné premenné v zdrojovom súbore údajov a analýza korelácie nebola vylúčená, nie je možné vypočítať reverznú matricu (8.3). Ak je napríklad premenná súčtom dvoch ďalších premenných vybraných pre túto analýzu, korelačná matrica pre takúto sadu premenných nie je možné riešiť a analýza faktora nie je zásadne vykonaná. V praxi to sa deje, keď sa snaží aplikovať analýzu faktora na rôzne výrazne závislé premenné, ktoré sa niekedy stávajú napríklad pri spracovaní dotazníkov. Potom môžete umelo znížiť všetky korelácie v matrici pridaním malej konštanty k diagonálnym prvkom matrice a potom ho štandardizovať. Tento postup zvyčajne vedie k matrici, ktorú možno riešiť, a preto sa na ňu vzťahuje faktorová analýza. Okrem toho tento postup nemá vplyv na súbor faktorov, ale odhady sú menej presné.

Faktorové a regresné modelovanie systémov s variabilnými stavmi

Systém s variabilnými stavmi (ATP) sa nazýva systém, ktorej odozva závisí nielen na vstupnej expozícii, ale aj z parametra, ktorý je zovšeobecnený trvalý určujúci stav. Nastaviteľný zosilňovač alebo atenurátor? Ide o príklad najjednoduchšej ATP, v ktorom môže byť koeficient prenosu diskrétny alebo hladko zmenený podľa ktoréhokoľvek zákona. Štúdia ATP sa zvyčajne vykonáva pre linearizované modely, v ktorých je prechodný proces spojený s zmenou parametra status považovaný za ukončený.

Atenuátory, vyrobené na základe G-, T-a P-tvarovanej zlúčeniny, postupne a rovnobežne s obsahovanými diódami, sa získali najväčšiu distribúciu. Odolnosť diódov pod vplyvom ovládacieho prúdu sa môže široko meniť, čo vám umožní zmeniť frekvenčnú odozvu a zoslabenie v trakte. Nezávislosť fázového posunu v nastavení zoslabenia v takýchto atenuátoroch sa dosahuje pomocou prúdových reťazcov obsiahnutých v základnej štruktúre. Samozrejme, s iným pomerom rezistencie paralelných a po sebe nasledujúcich diód sa môže získať rovnaká úroveň blížiaceho sa tlmenia. Zmena fázového posunu sa však líši.

Skúmame možnosť zjednodušiť automatizovaný dizajn atenuátorov, eliminuje dvojitú optimalizáciu korekčných obvodov a parametrov kontrolovaných prvkov. Ako študovaný ATP budeme používať elektricky kontrolovaný atenurátor, ktorých substitučná schéma je znázornená na obr. 8.8. Minimálna úroveň zoslabenia je uvedená v prípade nízkej odolnosti prvku RS a veľkú odolnosť RP elementu. Keďže rezistencia RS elementu sa zvyšuje a rezistencia RP elementu sa zníži, zhoršené oslabenie.

Závislosti zmeny fázového posunu z frekvencie a útlmu pre obvod bez korekcie a korekciu sú znázornené na obr. 8.9 a 8.10. V opravenom atenuátore v rozsahu oslabenia 1,3-7,7 dB a frekvenčného pásma 0,01? 4,0 GHz, zmena fázového posunu bola dosiahnutá nie viac ako 0,2 °. V atenuátore, bez korekcie, zmena v posunom fáze v rovnakom frekvenčnom pásme a rozsah Osloble dosahuje 3 °. Fázový posun sa teda znižuje v dôsledku korekcie takmer 15-krát.


Budeme zvážiť parametre korekcie a kontroly nezávislých premenných alebo faktorov, ktoré ovplyvňujú útlm a zmenu posunu fáz. To umožňuje s pomocou systému štatistiky vykonávať faktorovú a regresnú analýzu ATP s cieľom vytvoriť fyzikálne vzory medzi parametrami reťazca a individuálnymi vlastnosťami, ako aj zjednodušiť vyhľadávanie optimálnych parametrov okruhu.

Počiatočné údaje vznikli nasledovne. Pre korekčné parametre a regulačnú rezistenciu sa líšia od optimálnej a menšej strany na frekvenčnú mriežku 0,01? 4 GHz, sa vypočítalo poškodené uvoľnenie a zmena fázového posunu.

Metódy štatistického modelovania, najmä faktorovej a regresnej analýzy, ktoré boli predtým nepoužité na navrhovanie diskrétnych zariadení s variabilnými stavmi, umožňujú identifikovať fyzické vzory systémových prvkov. To prispieva k vytvoreniu štruktúry zariadenia na základe určeného kritéria optimalita. Táto časť považuje za typický príklad systému s variabilnými stalmi ako typický príklad systému s variabilnými stavmi. Identifikácia a interpretácia faktorových zaťažení ovplyvňujúcich rôzne charakteristiky študované vám umožní zmeniť tradičnú metodiku a výrazne zjednodušiť vyhľadávanie korekčných a kontrolných parametrov.

Bolo zistené, že používanie štatistického prístupu k dizajne takýchto zariadení je odôvodnené tak, aby zhodnotili fyziku svojej práce a odôvodnila schematické diagramy. Štatistické modelovanie umožňuje výrazne znížiť objem experimentálnych štúdií.

výsledok

  • Pozorovanie spoločných faktorov a vhodným faktorovým zaťažením je potrebná identifikácia vnútorných zákonov procesov.
  • S cieľom určiť kritické hodnoty kontrolovaných vzdialeností medzi faktorovým zaťažením je potrebné hromadiť a sumarizovať výsledky analýzy faktorov pre rovnaký typ procesov.
  • Použitie faktorovej analýzy nie je obmedzené na fyzikálne vlastnosti procesov. Faktorová analýza je mocná metóda monitorovania procesov a aplikovať na návrh rôznych cieľových systémov.
Národná výskumová jadrová univerzita "Mefi"
Fakulta obchodnej informatiky a riadenia
Komplexné systémy
Katedra ekonomiky a riadenia
V priemysle (№ 71)
Metódy matematického a inštrumentálneho spracovania
Štatistické informácie
Kireev V.S.,
Ph.D., Associate
E-mail:
Moskva, 2017.
1

Normalizácia

Desatinné škálovanie
Normalizácia Minimax
Normalizácia pomocou štandardnej konverzie
Normalizácia pomocou transformácií prvkov
2

Desatinné škálovanie

Vi
"
VI K, Max (VI) 1
10
"
3

Normalizácia Minimax

Vi
VI min (VI)
"
I.
Max (vi) min (VI)
I.
I.
4

Normalizácia pomocou štandardnej odchýlky

Vi
"
V.
V.
VI V.
V.
- selektívne
priemeru
- selektívny priemerný kvadratický
odchýlka
5

Normalizácia pomocou transformácií prvkov

VI F VI
"
VI 1.
"
Log vi
, Vi log vi
"
VI Exp VI
"
VI VI, VI 1 Y
Vi
"
Y.
"
6

Analýza faktora

Fa) je súbor metód, ktoré
Základom skutočne existujúcich odkazov analyzovaných značiek, sa odkazuje
pozorované objekty umožňujú identifikovať skryté (implicitné, latentné)
Zostávajúce charakteristiky mechanizmu organizačnej štruktúry a rozvoja
študované javy, procesy.
Metódy analýzy faktora vo výskumnej praxi sa uplatňujú hlavnými
S cieľom komprimovať informácie získate malý počet zovšeobecní
Symptómy vysvetľujúce variabilitu (disperzia) elementárnych značiek (zásuvka faktorovej analýzy) alebo variabilita pozorovaných objektov (Q-technik
Analýza faktora).
Algoritmy faktorovej analýzy sú založené na použití zníženia
Matrice spárovaných korelácií (kovarián). Znížená matrica je matrica, na
Hlavnou uhlopriečkou nie sú jednotkou (odhady) úplnej korelácie alebo
Odhady úplnej disperzie a ich znížené, o niečo znížené hodnoty. Pre
Toto je postúpené, že v dôsledku analýzy nie je vysvetlená všetka odchýlka.
študoval značky (objekty) a jeho niektoré, zvyčajne veľké. Spočívať
Nevycoňovateľná časť disperzie je charakteristika vznikajúca z dôvodu špecifickosti.
pozorované objekty alebo chyby povolené pri registrácii javov, procesov, \\ t
tí. Nespoľahlivé vstupné údaje.
7

Klasifikácia metód FA

8

Spôsob hlavnej zložky

(MGC) používané na zníženie rozmeru
Priestor pozorovaných vektorov, čo vedie k významnej strate
informativity. Predpokladom MGC je normálnym distribučným právom
Multidimenzionálne vektory. V MGK sa určujú lineárne kombinácie náhodných premenných
Charakteristický
vektory
kovariancia
Matrix.
Hlavný
Komponenty sú ortogonálny súradnicový systém, v ktorom disperziách
Zložka charakterizuje svoje štatistické vlastnosti. Mgk nepatrí do Fa, hoci má
Podobný algoritmus a rieši podobné analytické úlohy. Jeho hlavný rozdiel
spočíva v tom, že neredukované spracovanie podlieha, ale obyčajná matrica
Spárované korelácie, Covovariances, na hlavnej uhlopriečke, z ktorých sú umiestnené jednotky.
Nechajte pôvodný súbor vektorov x lineárny priestor LK. Žiadosť
Spôsob hlavnej zložky vám umožní ísť do priestoru LM (m≤k), ako
Čo: Prvá zložka (prvá základňa) zodpovedá smeru
ktorá disperzia vektorov pôvodného súboru je maximálna. Smer druhého
Komponenty (druhý základný vektor) zvolený tak, že disperzia originálu
Vektory pozdĺž nemu bolo maximálne pod podmienkou prvého vektora ortogonality
Základ. Podobne sú definované zostávajúce rámcové vektory. V dôsledku toho smery
Základné vektory sú vybraté tak, aby maximalizovali disperziu pôvodného súboru.
Pozdĺž prvej zložky, nazývané hlavné komponenty (alebo hlavné
osi). Z toho vyplýva, že hlavná variabilita vektorov pôvodného súboru vektorov
reprezentované niekoľkými prvými komponentmi a objavujú sa príležitosť, hádzanie
Menej základné komponenty, choďte do priestoru menšieho rozmeru.
9

10. Spôsob hlavnej zložky. Schéma

10

11. Spôsob hlavnej zložky. Účty Matrix

Matrica účtov T poskytuje projekciu počiatočných vzoriek (J-dimenzionálne
vektory
X1, ..., XI)
na
vedľajší
Hlavný
komponent
(A-dimenzionálne).
Riadky T1, ..., TI matice t sú súradnice vzoriek v novom súradnicovom systéme.
Stĺpce T1, ..., TA Matrice T - ortogonálne a predstavujú projekciu všetkých vzoriek
jedna nová súradnicová os.
V štúdii tejto metódy PCA sa venuje plánom.
účtov. Nesú priaznivé informácie na pochopenie toho, ako je usporiadané
údajov. Na harmonograme účtov je každá vzorka zobrazená v súradniciach (TI, TJ), najčastejšie
- (T1, T2), označený PC1 a PC2. Blízkosť dvoch bodov znamená ich podobnosť, t.j.
Pozitívna korelácia. Body nachádzajúce sa v pravom uhle sú
nekorelovaný a nachádzajúci sa diameticky naproti
Negatívna korelácia.
11

12. Spôsob hlavnej zložky. Maticové zaťaženie

LOAD MATRIX P je matrica prechodu zo zdrojového priestoru
Premenné X1, ... XJ (J-dimenzionálne) do priestoru hlavných komponentov (a-dimenzionálne). Každý
String matrice P pozostáva z koeficientov spájajúcich premenné T a X.
Napríklad linka A-I je projekcia všetkých premenných X1, ... XJ na A-J AXIS
komponent. Každý P stĺpec je projekcia zodpovedajúceho variabilného XJ do nového
Súradnicový systém.
Plán načítania sa používa na štúdium úlohy premenných. Na toto
Grafika Každá premenná XJ sa zobrazuje napríklad bodom súradníc (PI, PJ), napríklad
(P1, P2). Analyzovanie podobne ako harmonogram účtov, môžete pochopiť, aké premenné
a ktoré sú nezávislé. Spoločný výskum párových plánov účtov a
Zaťaženie môže tiež dať veľa užitočných informácií o údajoch.
12

13. Vlastnosti hlavnej metódy komponentov

Hlavná metóda komponentov je založená na nasledujúcich predpokladoch:
Predpoklad, že rozmer údajov možno účinne znížiť
lineárnou transformáciou;
Predpoklad, že pokyny, v ktorých sú najviac informácií
Vstupná disperzia je maximálna.
Dá sa ľahko vidieť, že tieto podmienky nie sú vždy vykonávané. Napríklad,
Ak sú body vstupných nastavení umiestnené na povrchu hyperphere, potom nie
Lineárna transformácia nebude schopná znížiť rozmer (ale môže sa s ním ľahko vyrovnať
Nelineárna konverzia založená na vzdialenosti od bodu do stredu gule).
Táto nevýhoda je rovnako zvláštna pre všetky lineárne algoritmy a môže byť
prekonať pomocou ďalších fiktívnych premenných, ktoré sú
Nelineárne funkcie z prvkov nastaveného vstupného dát (tzv. Kernel trik).
Druhou nevýhodou hlavnej metódy komponentov je, že smery
Maximalizácia disperzie, nie vždy maximalizovať informatiovanosť.
Napríklad premenná s maximálnou disperziou nemusí niesť takmer nie
informácie, zatiaľ čo premenná s minimálnou disperziou
Plne rozdelené triedy. Spôsob hlavnej zložky v tomto prípade
Preferencie pre prvú (menej informatívnu) premennú. Všetky extra
Informácie týkajúce sa vektora (napríklad obraz patriacim do jedného z
triedy), ignorované.
13

14. Príklad údajov pre MGK

K. Esbensen. Analýza multidimenzionálnych údajov, PocK. za. z angličtiny pod
ed. O. RODIONOVA, Z IPHF RAS, 2005
14

15. Príklad údajov pre MHK. Označenie

Výška
Výška: santimeters
Hmotnosť
Hmotnosť: v kilogramoch
Vlasy.
Vlasy: krátke: -1, alebo dlhé:
+1
Topánky.
Topánky: Európska veľkosť
Štandardný
Vek.
Vek: V rokoch
Príjem.
Príjem: v tisícoch eura ročne
Pivo.
Pivo: spotreba v litroch ročne
Víno
Víno: Spotreba v litroch ročne
Pohlavie
Pohlavie: Muž: -1, alebo žena: +1
Silový
Power: Index založený na
Kontrola fyzických schopností
Región.
Región: North: -1, alebo South: +1
IQ.
Koeficient inteligencie,
Štandardný test
15

16. Účty MATRIX

16

17. LOAD MATRIX

17

18. Vzorové objekty v priestore nových komponentov

Ženy (f) sú označené hrnčiacimi ● a ● a
Muži (M) - štvorce ■ a ■. Severne (n)
prezentované modré ■ a južné (s) - červená
Farba ●.
Veľkosť a farebné symboly odrážajú príjem -
Viac a jasnejšie, tým viac. Čísla
predstavuje vek
18

19. Zdrojové premenné v priestore nových komponentov

19

20. Plán "Stony Scree" (Scree Plot)

20

21. Spôsob hlavných faktorov

V paradigme spôsobu hlavných faktorov, úloha znižovania rozmeru funkcie
Priestor vyzerá tak, že n známky možno vysvetliť najmenej
počet m-latentných značiek - spoločné faktory, kde m< Počiatočné označenia a zapísané spoločnými faktormi (lineárne kombinácie)
S pomocou tzv. Charakteristických faktorov.
Konečným cieľom štatistickej štúdie vykonanej s atrakciou
Zariadenie faktorovej analýzy spravidla spočíva v identifikácii a interpretácii
Latentné všeobecné faktory so simultánnou túžbou minimalizovať
Číslo a stupeň závislosti na jeho konkrétnom zostatkovom náhodnom
komponent.
Každý znak
Je to výsledok
Vplyv M hypotetické všeobecné a
Jeden charakteristické faktory:
X 1 A11 F1 A12 F2 A1M F M D1V1
X A F A F A F D V
2
21 1
22 2
2m M.
2
X N A N1 F1 A N 2 F 2 A NM F M D NVN
21

22. Rotácia faktorov

Rotácia je spôsob, ako transformovať faktory získané v predchádzajúcom štádiu,
Zmysluplnejšie. Rotácia je rozdelená na:
Grafické (vodivé osi sa neuplatňujú viac ako dvojrozmerné
Analýza)
Analytické (vybraté kritérium rotácie, líšia ortogonálne a
Kosholnoe) I.
Matrix-aprism (rotácia spočíva v približovaní sa k niektorým uvedeným
cieľová matica).
Výsledkom rotácie je sekundárna štruktúra faktorov. Primárny
Faktorová štruktúra (pozostávajúca z primárnych zaťažení (získaných v predchádzajúcom
Stupeň) - to je v skutočnosti projekčné body pre ortogonálne osi súradníc. Je to zrejmé
Ak sú projekcie nula, štruktúra bude jednoduchšia. A projekcie budú nulové
Ak sa bod leží na nejakej osi. Môžete teda zvážiť rotáciu k prechodu
Jeden súradnicový systém na iný so známymi súradnicami v jednom systéme (
Primárne faktory) a iteratívne vybrané súradnice v inom systéme
(Sekundárne faktory). Po prijatí sekundárnej štruktúry sa snažiť ísť na takéto
Súradnicový systém na vynastavenie naprieč body (objekty) čo najviac osí
Ako mnoho projekcií (a podľa toho zaťaženia) boli nula. V rovnakom čase môže
Odstránenie obmedzení ortogonality a zníženie dôležitosti z prvého do posledného
Faktory charakteristické pre primárnu štruktúru.
22

23. Ortogonálna rotácia

znamená, že budeme otáčať faktory, ale nie
Porušujeme ich ortogonalitu navzájom. Ortogonálne otáčanie
znamená násobenie počiatočnej primárneho zaťaženia matrice na ortogonálne
Matrix R (taká matica
V \u003d br.
Algoritmus ortogonálnej rotácie vo všeobecnom prípade:
0. B - Matrix primárnych faktorov.
1.
Hľadajú
ortogonálne
Matrica
RT.
Veľkosť
2*2
pre
dva
Stĺpce (faktory) BI a BJ Matrix B takéto kritérium pre matricu
R maximum.
2.
Nahrádzame stĺpce BI a BJ na stĺpci
3.
Skontrolujeme, či všetky stĺpce prešli. Ak nie, potom prechod na 1.
4.
Skontrolujeme, či sa kritérium pre celú maticu rástla. Ak áno, potom prechod na 1. Ak
Nie, koniec algoritmu.
.
23

24. Rotácia varimaxu

Toto kritérium využíva formalizáciu
Disperzia štvorcových nákladov premennej:
ťažkosti
faktor a
prostredníctvom
Potom môže byť kritérium všeobecne napísané ako:
Zároveň sa môže normalizovať faktorové zaťaženie, aby sa zbavili
Vplyv individuálnych premenných.
24

25. Čestné otáčanie

Formalizácia koncepcie zložitosti faktora q i-t premenná
Disperzia štvorcov faktorov faktorov faktorov:
kde R je počet stĺpcov faktorovej matrice, bij - faktor zaťaženie j-t
Faktory na variabilnej hodnote I-E. Kritériom bytu sa snaží
maximalizovať zložitosť celého súboru premenných
Jednoduchosť interpretácie faktorov (snaží sa uľahčiť popis stĺpca):
Zvažujem to
- konštantná (súčet vlastníctva matrice
Kovaridlo) a rozšírenie je priemerná hodnota (rovnako ako účasť, že funkcia napájania
Rastie úmerné argumentu), získame konečný typ kritéria
Maximalizácia:
25

26. Kritériá na určenie počtu faktorov

Hlavným problémom faktorovej analýzy je pridelenie a interpretácia
Hlavné faktory. Pri výbere komponentu sa výskumník zvyčajne stretáva
Značné ťažkosti, pretože neexistujú žiadne jednoznačné kritérium výberu
Faktory, a teda subjektivizmus interpretácií výsledkov je nevyhnutný.
Existuje niekoľko často použitých kritérií na určenie počtu faktorov.
Niektoré z nich sú alternatívou ostatným a niektoré z nich
Kritériá môžu byť použité spoločne, aby doplnili ostatné:
Kritériá Karizátor alebo kritériá vlastných čísel. Toto kritérium sa navrhuje
Kaiser, a je pravdepodobne najrozšírenejšie. Len vybrané
Faktory s eiggenvalues \u200b\u200brovnosť alebo veľké 1. To znamená, že ak
Faktor nepredstavuje rozptylu rovnocennú aspoň s rozptýlením jedného
premenná, potom sa zníži.
Kritérium Rocky Scree (eng. Scree) alebo kritérium počítania. On je
Grafická metóda prvýkrát ako navrhovaná psychológka Kattel. Vlastný
Hodnoty môžu byť zobrazené ako jednoduchý graf. Kattel ponúkol tak
miesto na grafe, kde zníženie vlastných hodnôt zľava doprava na maximum
spomaluje. Predpokladá sa, že vpravo od tohto bodu je len
"Factorial Osprey" - "Ospse" je geologický termín označujúci
Čipy hornín akumulujúcich v spodnej časti skalnatého svahu.
26

27. Kritériá na určenie počtu faktorov. Pokračujúci

Kritérium významu. Je obzvlášť účinný, keď model
Communta je známa a neexistujú žiadne sekundárne faktory. Kritérium však nie je vhodné
Hľadať zmeny v modeli a implementovať len vo faktorovej analýze metódou
Najmenšie štvorce alebo maximálne vedenie.
Kritérium pre podiel reprodukovanej disperzie. Faktory sú umiestnené v podiele
určená disperzia, keď sa percento disperzie upustí na nevýznamné, \\ t
Výber by mal byť zastavený. Je žiaduce, aby vyhradené faktory vysvetlila
Viac ako 80% rozptyl. Nevýhody kritéria: Po prvé, subjektivita prideľovania, VOCTRE, špecifickosť údajov môže byť taká, že všetky hlavné faktory nebudú môcť
Mena Vysvetlite požadované percento rozptylu. Preto hlavné faktory
Musia byť spolu, aby sa vysvetlili aspoň 50,1% disperziu.
Kritérium interpretability a injekcií. Toto kritérium kombinuje
Štatistická presnosť so subjektívnymi záujmami. Podľa neho hlavné faktory
Môže byť pridelený, kým nie je možný ich jasný výklad. Ona
frontu závisí od rozsahu faktorovej záťaže, to znamená, že ak je v faktore aspoň
Jedno ťažké zaťaženie, možno ho interpretovať. Možnosť reverznej možnosti -
Ak existujú silné záťaže, ale výklad je z toho ťažký
Komponenty s výhodou odmietajú.
27

28. Príklad použitia MHK

Byť
K dispozícii
Ďalšie
indikátory
Ekonomický
činnosť
Podniky: Pracovnosť (x1), podiel nakúpených výrobkov v produktoch (x2),
Zmeniť koeficient (X3), podiel pracovníkov v podniku
x4), poistné a odmeny na zamestnanca (X5), ziskovosť (y). Lineárny
Regresný model má formulár:
Y \u003d B0 + B1 * X1 + B2 * X2 + B3 * X3 + B4 * X4 + B5 * X5
X1
X2
x3.
x4.
X5
Y.
0,51
0,2
1,47
0,72
0,67
9,8
0,36
0,64
1,27
0,7
0,98
13,2
0,23
0,42
1,51
0,66
1,16
17,3
0,26
0,27
1,46
0,69
0,54
7,1
0,27
0,37
1,27
0,71
1,23
11,5
0,29
0,38
1,43
0,73
0,78
12,1
0,01
0,35
1,5
0,65
1,16
15,2
0,02
0,42
1,35
0,82
2,44
31,3
0,18
0,32
1,41
0,8
1,06
11,6
0,25
0,33
1,47
0,83
2,13
30,1
28

29. Príklad použitia MHK

Budovanie regresného modelu v štatistickom balíku
Koeficient X4 nie je významný (hodnota p\u003e α \u003d 5%) a môže byť vylúčená z modelu.
čo
Po výnimke x4 sa proces budovania modelu opäť spustí.
29

30. Príklad použitia MHK

Kritérium Kaiser pre MHK ukazuje, že môžete opustiť 2 komponenty vysvetľujúce
Približne 80% pôvodnej disperzie.
Pre vybraný komponent môžete stavať rovnice v systéme súradnice zdrojov:
U1 \u003d 0,41 * x1 - 0,57 * x2 + 0,49 * x3 - 0,52 * x5
U2 \u003d 0,61 * x1 + 0,38 * x2 - 0,53 * x3 - 0,44 * x5
30

31. Príklad použitia MHK

Teraz môžete vytvoriť nový regresný model v nových komponentoch:
Y \u003d 15.92 - 3,74 * U1 - 3,87 * U2
31

32. Metóda singulárneho rozkladu (SVD)

Beltrami a Jordánsko sú považované za zakladateľov teórie singulárne
rozklad. Beltrami - za to, že bol prvý, kto by zverejnil prácu
jednotné rozklad, a Jordánsko - pre eleganciu a úplnosť
Práca. Práca Beltrami sa objavila v časopise "Journal of Matematika
Používanie študentov talianskych univerzít "v roku 1873, hlavné
Účelom, ktorým bolo zoznámiť študentov
Bilinear formy. Podpora v rozklade matice A veľkosť n
x m s poradím d \u003d hodnosť (m)<= min(n,m) в произведение матриц меньшего
Rank:
A \u003d UDVT,
kde matice veľkosti n x d a v veľkosti m x d skladajú
Ortonormálne stĺpce, ktoré sú naše vlastné vektory
non-nulové vlastné vlastnosti matríc AAT a ATA, resp.
Utu \u003d v tv \u003d i a d veľkosť d x d - diagonálna matica s
pozitívne diagonálne prvky zoradené do
Zostupne. Stĺpce matice u sú,
orthonormal základný priestor stĺpcov matici A a stĺpcov
Matrice V - Ortonormal Base Space Line Matica A.
32

33. Metóda singulárneho rozkladu (SVD)

Dôležitou vlastnosťou SVD rozkladu je skutočnosť, že ak
Vidlička. len z najväčších diagonálnych prvkov K
Ponechajte len K prvé stĺpce v matriciach U a V, potom matricu
AK \u003d UKDKVKT.
bude najlepšia aproximácia matici relatívne
Froenius Normy medzi všetkými maticami s hodnosťou k.
Toto skrátenie najprv znižuje rozmer vektora
priestor, znižuje požiadavky na skladovanie a výpočtové
Požiadavky na model.
Po druhé, vyhodí malé jednotné čísla, malé
skreslenie v dôsledku hluku v údajoch sa odstránia, odchádza
V tomto modeli len najsilnejšie účinky a trendy.

Nasledujúci príklad je založený na fiktívnych údajoch týkajúcich sa štúdia spokojnosti o živote. Predpokladajme, že dotazník bol zamietnutý 100 náhodou vybraný dospelý. Dotazník obsahoval 10 bodov zameraných na určenie spokojnosti pri práci, spokojnosť s ich koníčkom, domácim životom a celkovou spokojnosťou v iných oblastiach života. Odpovede na otázky boli zavedené do počítača a sú opečiatkované tak, že priemer pre všetky položky sa stane približne 100.

Výsledky boli umiestnené do dátového súboru faktora.sta. Tento súbor môžete otvoriť pomocou možnosti súboru - otvorené; Je s najväčšou pravdepodobnosťou, že tento dátový súbor je v adresári / príklady / datasets. Nižšie je výtlačok premenných tohto súboru (Ak chcete získať zoznam, vyberte všetky špecifikácie premenných v ponuke údajov).

Účel analýzy . Účelom analýzy je študovať vzťahy medzi spokojnosťou v rôznych oblastiach činnosti. Najmä je žiaduce preskúmať otázku počtu faktorov "skrývanie" pre rôzne oblasti činnosti a ich význam.

Vyberte Analýzu. Vyberte faktorovú analýzu v ponuke Analýza - Viacnásobná analýza prieskumu na zobrazenie analýzy východiskového faktora modulu. Kliknite na tlačidlo Premenné na východiskovom paneli (pozri nižšie) a v tomto súbore vyberte všetkých 10 premenných.



Iné možnosti . Ak chcete vykonať štandardnú analýzu faktora v tomto dialógovom okne, je všetko, čo potrebujete. Ak chcete získať stručný prehľad o iných príkazoch, ktoré sú k dispozícii z východiskového panelu, môžete si vybrať ako pripojovací súbor korelačný matic (pomocou poľa dátového súboru). V poli odstraňovania PD si môžete vybrať výlučku alebo spárovanie výnimky alebo striedanie médií za zmeškané údaje.

Nastavte spôsob výberu faktorov. Stlačte tlačidlo OK prejdete na nasledujúce dialógové okno s názvom Uveďte spôsob výberu faktorov. S týmto oknom dialógu môžete zobraziť opisnú štatistiku, vykonajte viac regresnej analýzy, vyberte spôsob výberu faktorov, vyberte maximálny počet faktorov, minimálnych hodnôt, ako aj iné akcie týkajúce sa špecifických metód výberu faktorov. A teraz poďme do popisnej karty.



Zobrazenie popisných štatistík. Teraz kliknite na zobrazenie Corr. / Medium / St. V tomto okne, aby sa otvoril okno zobrazenia popisných štatistík.



Teraz môžete zvážiť popisné štatistiky graficky alebo pomocou tabuľky výsledkov.

Výpočet korelačnej matrice. Stlačením tlačidla Korelačné na karte Rozšírené zobrazíte tabuľku výsledkov s koreláciami.



Všetky korelácie v tejto tabuľke výsledkov sú pozitívne a niektoré korelácie majú značné množstvo. Napríklad premenné hobby_1 a miscel_1 korelovali na úrovni 0,90. Niektoré korelácie (napríklad korelácie medzi spokojnosťou v práci a domácej spokojnosti) sa zdajú byť relatívne malé. Vyzerá to, že matrica má určitú odlišnú štruktúru.

Metóda výberu. Teraz kliknite na tlačidlo Zrušiť v dialógovom okne Zobrazenie description štatistiky, aby ste sa mohli vrátiť do metódy nastavenia faktora. Môžete si vybrať niekoľko metód prideľovania v záložke Rozšírené (pozrite si pokročilý dialógové okno, nastavte metódu pre výber faktorov na opis každej metódy, ako aj úvodného preskúmania opisujúceho spôsobu hlavných komponentov a spôsobu hlavných faktorov ). V tomto príklade je predvolená hodnota hlavná metóda komponentov, pole Max. Počet faktorov obsahuje hodnotu 10 (v tomto príklade maximálny počet faktorov) a min. vlastné. Hodnota obsahuje 0 (minimálna hodnota pre tento príkaz).



Ak chcete pokračovať v analýze, kliknite na tlačidlo OK.

Výsledky. Výsledky faktorovej analýzy môžete zobraziť v dialógovom okne. Výsledky faktorovej analýzy. Najprv vyberte kartu Pridané disperzie.



Zobraziť vlastné hodnoty . Vymenovanie vašich vlastných hodnôt a ich užitočnosť pre užívateľa pri rozhodovaní o tom, koľko faktorov by mali byť ponechané (interpretovateľné) boli opísané v úvodnom preskúmaní. Teraz stlačte tlačidlo svoje vlastné hodnoty, aby ste získali tabuľku s vlastnými hodnotami, percento všeobecnej disperzie nahromadené vlastnými hodnotami a nahromadené percentá.


Ako možno vidieť z tabuľky, jeho vlastná hodnota pre prvý faktor je 6.118369; tí. Podiel disperzie vysvetleného prvým faktorom je približne 61,2%. Všimnite si, že tieto hodnoty sa ukázali byť ľahko porovnateľné, pretože 10 premenných je vystavených analýze, a preto sa súčet všetkých vlastníkov ukázalo, že sa rovná 10. Druhý faktor zahŕňa približne 18% disperziu. Zostávajúce faktory neobsahujú viac ako 5%všeobecná disperzia.Výber počtu faktorov. V podnikovej sekcii je stručne opísaná metóda, ako sa získajú získané vlastnosti, ktoré môžu byť použité na vyriešenie otázky, koľko faktorov by malo byť ponechané v modeli. V súlade s kritériom KAISER (KAISER, 1960), musíte zanechať faktory s vlastnými hodnotami veľkých 1. Z vyššie uvedenej tabuľky vyplýva, že kritérium vedie k výberu dvoch faktorov.

Kritérium kamenové scree . Teraz kliknite na tlačidlo Schéma schémy Schéma, aby ste získali graf vlastných hodnôt, aby ste mohli aplikovať Cattell Catchter (Cattelll, 1966). Nižšie uvedený harmonogram bol doplnený segmentmi spájajúcimi susedných vlastníkov, aby sa kritérium viac vizualizovali. Nároky Kattel (Cattell) založené na metóde Monte Carlo, čo je bod, kde kontinuálny pokles vo svojich vlastných hodnotách spomaľuje a potom, čo úroveň iných vlastníctva odráža len náhodný "hluk". Nižšie uvedený graf, tento bod môže zodpovedať faktoru 2 alebo 3 (ako je znázornené šípkami). Preto zažívajú riešenia a vidieť, ktorý z nich dáva primeranejší obraz.



Teraz zvážte faktorové zaťaženie.

Faktorové zaťaženie . Ako je opísané v podnikovej časti, faktorové zaťaženie možno interpretovať ako korelácie medzi faktormi a premennými. Z tohto dôvodu predstavujú najdôležitejšie informácie, na ktorých je založený výklad faktorov. Po prvé, pozrime sa na (inšpirované) faktorové zaťaženie pre všetkých desať faktorov. Na karte Zaťaženie dialógového okna, výsledky faktorovej analýzy v poli rotácie faktora nastavte hodnotu bez otáčania a stlačením tlačidla faktora zaťaženia zobrazíte tabuľku zaťaženia.



Pripomeňme, že výber faktorov nastal takým spôsobom, že následné faktory zahŕňali rastúcu a menšiu disperziu (pozri úvodný prehľad). Preto nie je prekvapujúce, že prvý faktor má najvyššie zaťaženie. Všimnite si, že príznaky faktorového zaťaženia sú dôležité len s cieľom preukázať, že premenné s opačným zaťažením na rovnakom faktore interagujú s týmto faktorom opačným spôsobom. Môžete však vynásobiť všetky zaťaženia v stĺpci -1 a nakresliť značky. Vo všetkých ostatných budú výsledky nezmenené.

Otáčanie faktorového roztoku. Ako je opísané v sekcii úvodného preskúmania, skutočná orientácia faktorov v priestore faktora je ľubovoľná a každá rotácia faktorov reprodukuje koreláciu, ako aj iné rotácie. Preto sa zdá byť prirodzené otáčať faktory takým spôsobom, aby si vybral najjednoduchšiu štruktúru faktora pre tlmočenie. Termín jednoduchá štruktúra bola v skutočnosti vynájdená a určená Trestone (Thurstone, 1947), najmä na opis podmienok, keď sú faktory označené vysokým zaťažením na niektorých premenných a nízke - pre iných, ako aj keď existuje niekoľko veľkých krížových nákladov , tj Existuje niekoľko premenných s výraznými zaťaženiami na viac ako jednom faktore. Najdražšími metódami výpočtovej rotácie na získanie jednoduchej štruktúry je metóda otáčania VIMIMAX navrhovaná spoločnosťou KAISER (Kaiser, 1958). Ďalšie metódy navrhnuté podľa Harman (Harman, 1967) sú metódy bytového komplexu, bikvartimax a equimax (pozri Harman, 1967).

Výber rotácie . Najprv zvážte počet faktorov, ktoré chcete odísť na rotáciu a interpretáciu. Bolo to predtým rozhodnuté, že dvaja je najdôležitejším a prijateľným počtom faktorov, na základe kritéria sa však kritérium rozhodlo zohľadniť riešenie s tromi faktormi. Kliknutím na tlačidlo Zrušiť sa vrátite do okna Dialógové okno Nastavte metódu výberu faktorov a zmeňte maximálny počet faktorov v rýchlom karte od 10 do 3, potom kliknutím na tlačidlo OK pokračujte v analýze.

Teraz vykonajte rotáciu metódou Varimaxu. Na karte Zaťaženie dialógového okna, výsledky faktorovej analýzy v poli rotácie faktora nastaví hodnotu pôvodného varimaxu.



Stlačením tlačidla Factor Loads zobrazte výsledky výsledného faktora zaťaženia v tabuľke.


Zobrazenie riešenia pri otáčaní troch faktorov. Tabuľka obsahuje významné zaťaženie na prvý faktor pre všetky premenné, iné ako tie, ktoré súvisia s domom. Faktor 2 má celkom významné zaťaženie pre všetky premenné, okrem premenných spojených s uspokojením v práci. Faktor 3 má len jedno významné zaťaženie pre premennú home_1. Skutočnosť, že na treťom faktore má vysokú záťaž len jednu premennú, naznačuje, a nemôže byť rovnaký dobrý výsledok bez tretieho faktora?

Preskúmanie riešenia pri otáčaní dvoch faktorov . Znova stlačte tlačidlo Zrušiť v okne Dialógu, výsledky faktorovej analýzy, aby sa vrátili do vymedzenia spôsobu výberu faktorov. Zmeňte maximálny počet faktorov v rýchlom karte od 3 do 2 a kliknutím na tlačidlo OK prejdete na dialógové okno Faktor Analýzy. Na karte Zaťaženie v poli Rotácia faktora nastavte hodnotu zdroja VARIMAX a stlačte tlačidlo faktora načítania.


Faktor 1, ako je vidieť z tabuľky, má najvyššie zaťaženie pre premenné súvisiace s spokojnosťou s prácou. Má najmenšie zaťaženie pre premenné týkajúce sa spokojnosti s domom. Ostatné záťaže užívajú medziprodukty. Faktor 2 má najvyššie zaťaženie pre premenné spojené s domácou spokojnosťou, nižšie zaťaženia - pre spokojnosť pri práci priemerné zaťaženie pre zvyšok premenných.

Interpretácia riešenia pre dva-faktorové rotácie . Je možné interpretovať tento model? Všetko vyzerá, že dve faktory sú najlepšie identifikované ako faktor spokojnosti s prácou (faktor 1) a ako faktor pri uspokojovaní domáceho života (faktor 2). Spokojnosť so svojím koníčkom a rôznymi ďalšími aspektmi života sa zdá súvisiace s oboma faktormi. Tento model naznačuje v tom zmysle, že spokojnosť s prácou a domácim životom podľa tejto vzorky môže byť navzájom nezávislá, ale obaja prispievajú k spokojnosti koníčkov a iných strán života.

Graf riešenia založeného na rotácii dvoch faktorov . Ak chcete získať disperznú schému dvoch faktorov, stlačte tlačidlo 2M na zaťaženie na karte Zaťaženie faktorovej analýzy Dialógové okno. Nižšie uvedený diagram jednoducho zobrazuje dve zaťaženia pre každú premennú. Všimnite si, že diagram rozptylu dobre ilustruje dve nezávislé faktory a 4 premenné (Hobby_1, Hobby_2, Rôzne_1, Ricel_2) s krížovým zaťažením.



Pozrime sa teraz, ako dobre môže byť pozorovaná matica s kovarianciou reprodukovaná na dvojfaktorovom riešení.

Reprodukovaná a zvyšková korelačná matrica. Ak chcete získať dve tabuľky s reprodukovanou korelačnou matricou, stlačte reprodukované a zvyšné korelačné tlačidlo, aby ste získali dve tabuľky s reprodukovanou korelačnou matricou a zvyšková korelačná matrica (pozorované mínus reprodukovaných korelácií).



Vstupy v reziduálnej korelačnej tabuľke možno interpretovať ako "množstvo" korelácií, pre ktoré sa nedá odpovedať dve získané faktory. Samozrejme, diagonálne prvky matrice obsahujú štandardnú odchýlku, pre ktorú tieto faktory nemôžu byť zodpovedné, a ktoré sa rovnajú druhá odmocnina jednotky mínus zodpovedajúce komunity pre dva faktory (pripomenutím, že spoločná premenná je disperzia, ktorá môže byť vysvetlené zvoleným počtom faktorov). Ak si túto maticu starostlivo zvážte, môžete vidieť, že skutočne nemá zvyškové korelácie, veľké 0,1 alebo menšie -0.1 (v skutočnosti, len malý počet z nich v blízkosti tejto hodnoty). Pridajte k nemu, že prvé dva faktory zahŕňajú približne 79% z celkovej disperzie (pozri nahromadené% vlastných hodnôt v tabuľke výsledkov).

"Tajomstvo" úspešného príkladu . Príklad, ktorý ste práve študovali, skutočne dáva riešenie dvojfarebného problému v blízkosti dokonalého. Určuje väčšinu disperzie, má rozumnú interpretáciu a reprodukuje korelačnú matricu s miernymi odchýlkami (zvyškové korelácie). Skutočné údaje vám v skutočnosti umožňujú získať také jednoduché riešenie a v skutočnosti sa tieto fiktívne viacnásobné údaje získali pomocou generátora náhodného čísla s normálnou distribúciou dostupnou v systéme. Špeciálne v údajoch boli "zavedené" dva ortogonálne (nezávislé) faktor, podľa ktorého boli vytvorené korelácie medzi premennými. Tento príklad faktorovej analýzy reprodukuje dva faktory, ako boli, (t.j. faktor spokojnosti s prácou a faktorom spokojnosti s domácim životom). Ak teda fenomén (a nie umelý, ako v príklade, údaje) obsahovali tieto dva faktory, potom ste ich zdôraznili, mohlo by to poznať niečo o skrytej alebo latentnej štruktúre fenoménu.

Ostatné výsledky . Pred vykonaním konečného záveru budeme stručné pripomienky k iným výsledkom.

Spoločenstvo . Na získanie komunitných komunít stlačte tlačidlo komunity v dialógovom okne Dispers Disperzia. Výsledky faktorovej analýzy. Pripomeňme, že spoločnosť premennej je podiel disperzie, ktorá môže byť reprodukovaná na daný počet faktorov. Rotácia faktorového priestoru neovplyvňuje veľkosť všeobecnosti. Veľmi nízke spoločenstvo pre jednu alebo dve premenné (z mnohých v analýze) môže naznačovať, že tieto premenné nie sú veľmi dobre vysvetlené modelom.

Koeficientov hodnôt. Faktorové koeficienty môžu byť použité na výpočet hodnôt faktorov pre každé pozorovanie. Samotné koeficienty sú zvyčajne malý záujem, ale hodnoty faktorov sú užitočné pri vykonávaní ďalšej analýzy. Ak chcete zobraziť koeficienty, stlačte tlačidlo faktorov faktorov v karte Hodnoty výsledkov faktorovej analýzy.

Faktorové hodnoty. Faktujúce hodnoty možno považovať za aktuálne hodnoty pre každého respondentovi reagovať (t.j. pre každé pozorovanie tabuľky zdrojových údajov). Tlačidlo faktorovej hodnoty V záložke dialógového bloku vám výsledky faktorovej analýzy umožňuje vypočítať hodnoty faktora. Tieto hodnoty možno uložiť na ďalšie stlačenie tlačidla Uložiť hodnoty.

Konečný komentár. Analýza faktora je zložitý postup. Každý, kto neustále používa analýza faktora S mnohými (napríklad 50 alebo viacerými) premennými, mnohými príkladmi "patologického správania" by mohlo vidieť, ako napríklad: negatívne vlastné vlastnosti a nekonštrukčné riešenia, špeciálne matice atď. Ak máte záujem o použitie faktorovej analýzy na určenie alebo významné faktory s veľkým počtom premenných, mali by ste starostlivo preskúmať akýkoľvek podrobný sprievodca (napríklad Harmanova kniha (Harman, 1968)). Preto, pretože mnohé kritické riešenia v analyzácii faktora sú subjektívnou povahou (počet faktorov, metóda otáčania, interpretácia zaťaženia), je pripravená na skutočnosť, že niektoré skúsenosti sa vyžadujú skôr, ako sa v ňom zaujímate. Modul faktora analýzy bol navrhnutý špeciálne, aby sa umožnilo ľahko použiteľné interaktívne prepínanie medzi rôznym počtom faktorov, rotácií atď., Aby sa zažili a porovnávali rôzne riešenia.

Tento príklad je prevzatý z referenčného systému PPP. Štatistiky. Statsoft



Páči sa vám článok? Zdieľaj to