A főkomponens analízis egy olyan statisztikai eljárás, amely több független változót alakít át lineáris transzformáció segítségével az eredetinél kisebb számú, új független változókká. Vagyis az eredetileg megfigyelt változókat korrelációjuk alapján kevesebb számú főkomponens változóvá vonja össze.

Angolul: Principal component analysis

A lineáris transzformáció azt jelenti, hogy az eredeti változókat nem egyszerűen összeadja az eljárás, hanem az eredeti, mért (megfigyelt) változókhoz különböző súlyokat rendel, és ezekkel szorozva adja össze azokat. A súlyok pedig éppen akkorák, hogy biztosítva legyen, hogy a főkomponens a lehető legtöbb információt (varianciát) megőrzi az eredeti változók teljes heterogenitásából.

Minden megfigyelési egység annyi főkomponens értéket kap, ahány főkomponens-változót kiszámítunk. Szignifikáns multikollinearitás esetén azokat a főkomponenseket, amelyekhez tartozó sajátérték 1-nél kisebb (vagyis nem éri el az átlagot) általában már nem vesszük figyelembe. Gyakran már 2-3 főkomponens változóval kielégítő pontossággal helyettesíthetünk „x” számú megfigyelt változót. Mivel általában néhány főkomponens már jól jellemzi a mintában rejlő információt, a többi elhanyagolható, számuk csökkenthető.

Mikor használjuk?

  • Alkalmazható a változók számának csökkentésére, a kevésbé fontos változók kiszűrésére.
  • Amikor a többváltozós elemzés során az a probléma lépik fel, hogy a vizsgált változók korrelálnak. A főkomponenselemzés segítségével ezen változók lineáris transzformációjával olyan mesterséges (hipotetikus), egymástól független változók (főkomponensek) állíthatóak elő, amelyek lényeges információveszteség nélkül biztosítják a változók függetlenségét.
  • Amikor több fontos független változó között van szoros korrelációs kapcsolat, akkor gyakran alkalmazott megoldás a főkomponenselemzés.
  • Amikor egy regressziós modell felépítéséhez egymással nem korreláló, független változókra van szükségünk.

A főkomponens analízis előnyei

A változók térbeli elhelyezkedését, csoportosulását lehet ábrázolni. A főkomponensek lesznek a koordinátarendszer tengelyei. A főkomponens változók kiszámításával osztályozni tudjuk a megfigyelési egységeket több tulajdonság, ill. változó együttes figyelembevételével. A főkomponens változók fogják képezni a két-, esetleg három dimenziós ábrák tengelyeit. A főkomponens változók és egy adott függőváltozó között két-változós vagy többszörös regresszióanalízist végezhetünk, ezt nevezik főkomponens regressziónak.

SPSSABC © Minden jog fenntartva, 2019