A khi négyzet próba két minőségi változó közötti kapcsolat elemzésére alkalmazható statisztikai próba. Vagyis arra ad választ, hogy a két változó között van-e szignifikáns kapcsolat. Tehát nominális vagy ordinális mérési szintű változók esetében alkalmazhatjuk. A khi négyzet próba úgy működik, hogy az SPSS program a cellák megfigyelt esetszámait hasonlítja össze azzal az elvárt esetszámmal, amelyet akkor kapnánk ha nem lenne kapcsolat a két változó között. Ha ez a kapcsolat egyértelmű, akkor függvényszerű kapcsolatról; ha csak valószínűsíthető, akkor sztochasztikus kapcsolatról beszélünk. Ha pedig nincs kapcsolat a két változó között, akkor azt állítjuk, hogy a két változó független. Itt fontos tudnunk, hogy a khi négyzet szorosan kötődik az asszociációs kapcsolat fogalmához és viszonylag hasonló kérdéskört rejtenek önmagukban. Míg a khi négyzet próba maga a statisztikai próba, statisztikai teszt megnevezése, addig az asszociációs kapcsolat a khi négyzet próba során alkalmazott változók közötti kapcsolat megnevezése. A khi négyzetet a következő típusú változók esetében használhatjuk:

  1. mindkét változó nominális mérési szintű
  2. egyik változó nominális, a másik pedig ordinális mérési szintű
  3. mindkét változó ordinális mérési szintű

Példa: Egy egyetem III. évfolyamán vizsgáljuk a hallgatók neme és a vallási hovatartozásuk közötti kapcsolatot
Angolul: Chi-square test
Más néven: Khi négyzet teszt

A khi négyzet próba jellemzői

  • Érzékeny a mintanagyságra. Vagyis ugyanazon jelenség elemzésekor előfordulhat, hogy kis elemszámnál nem mutat szignifikáns kapcsolatot, míg nagyobb elemszámú minta esetén igen.
  • A khi-négyzet eloszlás ferde. Alakja a szabadságfok nagyságától függ.
  • Minél nagyobb a szabadságfok, annál szimmetrikusabb az eloszlás.
  • Széles körben elterjedt elemzési módszer. Gyakran alkalmazzák.
  • Könnyen értelmezhető.

A khi négyzet próba feltételei

Az elvárt gyakoriság minden egyes cellában minimum 5 kell legyen. Azonban egyes esetekben van, hogy egy megengedőbb feltétellel dolgoznak a kutatók. Ez alapján az összes cella maximum 20%-ában lehet az elvárt gyakoriság száma kevesebb, mint 5.

A khi négyzet próba elemzésének lépései

1. lépés: Megállapítjuk, hogy ráfogható-e a két változóra, hogy egyik a függő és a másik a független. Ezt logikailag végig kell gondolni, hogy befolyásolhatja-e egyik a másikat vagy sem.

2. lépés: Ha igen, akkor a független változót a sor-ba (row), a függő változót az oszlop-ba (column) visszük át. Fontos, hogy mindig a független változó szerint százalékolunk. Ha nem lehet megállapítani, hogy melyik a függő és melyik a független, akkor az alapján döntjük el, hogy melyik kerül a sorba, illetve az oszlopba, hogy mi a kutatás célja.

3. lépés: Elvégezzük a khi-négyzet próbát. Ha a próba szignifikáns kapcsolatot mutat, akkor lekérjük a megfelelő statisztikai mutatókat és értelmezzük ezeket. Ha nem szignifikáns a kapcsolat, akkor azt állítjuk, hogy a két változó nem függ egymástól.

A khi négyzet próba lekérése az SPSS-ben

Analyze → Descriptive Statistics → Crosstabs → Statistics → √ Chi-square →
khi négyzet próba lekérése

A khi négyzet próba értelmezése

khi negyzet teszt ertelmezese

Független változó: Iskolai végzettség
Függő változó: az adott felvonuláson való részvétel
A két változó között szignifikáns összefüggés van, mert p < 0,05. Vagyis az, hogy ki milyen fokú iskolai végzettséggel rendelkezik befolyásolja azt, hogy részt vett-e a felvonuláson vagy sem. Azok, akik alapfokú végzettséggel rendelkeznek nagyobb érdeklődést mutattak a rendezvény iránt, mint a felsőfokú végzettséggel rendelkezők. Míg az utóbbiak csupán 7%-a vett ezen részt, addig az előbbiek több, mint fele jelen volt a felvonuláson.

Mit kell tennem ha a Khi négyzet próba feltétele nem teljesül?

Ilyen esetben 2 lehetőség van:

  • 1. Csoportosítom az adataimat: olyan módon csoportosítom az adataimat, hogy a próba feltétele teljesüljön és meglegyen minden egyes cellában a megfelelő esetszám.
  • 2. Másfajta statisztikai próbát választok: pl. Fisher teszt

Ha a két változó közötti kapcsolat szignifikáns, akkor még a következő együtthatókat kell elemezni:

  • 1 nominális és egy ordinális vagy 2 nominális változó esetén: Cramer’s V
  • 2 ordinális változó esetén: Gamma

A Cramer’s V együttható

A Cramer’s V mutató egy asszociációs együttható, amely két nominális változó közötti kapcsolat szorosságát mutatja meg.

A Cramer’s V jellemzői

  • Értéke 0 és 1 közötti intervallumban van.
  • Ha értéke 0, akkor függetlenség áll fenn.
  • Ha értéke 1, akkor nagyon erős kapcsolatról beszélhetünk.

Példa: Ha az asszociációs mérőszám értéke 0.407-es, akkor közepes erősségű kapcsolat van a két változó között.

Cramer's V ertelmezese

Mivelhogy van egy ordinális és egy nominális változónk, amelyek közötti kapcsolat szignifikáns, ezért a Cramer’s V értékét is értelmeznünk kell. A Cramer’s V értéke 0,573, tehát megállapíthatjuk, hogy a két változó között közepesnél erősebb szignifikáns kapcsolat van.

A gamma együttható

A gamma két ordinális mérési szintű változó közötti kapcsolat szorosságát mutatja meg. A Pre mutatók csoportjába tartozik. Akárcsak a lambda, a gamma is azon alapul, hogy mennyire segíti az egyik változó szerinti hovatartozás ismerete a másik értékének becslését. Értéke nemcsak a változók közötti összefüggés erősségéről, hanem irányáról is informál.

Példa: Az életkor (4 korcsoport) és a templomba járás gyakorisága (1-soha, 2-ritkán, 3-gyakran) között vizsgáljuk a kapcsolatot.
Gamma: 0,230. Ekkor azt mondhatjuk, hogy pozitív irányú szignifikáns kapcsolat van a két változó között. Tehát az idősebbek gyakrabban járnak templomba.

A gamma együttható jellemzői

-1 és 1 közötti értéket vehet fel.

Mikor használjuk a gamma együtthatót?

Amikor két ordinális mérési szintű változó közötti kapcsolatot szeretnénk elemezni. Vagyis értékeink sorrendje között keressük az összefüggést.

Mi az, amit még ezzel kapcsolatban tudni kell?

A kereszttábla elemzés

Lehetőség van a kapcsolatnak további rétegző változókkal való kontrollálására is. A kereszttábla alapváltozata az abszolút gyakoriságok alapján készül, és ezt bővíthetjük ki a sorok, illetve oszlopok szerinti relatív (százalékos) eloszlásokkal. A kereszttábla belső rovatait celláknak, az osztályozási ismérvet pedig dimenziószámnak nevezzük.
Más néven: Kereszttábla, kontingencia táblázat, csoportosító tábla
Angolul: Crosstabs
A kereszttábla elemzés a változók közötti összefüggések feltárására alkalmas módszer. A kereszttábla megmutatja két vagy több változó együttes eloszlását. Egy változó gyakorisági eloszlását alcsoportokra bontja más változók értékei vagy kategóriái szerint.

A kereszttábla jellemzői

  • Érzékeny a mintanagyságra. Vagyis ugyanazon jelenség elemzésekor előfordulhat, hogy kis elemszámnál nem mutat szignifikáns kapcsolatot, míg nagyobb elemszámú minta esetén igen.
  • Az eloszlás alakja a szabadságfok nagyságától függ.
  • Minél nagyobb a szabadságfok, annál szimmetrikusabb az eloszlás.
  • Széles körben elterjedt elemzési módszer. Gyakran alkalmazzák.
  • Könnyen értelmezhető.

A szabadságfok:

A szabadságfok a táblázat méretét mutatja meg. Azért van szükség rá, mert a különböző szignifikanciaszinteknek megfelelő khi négyzet értékek függnek a táblázat méretétől. Az államvizsga dolgozatok megírása során a szabadságfokot mindig fel szokták tűntetni vagy lábjegyzetként vagy a szövegben megjelölve a szignifikancia szint mértéke mellett. Erre azért van szükség, mert gyakran előfordul, hogy egyes változók között szignifikáns kapcsolat van bizonyos csoportosítások esetén, de ha másként csoportosítjuk az adatainkat, akkor előfordulhat, hogy más eredményt kapunk. A szabadságfok megjelölése által könnyen utána követhető, hogy milyen változókat, milyen struktúra alapján vizsgáltunk.

Ha egy adott táblázatban r-el jelöljük a sorok számát, c-vel pedig az oszlopok számát, akkor a szabadságfokot a következőképpen számoljuk ki:

df = (r-1)·(c-1)

A 2 x 2-es táblázat esetében df = (2-1)*(2-1) = 1.
Angolul: degree of freedom (df).

A szabadságfok alkalmazása

  • Amikor két nominális vagy ordinális mérési szintű változó kapcsolatát vizsgáljuk.
  • Amikor a khi négyzetet értékeljük, mert ennek értéke függ a táblázat szabadságfokától.

Uncertainty coefficient:

A bizonytalansági együttható – más néven: Theil-féle U – 0 és 1 érték közötti PRE-mutató. Ez egy asszimetrikus mutató. A becslés hibavalószínűségének csökkenését jelzi.

Nominális változók esetében alkalmazható más mutatók

  • Phi együttható
  • Csuprov-féle asszociációs együttható
  • Goodman és Kruskal-féle együttható
  • *Cramer’s V – ezt használják a leggyakrabban

A Phi együttható fogalma

A khi-négyzet eloszlásból származtatható asszociációs mérőszám. A Phi a Chi-négyzet statisztika értékének és a megfigyelési egységek súlyozott számának hányadosa.

A Phi együttható jellemzői

  • Szimmetrikus mérőszám.
  • 2 * 2-es kontingencia tábla esetén értéke 0 és 1 között helyezkedik el.
  • Ha a tábla sorainak vagy oszlopainak száma meghaladja a 2-őt, akkor értéke lehet 1-nél nagyobb is. Nincs elméleti felső korlátja. Éppen ezért nem igazán jó mérőszám.
  • Ha a phi értéke 0, akkor a két változó független egymástól.

Mikor használjuk a Phi együtthatót?

2*2-es kontingencia tábla esetén.

A lambda együttható

Ez egy olyan asszociációs mérőszám, amely azt mutatja meg, hogy az X szerinti hovatartozás ismerete hány százalékkal csökkenti az Y szerinti hovatartozás becslésekor elkövetett hibát. Nominális változók predikciós jellegű kapcsolatának vizsgálatára alkalmazható. Azt méri, hogy a sorváltozó mennyire határozza meg az oszlopváltozót.

Példa:
Független változó: Nem
Függő változó: Alkoholfogyasztási szokások
A lambda értéke 0,191. Tehát a nem ismerete 19%-al csökkenti az alkoholfogyasztási szokások ismeretével kapcsolatos bizonytalanságot.

A lambda együttható jellemzői

  • 0 és 1 érték közötti PRE-mutató.
  • Aszimmetrikus: a függő és független szerep felcserélése esetén a mérőszám értéke különbözhet. Tehát lambda értéke függ attól, hogy melyik a függő és melyik a független változó.
  • Függetlenség esetén értéke 0.
  • A függetlenségre nem érzékeny: a függetlenségtől kissé eltérő, gyenge kapcsolatok esetén is lehet 0 az értéke.

Mikor használjuk a lambda együtthatót?

Amikor két nominális változó összefüggésére vagyunk kíváncsiak. Amikor kevesebb, mint 5 % különbség van a független változó egyes értékei szerinti eloszlások között, akkor NE használjuk!

SPSSABC © Minden jog fenntartva, 2019