A normális eloszlás olyan valószínűségi függvény, amely megmutatja, hogy hogyan oszlanak meg egy változó értékei. A normális eloszlás egy adott sokaság adatainak olyan elrendezése, amelyben a legtöbb érték a tartomány közepében tömörül. Egy érték minél távolabb van a tartomány közepétől, annál kevesebb esetszám tartozik hozzá.

Normalitás vizsgálatnak nevezzük, azt az eljárást, amely során megnézzük, hogy egy változó értékei normál eloszlásúak avagy sem. A mennyiségi mérési szintű változók elemzése során általában szükség van az eloszlás vizsgálatára. Több olyan statisztikai próba is van, amelyeket csak akkor végezhetünk el, ha a változónk adatai normális eloszlásúak. Ilyen például a varianciaanalízis. A természetes jelenségek egy része normális eloszlású.

Más néven: Gauss eloszlás, normál eloszlás

Példa
A legtöbb ember átlagos magassággal rendelkezik, az átlagosnál magasabb vagy alacsonyabb emberek viszonylag kevesen vannak és minél inkább haladunk a szélsőséges értékek felé, annál kevesebb személy tartozik az adott magasságcsoporthoz.

A normális eloszlás jellemzői

A normál eloszlás szimmetrikus, ahol az értékek középen csúcsosodnak. Az ugyanakkora távolságra lévő értékek valószínűsége mindkét oldalon egyenlő. Mindkét oldalon a szélső értékek valószínűsége a legkisebb. Az eloszlás központi része az átlag, amely meghatározza a csúcsosság helyét. A legtöbb érték az átlag köré csoportosul. Az átlag értékének a növekedése az egész görbét jobbra tolja az x tengely mentén, a csökkenése pedig balra.

Az átlag és a szórás határozza meg az alakját. A normál eloszlású függvény a következő képpen változhat az átlag és a szórás változásának megfelelően: A szórás meghatározza a normális eloszlás szélességét. A szórás mutatja meg, hogy az átlagtól mekkora távolságra vannak az értékek. A szórás megváltoztatása vagy megnöveli a görbe magasságát vagy csökkenti. A nagyobb szórás nagyobb eloszlást eredményez. Ha a szórás kisebb, akkor az értékek nem esnek messze az átlagtól és a valószínűségek magasabbak. Ha a szórás terjedelme növekszik, akkor az értékek is távolabb lesznek az átlagtól.

Normális eloszlás
Normális eloszlás

A normál eloszlás sűrűség függvénynek két inflexiós pontja van, az µ - σ és µ + σ helyeken. Az eloszlás két paramétere µ és σ . A két paraméternek (µ-átlag, σ-szórás) speciális jelentése van: annak a valószínűsége, hogy egy megfigyelés az eloszlás átlagától egyszeres (+/- 1) szórás értékkel tér el, 0.682. Általában a kutatók 2- vagy 3-szoros szórást is szoktak nézni, amellyel ez a valószínűség 0.954-re illetve 0.998-ra emelkedik. Tehát annak a valószínűsége, hogy egy egyedi megfigyelés a valódi értéktől (az eloszlás átlagától) kétszeres standard deviációnyira tér el, 0.954.

Vagyis normál eloszlású adatokat nézve az esetek 68% -a az átlaghoz viszonyított +/- 1 szórás egységen belül helyezkedik el. Az adatok 95%-a pedig 2 egységen belül. Közel minden adat (99,8%) az átlaghoz viszonyítva 3 egységnyi távolságon belül helyezkedik el.

  •  µ  tehát az eloszlás átlaga, mediánja és módusza.
  • A függvény grafikonja harang alakú.

A normális eloszlás vizsgálata

Analyze → Descriptive Statistics → Explore → Plots →√ Normality plots with test

Az intervallum és az arányskála mérési szintű változók esetében alkalmazzuk. A normalitás vizsgálat során felhasználható teszt a Kolmogorov-Smirnov és a Shapiro-Wilk teszt. Az Spss-ben a Analyze főmenü Descriptive Statistics almenüjének az Explore parancsánál találjuk meg a fentebb említett teszteket. A megjelenő ablakban a Dependent List mezőbe visszük a kívánt változót és a Plots gombra kattintva megjelöljük a Normality plots with test parancsot. Ezt követően Continue, majd az Ok gombra kattintunk.

Az output ablakban megjelenő táblázatban láthatjuk, hogy hány választ vizsgált meg a program. A második táblázatban a változó statisztikai paraméterei láthatóak, a harmadikban pedig a Kolmogorov-Smirnov és Shapiro-Wilk teszt eredménye. Amennyiben egyik teszt sem szignifikáns (p > 0,05), akkor a változót tekinthetjük normál eloszlásúnak. Ezt követően elvégezhetjük a t-próbát. Amennyiben a változónk szignifikáns lenne, akkor a Wilcoxon próbát kellene elvégezni.

Amint a fentiekből is kiderül, a T-próba alkalmazhatóságának alapfeltétele, hogy az adatok normál eloszlásúak legyenek. Az Egyszempontos varianciaanalízis esetében is fontos, hogy az intervallumskálán vagy arányskálán mért adat normál eloszlású legyen. Amennyiben a vizsgált változó nem normál eloszlású, akkor a Kruskal-Wallis próbát kell elvégezni.