Skip navigation

Példa kereszttáblák használatára

Nyissuk meg a smoking.sav állományt az SPSS-ben (65. ábra). Az adatbázisban munkaköri megoszlásokat (staff) láthatunk és azt tudjuk meg, hogy ki milyen fokon dohányzik (smoke). A count egy előzetes számolást tartalmaz azonos értékek esetén (például 10 olyan titkárnő van, aki nem dohányzik) (66. ábra).

65. ábra

66. ábra

A Crosstabs (Kereszttáblák) az Analyze/Descriptive Statistics menüpont alatt érhető el.

Vigyünk egy vagy több változót a Row(s) (sorok) ill. Column(s) (oszlopok) dobozba. Jelen esetben a sor tartalmazza a Staff Group változót, míg az oszlop Smoking változót (67. ábra).  A sorváltozók kategóriái adják meg a tábla sorait, az oszlopváltozó kategóriái pedig a tábla oszlopait. Minden egyes sor- és oszlopváltozó párhoz generálódik egy kereszttábla. A Suppress Tables opció kiválasztása után csak a statisztikákat fogja megjeleníteni a program, a táblákat nem.

67. ábra

A Statistics gomb lenyomásával a sor- és oszlopváltozókra jellemző kétváltozós statisztikákat kérhetünk (68. ábra).

Válasszuk a Qhi-squere (khi-négyzet) vizsgálatot, majd nominális változók közül a Contingency cofficient, Phi and Cramér’s V, Lambda, Uncertaninty cofficient vizsgálatokat.

A khi-négyzet statisztikát arra használjuk, hogy azt a hipotézist, miszerint a sor és oszlopváltozók függetlenek, ellenőrizhessük. Nem jól használható, ha bármelyik cellában a peremeloszlások alapján várható érték (expected value) kisebb 1-nél, vagy a cellák több mint 20%-ban ez az érték kisebb, mint 5. A Pearson khi-négyzet a legelterjedtebb forma, a likelihood-ratio khi-négyzet a maximum likelihood elméleten alapszik.

A phi együttható a khi-négyzetnek a mintanagysággal korrigált értéke. A kontingencia együttható a mintanagyságot használja a számításnál.

A lambda százalékos formában azt mutatja meg, hogy függő változót a független változó milyen mértékben képes előre jelezni. A Cramer V a legmegbízhatóbb mutató, aminek a számításához szükség van a mintanagyságra és a kevesebb lehetőséget felkínáló ismert kategóriák számára.

68. ábra

A Cells gomb lenyomása után a cellák tartalmát határozhatjuk meg. A Format gomb lenyomása után megjelenő párbeszédablakban a táblázat formátumát adhatjuk meg. Pipáljuk az Observed, Expected négyzeteket, majd a Row, Column, Total mezőket, hogy megjeleníthessük a sorokat, oszlopokat és ezek összesítését (69. ábra).

69. ábra

A kereszttábla megmutatja, hogy a minta összesen 486 főt tartalmaz, és nincs hiányzó érték (24. táblázat).

Case Processing Summary

 

Cases

 

Valid

Missing

Total

 

N

Percent

N

Percent

N

Percent

Staff Group * Smoking

486

100,0%

0

,0%

486

100,0%

24. táblázat

Az alábbi táblázat (25. táblázat) a Staff Group és a Smoking változók részletes megoszlását mutatja.

25. táblázat

A Pearson-féle Khi-négyzet próba alapján megállapítható, hogy a két változó szignifikáns (26. táblázat). A Khi-négyzet értéke (χ2) 117,025, míg a szabadságfok (df) 25.

26. táblázat

Az alábbi táblázatban (27. táblázat) látható, hogy a Lambda, a Goodman and Kruskal tau, Uncertainty Coffiecients szignifikancia szintje kisebb, mint 0,05. A Value értékeik a becslés hibavalószínűségének csökkenését jelzik, ha felszorozzuk őket százzal. A két változó (Staff Group és Smoking) Value értékei nem egyenlők, tehát a két változó nem azonos mértékben van hatással a másikra.

27. táblázat

A Phi, Cramer V, és a kontingencia együttható – azaz a szimmetrikus mutatók –mind szignifikánsak (Sig.<0,05). A kapcsolat erőssége a Phi alapján 0,491,  Cramer V szerint 0,219, míg a kontingencia együttható szerint 0,441 (28. táblázat).

28. táblázat

A kereszttábla eredményeit a Bar Chart jól ábrázolja (70. ábra).

70. ábra