Skip navigation

Lineáris regresszió

Az egyváltozós lineáris regresszió két – egy x független és egy y függő – folytonos változó összefüggésének jellemzése regressziós egyenessel.

A determinációs együttható (a korrelációs együttható négyzete), r2 azt mutatja meg, hogy az x-től való függés mennyiben magyarázza meg az y variabilitását.

Ha r2

  • közelít a 0-hoz, akkor az x nem magyarázza az y-t, ha
  • közelít 1-hez, akkor nagyon szoros az összefüggés.

Ha a két változó között van szignifikáns összefüggés, de az r2 kicsi, az azt jelenti, hogy más tényezők is szerepet játszanak az y meghatározásában.

A legegyszerűbb regressziós kapcsolat két változó között a grafikusan egy egyenes vonallal jellemezhető lineáris függvénykapcsolat. Első kérdésünk az, hogy a két változó között van-e egy egyenessel leírható összefüggés? Ha igen, akkor megkeressük a legjobb ilyen egyenest. Az ennél bonyolultabb, nemlineáris függvénykapcsolatok, vagy a kettőnél több változó függvénykapcsolatának vizsgálata a statisztika haladó témái közé tartoznak.

A regressziós kapcsolatban mind a két változó függhet a véletlentől is, de az is előfordulhat, hogy csak az egyik esetében lényeges a véletlentől függő komponens. A továbbiakban mi a két esetet nem különböztetjük meg.

A regresszióban a két változó szerepe nem felcserélhető. A lineáris regresszió y=ax+b képletében az egyik változó az x, a másik az y helyére kerül, és az x változó segítségével jósoljuk meg az y értékét. Itt elsősorban logikailag fontos, hogy a két változó szerepe nem felcserélhető (emlékezzünk arra, hogy a korreláció esetében a két változó közül egyik sem volt kitüntetett, azaz felcserélhetők voltak).

Gyakran az x változó esetében nem tételezzük fel, hogy a véletlen változás az x-t is közvetlenül érinti, hanem az x-t általunk választható rögzített és ismert értékként kezeljük, és a véletlentől való függés az y értékében jelenik meg. Az y tehát függ az x-től, de ezen kívül függhet a véletlen okozta ingadozástól is.

Hogyan határozzuk meg, hogy a pontok közé húzható rengeteg egyenes közül melyik az, amelyik az adatok összefüggését legjobban jellemzi? A grafikus ábrázolás pontdiagramja sejteti a lineáris összefüggést. Vonalzóval, „szemre” azonban általában lehetetlen megtalálni az egyenes és a pontok legjobb illeszkedését.