Megbízhatóságának ellenőrzésére becslések paraméterek lineáris regressziós modell két változó
Tegyük fel, hogy egy sor értéket (adathalmaz megfigyelések) két változó. .
Tény, hogy az azonos X, megfigyelhetjük különböző értékeit Y.
Példa 3.11. Ha X - munkavállaló életkora és Y - az ő fizetése, a munkások az azonos korú, hogy valóban eltérő bérek.
Példa 3.12. Ha X - jövedelmű családok, és Y - az élelmiszeripari költségeit a család, a család az azonos jövedelem reális lehet tölteni különböző mennyiségű energia.
A választás a kompozíció és a képlet változók nevezett kapcsolat modellt leírás (specifikáció a regressziós egyenlet).
Modell leírás tükrözi a mechanizmus megértése Y, attól függően, hogy a választott X és X magyarázó változó.
Például, Keynes javasolt a következő képlet függően a privát (egyéni) használja a „C” a rendelkezésre álló jövedelem „”:
,
- értékének autonóm fogyasztás;
- fogyasztási határhajlandóság.
Ebben az esetben, a kiválasztott lineáris képlet. Azonban, amíg a vizsgált mennyiségi értékek és b. Nem megbízhatóságának ellenőrzését becsléseket. Ez a képlet csak egy hipotézis. A minősítés értékei a kiválasztott paraméterek a statisztikai kapcsolat képletű változók parametrizálását úgynevezett regressziós egyenletek és a legkisebb négyzetek módszerével végezzük.
Hogyan lehet ellenőrizni a megbízhatóságát a becslések a paraméterek?
Az egyenlet a modell. tükrözve függőséget. formájában:
- változók és a hibákat az i-edik megfigyelés;
- nem véletlenszerű (determinisztikus) értéke;
- A valós értékek a modell paramétereit.
(3.6) - a specifikáció modell.
Mi az a hiba jellege?
Ez általában feltételezzük, hogy minden zavarásának a magyarázó változó, és nem foglalkozott kifejezetten a ökonometriai modell lett a magyarázó változó a nettó hatás. amelyek értéke nem ismert előre, és kapcsolódnak a balesetet. Leírni egy modell (jellemzően additív) egy véletlen komponens ( „Xie”), integrálja a hatása rögzítetlen egyértelműen perturbáció modellek.
A legjelentősebb oka a kötelező jelenlétét véletlenszerű minták az alábbiak:
1.Nevklyuchenie modellezni az összes magyarázó változó.
A modell egyszerűsítése a valóság, és valójában vannak más változók (elhagyható változók), amelyre Y függ.
Bér, például esetenként nemcsak a kor a munkavállaló, hanem a szinten alkalmazottak oktatása, szakmai tapasztalat, szex, a társasági forma (állami, magán), stb
étkezési költség - nem csak a család jövedelme, hanem a család, az általános árszínvonal, a lakóhely szerinti régió, stb
2.Trudnosti a mérési adatok (mérési adatok hibák vannak jelen).
Például az adatok a családi élelmiszer-kiadások alapján készült a nyilvántartások felmérés résztvevői, akik elvárják, hogy gondosan rögzíteni a napi kiadásokat. Természetesen a hibák előfordulhatnak.
3.Ogranichennost volumetrikus statisztika (térfogat korlátozások tömb megfigyelések).
Komponens a teljes megnyilvánulása Mindezen okok miatt.
Így feltételezhetjük, hogy - egy véletlen változó, eloszlásfüggvény, amely megfelel a funkció a véletlen változó eloszlását. Megjegyezzük, hogy a becslések a modell paramétereit. funkciójuk véletlen megfigyelések is véletlen értékeket.
A regressziós egyenlet a becsült minta előre jelzett érték pontban (predikciós értékek azon a ponton) van:
,
- becslés az igazi értékeket a paraméterek. Modell (3.6) (regressziós becslés paraméterek).
regressziós maradékok (eltérések az elméleti értékek) a következő egyenletből meghatározzuk:
.
Nem tévesztendő össze a ostatkiregressii oshibkamiregressii az egyenletben modellben. A különbség az, hogy a maradványokat. Ellentétben a hibákat. megfigyelhető.
Regressziós maradványok - figyelhető hiba értékeket az egyenletbe modellben.
Megbízhatóságának ellenőrzésére a modell paramétereinek magában:
- ellenőrizze a statisztikai jelentősége a modell paramétereinek;
- meghatározása konfidenciaintervallumai a modell paramétereit.
Student t-teszt, hogy teszteljék a jelentősége a becslések a regressziós paraméterek által meghatározott legkisebb négyzetek módszerével
Belátható, hogy a becslések a paraméterek által meghatározott legkisebb négyzetek módszerével, elosztott szerint a normál eloszlás törvény.
A variancia becsült regressziós paraméterek.
Ehhez ismernie kell a hiba variancia.
De mivel a gyakorlatban rendszerint ismeretlen és szórása a hiba becsült megfigyelésekből együtt becslése regressziós paraméterek. ahelyett, hogy a variancia becslés érhetünk variancia megbecsüli.
1. torzítatlan becslését hibavariancia:
,
- maradványai regresszió (az eltérés az elméleti értékek)
;
- i -taya pont a regressziós vonal, amely megfelel a megfigyelt érték;
n - a minta mérete (esetszám);
k - száma értékelt paraméterek (abban az esetben, gőz, mint a becsült regressziós két paraméter: és.).
2. A becslések a szórás becsült regressziós paraméterek:
;
- Pontszám becslés varianciája;
- Pontszám becslés varianciája;
- A középérték minta X ..
Becslések szórások (becsült standard hiba) regressziós paraméterek, amelyek eredményeként a regresszió statisztikai csomagok alapján számított e képletek:
.
Megjegyzés. Tegyük fel, hogy tanulmányozza a függőség Y X és a n számát adják, de lehet választani egy sor. Hogyan válasszuk ki, hogy a pontossága a lejtőn az értékelés volt a legnagyobb? Értékelés értékelés diszperziót adott (3,7), ami azt mutatja, hogy a nagyobb. Minél kisebb a szórás a becslés. Ezért kívánatos, hogy kiválassza oly módon, hogy azok terjedését az átlagérték körül nagy volt.