Дознај што е едноставна линеарна регресија и како таа работи

Основен пристап на статистика за анализирање на квантитативни податоци

Благодарение на Колин Броуг, фотограф. © Јуни 10, 2010 Stock.xchng

Линеарната регресија модели се користат за прикажување или предвидување на односот помеѓу две променливи или фактори . Факторот што се предвидува (фактор за кој равенката решава ) се нарекува зависна променлива. Факторите кои се користат за да се предвиди вредноста на зависната променлива се нарекуваат независни променливи.

Добрите податоци не ја кажуваат целата приказна. Регресивната анализа најчесто се користи во истражувањето, бидејќи утврдува дека постои корелација помеѓу променливите.

Но, корелацијата не е иста како причината . Дури и линијата во едноставна линеарна регресија која добро одговара на податоците, не може да каже нешто дефинитивно во врска со причинско-последичната врска.

Во едноставна линеарна регресија, секоја опсервација се состои од две вредности. Една вредност е за зависната променлива и една вредност е за независна променлива.

Едноставен линеарен модел на регресија

Едноставниот линеарен модел на регресија е претставен вака: y = ( β 0 + β 1 + Ε

Со математичка конвенција, двата фактори кои се вклучени во едноставна линеарна регресиона анализа се означени со x и y .

Равенката што опишува како y е поврзана со x е позната како регресивен модел . Линеарниот модел на регресија, исто така, содржи термин за грешка кој е претставен со Е , или грчкото писмо епсилон. Терминот за грешка се користи за да се објасни варијабилноста на y што не може да се објасни со линеарен однос помеѓу x и y .

Постојат и параметри кои го претставуваат популацијата која се изучува. Овие параметри на моделот кои се претставени со ( β 0 + β 1 x ).

Едноставен линеарен модел на регресија

Едноставната линеарна регресиона равенка е претставена вака: Е ( y ) = ( β 0 + β 1 x ).

Едноставната линеарна регресивна равенка е графицирана како права линија.

( β 0 е y пресекот на регресивната линија.

β 1 е наклонот.

Е ( y ) е средната или очекуваната вредност на y за дадена вредност на x .

Регресивната линија може да покаже позитивна линеарна врска, негативна линеарна врска или нема врска. Ако линијата со изработена линија со едноставна линеарна регресија е рамна (не е наклонета), не постои врска помеѓу двете варијабли. Ако линијата на регресија се спушта нагоре со долниот крај на линијата на пресекот y (оска) на графикот, а горниот крај на линијата што се протега нагоре во полето на графонот, далеку од х пресекот (оска), постои позитивна линеарна врска . Ако линијата на регресија се спушта надолу со горниот крај од линијата на пресекот y (оска) на графикот, а долниот крај на линијата што се протега надолу во полето на графикот, кон x пресретнувањето (оска) постои негативна линеарна врска.

Проценета линеарна регресиона равенка

Ако се познати параметрите на популацијата , едноставната линеарна равенска равенка (прикажана подолу) може да се користи за да се пресмета средната вредност на y за позната вредност на x .

Е ( y ) = ( β 0 + β 1 x ).

Меѓутоа, во пракса, вредностите на параметрите не се познати, па затоа мора да се проценат со користење на податоци од примерок од населението. Параметрите за население се проценуваат со користење на статистички примероци . Примерочната статистика е претставена со b 0 + b 1. Кога статистичките податоци за примерокот се заменуваат со параметрите на популацијата, се формира проценетата регресиона равенка.

Проценетата регресиона равенка е прикажана подолу.

( ŷ ) = ( β 0 + β 1 x

( ŷ ) се изговара y hat .

Графикот на проценетата едноставна регресиона равенка се нарекува проценета регресиона линија.

Б 0 е пресекот y.

Б 1 е наклон.

Ŷ ) е проценетата вредност на y за дадена вредност на x .

Важна забелешка: регресивната анализа не се користи за толкување на причинско-последичните односи помеѓу променливите. Регресивната анализа, сепак, може да покаже како се поврзани со варијаблите или до кој степен променливите се поврзани едни со други.

Притоа, регресивната анализа има тенденција да прави значајни врски што го гарантираат познавателен истражувач кој одблизу ќе го разгледа .

Исто така познат како: bivariate регресија, регресија анализа

Примери: Методот со најмалку квадрати е статистичка постапка за користење на податоците од мострата за да се најде вредноста на проценетата регресиона равенка. Методот со најниски квадрати беше предложен од Карл Фридрих Гаус, кој е роден во 1777 година и починал во 1855 година. Методот со најмалку квадрати сè уште е широко користен.

Извори:

Андерсон, ДР, Свини, Д.Џ., и Вилијамс, Т.А. (2003). Основи на статистика за бизнис и економија (3-ти ед.) Мејсон, Охајо: Југозападен, Томпсон учење.

______. (2010). Објаснување: Регресивна анализа. МИТ Вести.

McIntyre, L. (1994). Користење на цигара податоци за вовед во повеќе регресија. Весник за статистика образование, 2 (1).

Mendenhall, W. и Sincich, T. (1992). Статистика за инженерство и науки (3-ти издание), Њујорк, Њујорк: Делен издавачката копродукција

Панченко, Д. 18.443 Статистика за Апликации, Падот 2006, Дел 14, Едноставна Линеарна Регресија. (Масачусетс институт за технологија: МИТ OpenCourseWare)