အဘယ်အရာကိုရိုးရိုး Linear Regression သည်နှင့်မည်သို့အလုပ်လုပ် Learn

ဘက်စုံမှာ Data များကိုလေ့လာသုံးသပ်ခြင်းမှတစ်ဦးကအခြေခံပညာစာရင်းအင်းများချဉ်းကပ်

Courtesy ဖြစ်သူ Colin Broug, ဓာတ်ပုံသတင်းထောက်တစ်ဦး။ ©ဇွန်လ 10, 2010 Stock.xchng

linear ဆုတ်ယုတ်မော်ဒယ်များနှစ်ခုအကြားဆက်ဆံရေးကိုပြသသို့မဟုတ်ကြိုတင်ခန့်မှန်းရန်အသုံးပြုကြသည် variable တွေကိုသို့မဟုတ်အချက်များ ။ ခန့်မှန်းထားကြောင်းကြောင်းအဆိုပါအချက် (ညီမျှခြင်းဘို့ဖြေရှင်းနိုင်ပါတယ်သောအချက်) ကဟုခေါ်သည် မှီခို variable ကို။ အဆိုပါမှီခို variable ကို၏တန်ဖိုးကိုကြိုတင်ခန့်မှန်းရန်အသုံးပြုကြသည်သောအချက်များလွတ်လပ်သော variable တွေကိုဟုခေါ်ကြသည်။

ကောင်းသောဒေတာအမြဲတမ်းပြည့်စုံပုံပြင်ကိုပြောပြမထားဘူး။ ကဆက်စပ်မှု variable တွေကိုအကြားရှိကွောငျးတည်စေအဖြစ် Regression ခွဲခြမ်းစိတ်ဖြာလေ့သုတေသနအတွက်အသုံးပြုသည်။

သို့သော် ဆက်စပ်မှု causation ကဲ့သို့တူညီသောမဟုတ်ပါဘူး ။ ကောင်းစွာဒေတာအချက်များကိုက်ညီမယ့်ရိုးရှင်းတဲ့ linear ဆုတ်ယုတ်အတွက်တောင်မှတစ်လိုင်းအကြောင်းမရှိ-and effect ကိုကြားဆက်ဆံရေးနှင့် ပတ်သက်. ပြတ်သားတစ်ခုခုပြောမည်မဟုတ်ပါ။

ရိုးရှင်း linear ဆုတ်ယုတ်ခုနှစ်တွင်တစ်ဦးချင်းစီ လေ့လာရေး တန်ဖိုးနှစ်ခုပါဝင်သည်။ တစ်ခုမှာတန်ဖိုးမှီခို variable ကိုအဘို့ဖြစ်၏နှင့်တစ်တန်ဖိုးလွတ်လပ်သော variable ကိုအဘို့ဖြစ်၏။

ရိုးရှင်းသော Linear Regression မော်ဒယ်

က y = 0 င် + β 1 + Ε: အဆိုပါရိုးရှင်းသော linear ဆုတ်ယုတ်မော်ဒယ်ဤကဲ့သို့သောကိုယ်စားပြုနေသည်

သင်္ချာဆိုင်ရာစည်းဝေးကြီးတစ်ခုကိုအသုံးပြုပုံရိုးရှင်းတဲ့ linear ဆုတ်ယုတ်ခွဲခြမ်းစိတ်ဖြာခြင်းတွင်ပါဝင်ပတ်သက်သည်ဟုနှစ်ခုအချက်များက x နှင့် y ကသတ်မှတ်ထားသောနေကြသည်။

y ကက x နှင့်ဆက်စပ်သောမည်သို့ဖော်ပြထားတယ်သောညီမျှခြင်းဟာဆုတ်ယုတ်မော်ဒယ်အဖြစ်လူသိများသည်။ အဆိုပါ linear ဆုတ်ယုတ်မော်ဒယ်လည်းΕ, ဒါမှမဟုတ်ဂရိအက္ခရာ Epsilon ကကိုယ်စားပြုကြောင်းမှားယွင်းမှုတစ်ခုသက်တမ်းပါရှိသည်။ အဆိုပါအမှားအသုံးအနှုန်းကရှင်းပြခဲ့မရနိုင်ကြောင်း, y အတွက်အမျိုးမျိုးပြောင်းလဲဘို့အကောင့်အသုံးပြုသည် linear ကြားဆက်ဆံရေး က x နှင့် y ကအကြား။

အဲဒီမှာလည်းလေ့လာခဲ့ခံနေရလူဦးရေကိုကိုယ်စားပြုကြောင်း parameters တွေကို။ ဤရွေ့ကား မော်ဒယ်၏ parameters တွေကို 0+ β 1 x ကို) ကကိုယ်စားပြုရှိကြ၏။

ရိုးရှင်းသော Linear Regression မော်ဒယ်

Ε (y က) = 0 င် + β 1 x ကို): အဆိုပါရိုးရှင်းသော linear ဆုတ်ယုတ်ညီမျှခြင်းဤကဲ့သို့သောကိုယ်စားပြုနေသည်။

အဆိုပါရိုးရှင်းသော linear ဆုတ်ယုတ်ညီမျှခြင်းတစ်ဖြောင့်လိုင်းအဖြစ် graphed ဖြစ်ပါတယ်။

0 ဆုတ်ယုတ်လိုင်းများ၏ y ကကြားဖြတ်ဖြစ်ပါတယ်။

1 βလျှောစောက်ဖြစ်ပါတယ်။

Ε (y) သည်ယုတ်သို့မဟုတ် x ကိုတစ်ဦးပေးထားတဲ့တန်ဖိုးက y ၏မျှော်မှန်းထားသည်တန်ဖိုးကိုဖြစ်ပါတယ်။

တစ်ဦးကဆုတ်ယုတ်လိုင်းတစ်ဦးအပြုသဘော linear ဆက်ဆံရေးဟာတစ်အနုတ်လက္ခဏာ linear ဆက်ဆံရေးမျိုး, ဒါမှမဟုတ်အဘယ်သူမျှမကြားဆက်ဆံရေးကိုပြသနိုင်ပါတယ်။ ရိုးရှင်းတဲ့ linear ဆုတ်ယုတ်အတွက် graphed လိုင်း (sloped မဟုတ်) အပြားလျှင်, နှစ်ခု variable တွေကိုအကြားအဘယ်သူမျှမကြားဆက်ဆံရေးလည်းမရှိ။ အဆိုပါဆုတ်ယုတ်လိုင်း, အဂရပ်၏ y ကကြားဖြတ် (ဝင်ရိုး) မှာလိုင်း၏အောက်ပိုင်းအဆုံးများနှင့်လိုင်း၏အထက်ဆုံးဂရပ်လယ်သို့အထက်သို့သက်တမ်းတိုးရေးနှင့်အတူအထက်သို့ slopes ကွာ x ကိုကြားဖြတ် (ဝင်ရိုး) ကနေအပြုသဘော linear ကြားဆက်ဆံရေးတည်ရှိခဲ့လျှင် ။ အဆိုပါဆုတ်ယုတ်လိုင်း y ကိုကြားဖြတ်မှာလိုင်းများ၏အထက်အဆုံးနှင့်အတူအောက်ဖက် slopes လျှင် x ကိုကြားဖြတ်ဆီသို့ဂရပ်၏ (ဝင်ရိုး) နှင့်လိုင်း၏အောက်ပိုင်းဆုံးဂရပ်လယ်သို့အောက်ဖက်သက်တမ်းတိုးရေး, (ဝင်ရိုး) တစ်အနုတ်လက္ခဏာ linear ကြားဆက်ဆံရေးတည်ရှိ။

ခန့်မှန်းခြေ Linear Regression ညီမျှခြင်း

အဆိုပါ အကယ်. လူဦးရေရဲ့ parameters တွေကို လူသိများခဲ့ကြသည် (အောက်တွင်ပြသ) ကရိုးရှင်းပြီး linear ဆုတ်ယုတ်ညီမျှခြင်းက x တစ်ဦးဟုလူသိများတန်ဖိုးကိုအဘို့အက y ၏ယုတ်တန်ဖိုးကိုတွက်ချက်ရန်အသုံးပြုနိုင်ပါတယ်။

Ε (y က) = 0 င် + β 1 x ကို)

သူတို့ အသုံးပြု. ခန့်မှန်းရမည်ဖြစ်သည်ဒါသို့သော်အလေ့အကျင့်ထဲမှာ, parameter သည်တန်ဖိုးများကိုလူသိများကြသည်မဟုတ် နမူနာအနေဖြင့်ဒေတာများ လူဦးရေရဲ့။ အဆိုပါ လူဦးရေ parameters တွေကိုနမူနာစာရင်းဇယားကို အသုံးပြု. ခန့်မှန်းနေကြသည် ။ အဆိုပါ နမူနာစာရင်းဇယား နမူနာစာရင်းဇယားလူဦးရေ parameters တွေကိုများအတွက်အစားထိုးသောအခါခ 0 င် + 1. ကကိုယ်စားပြုနေပါတယ်ခန့်မှန်းဆုတ်ယုတ်ညီမျှခြင်းဖွဲ့စည်းသည်။

အဆိုပါခန့်မှန်းဆုတ်ယုတ်ညီမျှခြင်းကိုအောက်တွင်ပြသထားပါသည်။

(Y) = 0 င် + β 1 x ကို

(Y) က y ဦးထုပ်အသံထွက်နေသည်။

ခန့်မှန်းရိုးရှင်းသောဆုတ်ယုတ်ညီမျှခြင်း၏ဂရပ်ခန့်မှန်းဆုတ်ယုတ်လိုင်းဟုခေါ်သည်။

အဆိုပါခ 0 y ကိုကြားဖြတ်ဖြစ်ပါတယ်။

အဆိုပါခ 1 ဆင်ခြေလျှောဖြစ်ပါတယ်။

အဆိုပါ Y) က x ၏ပေးထားသောတန်ဖိုးက y ၏ခန့်မှန်းတန်ဖိုးကိုဖြစ်ပါတယ်။

အရေးကြီးမှတ်ချက်: Regression ခွဲခြမ်းစိတ်ဖြာအနက်ကိုဘော်ပြရန်အသုံးပြုသည်မဟုတ် အကြောင်းမရှိ-and effect ကိုဆက်ဆံရေး variable တွေကိုအကြား။ Regression ခွဲခြမ်းစိတ်ဖြာသို့သော်နိုင်ပါတယ် variable တွေကို related ဘယ်လိုညွှန်ပြ သို့မဟုတ် အတိုင်းအတာ variable တွေကိုဆက်စပ်နေကြသည်အရာကို တစ်ဦးချင်းစီကတခြားနှင့်အတူ။

ဒီတော့လုပ်နေမှာတော့ဆုတ်ယုတ်ခွဲခြမ်းစိတ်ဖြာတဲ့တတ်ကျွမ်းနားလည်တဲ့သုတေသီခိုင်လုံကြောင်းအဓိကဆက်ဆံရေးလုပ်လေ့ အနီးကပ်ကြည့်တာ

bivariate ဆုတ်ယုတ်, ဆုတ်ယုတ်ခွဲခြမ်းစိတ်ဖြာ: ဒါ့အပြင်အဖြစ်လူသိများ

ဥပမာ: အဆိုပါ Method ကိုအနည်းဆုံးစတုရန်း တစ်စာရင်းအင်းလုပ်ထုံးလုပ်နည်းဖြစ်ပါတယ် နမူနာ data တွေကိုသုံးပြီး ခန့်မှန်းဆုတ်ယုတ်ညီမျှခြင်း၏တန်ဖိုးကိုရှာ။ အဆိုပါအနည်းဆုံးစတုရန်း Method ကိုယခုနှစ် 1777 ခုနှစ်မွေးဖွားခဲ့ပြီး 1855 ခုနှစ်မှာအတွက်နည်းလမ်းနေဆဲကျယ်ပြန့်အသုံးပြုသည်အဆိုပါအနည်းဆုံးစတုရန်းကွယ်လွန်သွားခဲ့တဲ့သူ Carl Friedrich Gauss ကအဆိုပြုထားခဲ့ပါတယ်။

သတင်းရင်းမြစ်:

အန်ဒါဆင်, DR, Sweeney, DJ သမားနှင့်ဝီလျံ, TA (2003) ။ စီးပွားရေးနှင့်စီးပွားရေးတက္ကသိုလ်များအတွက်စာရင်းအင်း Essentials (3rd ed ။ ) Mason ဆို, အိုဟိုင်းယိုးပြည်နယ်: အနောက်တောင်ပိုင်း, Thompson ကသင်ယူ။

______ ။ (2010) ။ ကရှင်းပြခဲ့သည်: Regression အားသုံးသပ်ခြင်း။ MIT ကသတင်း။

McIntyre, အယ်လ် (1994) ။ အကွိမျမြားစှာ Regression မှတစ်ဦးနိဒါန်းအဘို့အဆေးလိပ်ဒေတာများကိုအသုံးပြုခြင်း။ စာရင်းအင်းများပညာရေးဂျာနယ်, 2 (1) ။

Mendenhall, ဒဗလျူနှင့် Sincich, တီ (1992) ။ Dellen ထုတ်ဝေရေးကုမ္ပဏီ: အင်ဂျင်နီယာနှင့်သိပ္ပံ (။ 3rd ed), နယူးယောက်, NY များအတွက်စာရင်းအင်းများ

Panchenko, Applications ကိုများအတွက်ဃ 18,443 စာရင်းအင်း, 2006 Fall, ပုဒ်မ 14, ရိုးရှင်းသော Linear Regression ။ (နည်းပညာတက္ကသိုလ်မက်ဆာချူးဆက်: MIT က OpenCourseWare)