လူမှုမီဒီယာနမူနာအတွက်အရည်အသွေးမြှင့်တင်ပေးရန်ဘယ်လို
ဤရွေ့ကားကွဲပြားခြားနားမှုအသက်အရွယ်, ကျားမ, အိမ်ထောင်ရေးအခြေအနေ, လူမှုစီးပွားရေးအဆင့်အတန်း, ကျန်းမာရေးအဆင့်အတန်းနှင့်ကလေးအရေအတွက်တွင်တွေ့မြင်ခဲ့ရသည်။
တုန့်ပြန်နှုန်း
အတိုင်းအတာအရာမှတစ်ဦးလေ့လာမှုများ၏အနီးကပ်မှာ data တွေကိုနမူနာအပေါင်းတို့၌အဖွဲ့ဝင်များပါဝင်သည်အဖြစ်ရည်ညွှန်း တုံ့ပြန်မှုနှုန်းသည် ။ ဒီ concept ကိုအင်တာဗျူးတစ်ခုစနစ်တကျစစ်တမ်းသို့မဟုတ်အစုံအတွက်ရှင်းပါတယ်နေစဉ်, ကလူမှုမီဒီယာသုတေသနအတွက်ပိုပြီးစိတ်မကောင်းစရာဝေဝါးဖြစ်ပါတယ်။ သို့ရာတွင်ထိုသို့အခြားအ၌တည်ရှိ၏ထက်လူမှုရေးမီဒီယာသုတေသနအတွက်မနည်းအရေးကြီးပါတယ် အရည်အသွေးသုတေသနအမျိုးအစားများ ။ အဆိုပါတုံ့ပြန်မှုနှုန်းသည်ပြီးပြည့်စုံသောစစ်တမ်းများ-သို့မဟုတ်တွေ့ဆုံမေးမြန်း-ခွဲခြားရန်အတက်လုပ်သူကလူများ၏စုစုပေါင်းအရေအတွက်အားဖြင့်သဘောတူသောသူသင်တန်းသားများကို၏အရေအတွက်အားဖြင့်တွက်ချက် မူရင်းနမူနာအားထုတ်မှု ။ စုစုပေါင်းအရေအတွက်ကအောင်မြင်စွာဆက်သွယ်ဒါမှမဟုတ်သုတေသနတွင်ပါဝင်ရန်ငြင်းပယ်သောမခံခဲ့ရသူတွေကိုပါဝင်ရမည်။
အစဉ်အဆက်ပြဿနာ
မည်သို့ပင်ဒေတာစုဆောင်းနေသည်မည်သို့, တုံ့ပြန်မှုမြင့်မားမှုနှုန်း၏အရေးပါမှုကို လုံလောက်အောင်အလေးပေးမရနိုင်ပါ။
ဒါဟာနမူနာများ၏တုန့်ပြန်မှုနှုန်းနိမ့်သည်လာသောအခါလက်တွေ့ကျကျပိုကြီးတဲ့လူဦးရေကို generate မှမဖြစ်နိုင်ပါ။ နမူနာဘက်လိုက်မှုတုံ့ပြန်မှုမှုနှုန်းကျဆင်းမှုအဖြစ်တိုးပွားစေပါသည်။ ပြန်လာနှုန်းထားများနမူနာ 20 သို့မဟုတ် 30 ရာခိုင်နှုန်းကျတဲ့အခါမှာမီဒီယာအခြေစိုက်စစ်တမ်းများအတွက်သော သင်တန်းသားများကိုအုပ်စု တစ်ခုလုံးနမူနာလူဦးရေအနည်းငယ်သာအကြံအစည်ဖြင့်သမုတ်သော။
လူတွေ၏တူညီသောသဘောထားမေးလ်-in ကိုစစ်တမ်းပြန်လာတစ်ခုသို့မဟုတ်တယ်လီဖုန်းစစ်တမ်းတွင်ပါဝင်ရန်သဘောတူရန်လူမှုမီဒီယာကွန်ရက်မှာထိတွေ့ဆက်ဆံသောသူတို့နှငျ့အတူတွေ့ရှိနိုင်ပါသည်: အကြောင်း, ဘာသာရပ်ကိစ္စ (သို့မဟုတ်ကုန်ပစ္စည်းသို့မဟုတ်ဝန်ဆောင်မှုအတွက်အထူးစိတျဝငျစားဖြစ်ပါသည်, ကိစ္စတွင် may အဖြစ် ) ဖြစ်လိမ့်မည်။
နမူနာအရွယ်အစား
သေးငယ်နမူနာပိုကြီးတဲ့နမူနာထက်ပိုကြီးတဲ့နမူနာအမှားရှိသည်။ နမူနာ data တွေကိုပိုပြီးကြီးမားတဲ့လူဦးရေရဲ့ attribute တွေအနေနဲ့ခန့်မှန်းချက်ကိုထောက်ပံ့ပေးကြောင်းစဉ်းစားပါ။ တစ်ဦးအနေဖြင့်ရေးဆွဲတစ်ခုချင်းစီကိုနမူနာ နမူနာဘောင် ကြောင်းပိုကြီးတဲ့လူဦးရေရဲ့သီးခြားခန့်မှန်းသည်။ သီအိုရီမေးလျှင်, အသီးအသီးမေးခှနျးအတှကျအဘို့ကိုယူတစ်ဦးချင်းစီနမူနာအတွက်တုံ့ပြန်မှုများ၏သီးခြားပုံစံရှိဖြစ်နိုင်ပါတယ်။ အချိန်ကျော်, အနမူနာဘောင်ကနေရေးဆွဲအလုံအလောက်နမူနာအတူစစ်မှန်တဲ့ပုံစံဟာပိုကြီးတဲ့လူဦးရေရဲ့အမှန်တကယ် (မှန်) ပုံစံန်းကျင်ဆုံလိမ့်မယ်။
မှားယွင်းနေသည်၏ margin
နမူနာအမှားဟာပိုကြီးတဲ့လူဦးရေကနေယူနမူနာမဆိုတစ်ဦးထံမှခန့်မှန်းချက်များတိကျစွာဖော်ပြသည်။ နမူနာအမှားဖြစ်သောယုံကြည်မှု, တစ်ဦးအဆင့်ကိုသူနဲ့ဆက်စပ်ကြောင်းအမှားတစ်ခုအနားသတ်၏စည်းကမ်းချက်များ၌ထုတ်ဖော်ပြောဆိုသည်ကို တစ်ဦးစာရင်းအင်းအတိုင်းအတာ ။ တစ်ဦးသမ္မတအိမ်တော် preference ကိုစစ်တမ်းများတွင်ဥပမာ, အစီရင်ခံစာလက်ရှိသမ္မတမဲဆန္ဒရှင်တွေရဲ့ 64% ကမျက်နှာသာပေးကြောင်းပြသလိမ့်မည်။ အမှား၏အနားသတ်တစ်ဦး 95% ယုံကြည်မှုအဆင့်ကိုအတူပေါင်း-or-အနုတ် 3 မှတ်ဖြစ်လိမ့်မယ်။
စစ်တမ်းကောက်ယူမဲဆန္ဒရှင် 100 ကွဲပြားခြားနားသောနမူနာနှင့်အတူနောက်တဖန်ကျော်ကောက်ယူခဲ့ကြပါလျှင်တစ်နည်း, 100 မဲဆန္ဒရှင်တွေထဲက 95 မဲဆန္ဒရှင်လက်ရှိသမ္မတမဲဆန္ဒရှင်တွေရဲ့ 67% မှ 61% ကမျက်နှာသာပေးကြောင်းညွှန်ပြလိမ့်မယ်။ အဲဒီမဲဆန္ဒရှင်တွေရဲ့ 61% + 3% သို့မဟုတ် -3% ဖြစ်ပါသည်။
နမူနာအရွယ်အစားအကြောင်းဆုံးဖြတ်ချက်များ
နမူနာအရွယ်အစားတက်အဖြစ်နမူနာနဲ့ဆက်စပ်အမှား၏အနားသတ်ပေမယ့်တစ်ခုသာသေချာသောအချက်မှဆင်းသွားသည်။ ဘယ်အချိန်မှာ နမူနာအရွယ်အစား 1000 2000 မှဖြေဆိုသူရောက်ရှိပိုကြီးတဲ့နမူနာ (မတစ်ဦး၏ထည့်သွင်းစဉ်းစားစေသကဲ့သို့, အမှား၏အနားသတ်လုံလုံလောက်လောက်သေးငယ်သည် ကုန်ကျစရိတ်-ထိရောက်သောရွေးချယ်မှု ) ။ လူမျိုးကွဲပိုကြီးတဲ့လူဦးရေရဲ့အစိတ်အပိုင်းတစ်ခုဖြစ်သည့်အခါအမှား၏ margin ဆိုတာလူမျိုးကွဲလူအရေအတွက်ကိုပေါ် မူတည်. တစ်ဦးချင်းစီအဖွဲ့ခွဲများအတွက်ကွဲပြားပါလိမ့်မယ်ဘာဖြစ်လို့လဲဆိုတော့, ပိုကြီးတဲ့နမူနာအရွယ်အစားတရားမျှတဖြစ်နိုင်သည်။ ဥပမာအားဖြင့်, နေဖို့-မှာ-home-, 1000 လူမှုရေးမီဒီယာကွန်ယက်၏အဖွဲ့ဝင်များနှင့်တစ်ဦး 95% ယုံကြည်မှုကြားကာလသောလူမှုမီဒီယာ-လို့ပြောကွန်ယက်၏တစ်ဦးအဖွဲ့ခွဲ၏ခွဲခြမ်းစိတ်ဖြာနှင့်အတူတစ်နေရာရာမှာ 1 မှ 3 ရာခိုင်နှုန်းအချက်များအကြားညီမျှကြောင်းအမှားတစ်ခုအနားသတ်ပေးထား အကြောင်းကိုအရအေတှကျ moms အကြောင်းကို 4 မှ 10 မှတ်၏အမှားတစ်ခုမြင့်မားတဲ့အနားသတ်ရှိ 100 ပေမည်။
Gauging နမူနာလုံလောက်သော
နမူနာပုံမှန်အားဖြင့်မဟုတ်ဘဲအဆုံးစွန်အရွယ်အစားသို့မဟုတ်ဖွဲ့စည်းမှုထက်အသုံးပြုသောရွေးချယ်ရေးလုပျထုံးလုပျနညျးအရသိရသည်အကဲဖြတ်နေကြသည်။ ဒါကြောင့်အခြေအနေများ-တိကျစွာဖို့မဖြစ်နိုင်ဘူးဘာလို့လဲဆိုတော့-in ကိုအများဆုံးဒါဟာအခြေခံအကျဆုံးဖြစ်ပါတယ် နမူနာဘယ်လောက်ကိုယ်စားလှယ်တိုင်းတာ ပိုပြီးကြီးမားတဲ့လူဦးရေရဲ့။ သူတို့အဆင်ပြေပြေနဲ့အခြေခံကျကျယုံကြည်စိတ်ချရသောခန့်မှန်းချက်ခွင့်ဘာဖြစ်လို့လဲဆိုတော့စာရင်းအင်းဆိုင်ရာလုပ်ထုံးလုပ်နည်းများအသုံးပြုကြသည်။ အစအဦးမှာအမှားတစ်ခုကျိုးကြောင်းဆီလျော်ယုံကြည်မှုကြားကာလနှင့်အနားသတ်ထူထောင်ကဲ့သို့သော variable တွေကိုအာရုံစိုက်ဖို့သုတေသီများဖွ တုံ့ပြန်မှုမှုနှုန်း နှင့်လုံလောက်သောနမူနာဘောင်။