Skip to main content

1.5 Study Design အကြောင်း

Photo by Isaac Smith on Unsplash

Study Design နဲ့ပက်သက်ပြီးပြောမယ်ဆိုရင် အများကြီးရှိပါတယ်။ ရရှိတဲ့ဒေတာတွေကို ကနဦးအကြမ်းဖျင်း စိစစ်လေ့လာတဲ့ Exploratory Analysis of Data (EAD) ကနေ သုတေသနမေးခွန်းအတွက် သေသေချာချာ စီစဉ်ပြီး ကောက်ယူထားတဲ့ဒေတာတွေကို Analysis ပြုလုပ်တာတွေအထိ ပါဝင်ပါတယ်။

Study Design က ဒေတာအခြေပြုသုတေသန(Data-Driven Research)အတွက် ကြိုတင်ပြင်ဆင်သမျှ အရာအားလုံး အကြုံးဝင်ပါတယ်။ Study Design နဲ့ပက်သက်ပြီး အဆင့်မြင့်နည်းစနစ်(Techniques)တွေနဲ့ စိတ်ကူးအကြံဉာဏ်(Ideas)တွေ အများကြီး ရှိပါတယ်။ ကျွန်တော်တို့က ဒီဟာတွေကို အသုံးပြုနေတဲ့ နယ်ပယ်(Fields)တွေနဲ့ တိုက်ရိုက်မသက်ဆိုင်ပေမဲ့ ဒီဟာတွေကိုအသုံးပြုခဲ့တဲ့ အတွေ့အကြုံတွေကနေ Study Design နဲ့ပက်သက်တာ တော်တော်များများကို သင်ယူနိုင်ပါတယ်။
  1. Clinical Trials (ဆေးသုတေသန) - ဆေးဝါးနဲ့ ကုထုံးသုတေသနစမ်းသပ်မှု
  2. ကုန်ထုတ်နယ်ပယ်မှာဆိုရင် ကုန်ပစ္စည်းရဲ့ စိတ်ချရမှု (Reliability) နဲ့ အရည်အသွေးခိုင်မာမှု(Quality Assurances) တွေနဲ့ ပက်သက်တဲ့ လေ့လာမှုတွေ
  3. လူသားတွေရဲ့ ကျန်းမာရေးနဲ့ပက်သက်တဲ့ သုတေသနလေ့လာမှုတွေ
  4. ပြည်သူလူထုရဲ့ ဆန္ဒကောက်ယူမှုစစ်တမ်းတွေ
  5. အုပ်ချုပ်မှုဆိုင်ရာဒေတာတွေအပေါ်မှာ လေ့လာမှုတွေ
  6. ဈေးကွက်သုတေသနလေ့လာမှုနဲ့
  7. စိုက်ပျိုးရေးသုတေသနတွေ
ဒါတွေဟာ မတူညီတဲ့နယ်ပယ်တွေမှာ မတူညီတဲ့ပုံစံနဲ့ အသုံးပြုနေကြတဲ့ Study Designs တွေ ဖြစ်ပါတယ်။

Study Designs တွေကို အမျိုးအစားခွဲခြား(Classify)တဲ့ နည်းလမ်းတွေ အများကြီး ရှိပါတယ်။ တခါတလေမှာ လေ့လာမှု(Study)တစ်ခုဟာ ခေါင်းစဉ်(Category)တစ်ခုတည်းအောက်မှာပဲ အကြုံးဝင်နေတတ်တာမျိုးမဟုတ်တာကို တွေ့ရပါတယ်။

Study Design နဲ့ပက်သက်တဲ့ အယူအဆလေးတွေကို ဆက်သွားပါမယ်။ သုတေသနဆိုင်ရာလေ့လာမှုအမျိုးအစားတွေ(Types of Research Studies)လို့လည်း ခေါ်နိုင်ပါတယ်။

Types of Research Studies
  1. Exploratory vs Confirmatory Studies
  2. Comparative vs Non-Comparative Studies
  3. Observational Studies vs Experiments တို့ဖြစ်ပါတယ်။
1. Confirmatory Vs Exploratory Studies

Confirmatory ဆိုတာက သိပ္ပံနည်းကျအဖြေရှာတဲ့ နည်းလမ်းတစ်ခု ဖြစ်ပါတယ်။ ပထမဆုံး မှားယွင်းနိုင်ချေရှိတဲ့အဆိုတစ်ခု(Falsifiable Hypothesis)တစ်ခုကို ပြုလုပ်ရပါတယ်။ [Falsifiable Hypothesis အကြောင်းဖတ်ရန်] အဲ့ဒီ့နောက် အဲ့ဒီ့အဆိုနဲ့ ပက်သက်ပြီး မှန်မမှန်လေ့လာဆန်းစစ်ရပါတယ် (ဒီအဆိုတစ်ခုတည်းနဲ့ ပက်သက်တဲ့ ဒေတာတွေကိုသာ ကောက်ယူပြီး လေ့လာရတာဖြစ်ပါတယ်)

Exploratory ကကျတော့ Confirmatory မှာလို ကြိုတင်အဆိုပြုထားတဲ့ အဆိုပြုချက်မရှိဘဲ ဒေတာတွေကို ဒီအတိုင်းကောက်ယူပြီး လေ့လာ(Analyse)တာ ဖြစ်ပါတယ်။

ဒီလေ့လာမှုနှစ်ခုလုံးကနေ Information တွေရနိုင်ပေမဲ့ 'Over Fitting', 'Multiple Testing' နဲ့ 'P-Hacking' မဖြစ်အောင် သတိပြုဖို့လိုပါတယ်။

[ Over Fitting ဖြစ်တယ်ဆိုတာက သုတေသနလုပ်တဲ့အခါမှာ ဒေတာတွေကို လိုတာထက် ပိုထည့်မိတဲ့အခါမျိုးမှာဖြစ်တတ်သလို ကိုယ်ထည့်လိုက်တဲ့ဒေတာတွေက ကိုယ်ဖြစ်စေချင်တဲ့ရလဒ်မျိုးကိုထွက်လာစေမဲ့ဒေတာမျိုးတွေကြောင့်လည်း ဖြစ်တတ်ပါတယ်။  ဥပမာ - League 2 က ငယ်ရွယ်တဲ့ကစားသမားတစ်ယောက်က သူ့ရဲ့ခြေစွမ်းကောင်းမွန်မှုကြောင့် League 1 က အသင်းကြီးတွေဆီကို ပြောင်းရွှေ့ရနိုင်မလားဆိုတာကို သိရှိဖို့အတွက် သူ့လိုမျိုးကစားသမားအယောက် 10,000 ရဲ့ ဒေတာတွေနဲ့ သုတေသနလုပ်ကြည့်ပါမယ်။ အဲ့ဒီ့အခါမှာ ရလာတဲ့ရလဒ်ရဲ့ မှန်ကန်မှု Accuracy က 99% ဖြစ်နေတယ်ဆိုပါစို့။ ဒါပေမဲ့ ခုနက သုံးခဲ့တဲ့ ကစားသမားအယောက် တစ်သောင်းရဲ့ ဒေတာမဟုတ်ဘဲ နောက်ထပ်ကစားသမားအယောက် တစ်သောင်းရဲ့ဒေတာနဲ့ ပြောင်းလဲပြီး စမ်းသပ်ကြည့်တဲ့အခါမှာ ရလဒ်မှန်ကန်မှု Accuracy က 50% ပဲ ရှိတယ်ဆိုကြပါစို့။ ဒါဆိုရင် ခုနက ကျွန်တော်တို့ ပထမလုပ်ခဲ့တဲ့ သုတေသနနဲ့ ဒေတာတွေက Overfitting ဖြစ်နေတာပဲ ဖြစ်ပါတယ်။ ]

[ Mutltiple Testing - ဆိုတာက စမ်းသပ်မှုတစ်ခုမှာ ရှားရှားပါးပါးဖြစ်နိုင်တဲ့ ရလဒ်တစ်ခုကို အကြိမ်ရေအများကြီး ဖြစ်လာအောင် ရည်ရွယ်ပြီး အကြိမ်ကြိမ်အခါခါ စမ်းသပ်မှုပြုလုပ်တာကို ဆိုလိုပါတယ်။ ဥပမာ - မျက်နှာပြင် ၆ ဘက်ပါတဲ့ အံစာတုံးနှစ်တုံးကို မြှောက်မယ်ဆိုရင် အံစာတုံးနှစ်တုံးလုံး ၆ ပဲ ကျနိုင်ခြေက အကြိမ်ရေ ၃၆ ကြိမ်မှာမှ တစ်ကြိမ်ပဲ ဖြစ်နိုင်ချေရှိပါတယ်။ ဒါပေမဲ့ အဲ့ဒီ့လို အံစာတုံးနှစ်ခုလုံး ၆ ပဲ အကြိမ်တစ်ရာလောက်ကျစေချင်တဲ့အတွက် အကြိမ် ၃၆၀၀ မြှောက်ပြီး စမ်းသပ်မယ်ဆိုရင် ဒါဟာ Multiple Testing ဖြစ်သွားပါပြီ။ အလွယ်ပြောမယ်ဆိုရင် ကိုယ်က ဒီနေ့ ကျောင်းပြေးချင်နေတယ်ဆိုပါစို့။ ဒီနေ့ကျောင်းပြေးသင့်သလားဆိုတဲ့ မေးခွန်းကို လက်ထောက်ဗေဒင်မှာ "ကိုယ်လုပ်ချင်တဲ့အကြံကို အကောင်အထည်ဖော်သင့်သလား" ဆိုတဲ့ မေးခွန်းကို မေးပြီး လက်ထောက်လိုက်တယ်။ အဖြေက "မဖော်သင့်ဘူး" လို့ ပြနေတယ်။ ဒီတော့ အရမ်းကို ကျောင်းပြေးချင်နေတဲ့အတွက် "ဟာ မဟုတ်သေးဘူး။ ငါက သုံးခါမေးမှာ" ဆိုပြီးတော့ ပြန်ထောက်တယ်။ အဲ့ဒီ့အခါ "အကောင်အထည်ဖော်သင့်ပါတယ်" ဆိုတဲ့ အဖြေလည်းရရော၊ ဒါမှ မှန်တာဆိုပြီး ကျောင်းပြေးပါလေရော :D ဒါဟာ Multiple Testing ပဲ ဖြစ်ပါတယ်။ ]

[ P-Hacking - သုတေသနကနေ တိုင်းတာရရှိလာတဲ့ရလဒ်ဒေတာတွေကို နည်းလမ်းအမျိုးမျိုးနဲ့ ခွဲခြမ်းစိတ်ဖြာလေ့လာ(Analyse)နိုင်ပါတယ်။ အဲ့ဒီ့လိုလေ့လာတဲ့ Analysis နည်းလမ်းတွေထဲကမှ မိမိလိုချင်တဲ့အဖြေထွက်လာမဲ့ နည်းလမ်းကို ရွေးပြီး အသုံးပြုတာကို P-Hacking လို့ ခေါ်ပါတယ်။ P ဆိုတာက Probability ကို ကိုယ်စားပြုပါတယ်။ သုတေသနရလဒ်ဖော်ပြချက်တွေမှာ မဖြစ်မနေထည့်သွင်းပေးရတဲ့ ဒီ P တန်ဖိုးက လေ့လာမှုရလဒ်တွေထဲကမှ မှားယွင်းနိုင်ခြေကို ကိုယ်စားပြုပါတယ်။ ဥပမာ - ပန်းသီး အလုံးတစ်ရာမှာ ခူးလာတဲ့ ဆယ်လုံးက ပိုးစားတယ် ဆိုပါစို့။ ဒါဆိုရင် P တန်ဖိုးဟာ 0.1 ဖြစ်ပါတယ်။ 10 ရာခိုင်နှုန်းက ပိုးစားတယ်ပေါ့။ အလုံးတစ်ရာမှာ ငါးလုံးပဲ ပိုးစားနေတယ်ဆိုရင် ပိုးစားတာက ၅ ရာခိုင်နှုန်းဖြစ်သွားပြီး P တန်ဖိုးက 0.05 ဖြစ်သွားပါတယ်။ ဒီတော့ သုတေသနသမားတစ်ဦးက သူ့ရဲ့လေ့လာမှုမှာ P တန်ဖိုးက 0.1 ရနေတယ်ဆိုပါစို့။ ဒါပေမဲ့ သုတေသနနယ်ပယ်မှာ P တန်ဖိုးကို 0.05 ထက်နည်းမှ လက်ခံတယ်ဆိုရင် သူက P တန်ဖိုးကို 0.05 ဖြစ်အောင်လုပ်ပေးနိုင်တဲ့ Analysis နည်းလမ်းကိုပဲ အသုံးပြုပါတော့တယ်။ ဒါဟာ P-Hacking ပြုလုပ်ခြင်းပဲ ဖြစ်ပါတယ်။

နောက်ထပ်မြင်သာတဲ့ ဥပမာပေးမယ်ဆိုရင် ဆေးသုတေသနပညာရှင်က သွေးတိုးကျဆေးထုတ်လုပ်ဖို့ သုတေသနလုပ်နေတယ်ဆိုပါစို့။ သူ့ရဲ့ဆေးကို စမ်းသပ်မှုတွေ ပြုလုပ်ပြီး ဒေတာတွေကို ကောက်ယူ Analysis ပြုလုပ်ပါတယ်။ အဲ့ဒီ့အခါမှာ P တန်ဖိုးက 0.15 လောက်ရနေတယ်ဆိုရင် (တနည်းအားဖြင့် သူ့ဆေးကို သောက်တဲ့လူ တစ်ရာမှာ ၁၅ ယောက်က သွေးတိုးမကျဘူးဆိုရင်) သူ့ဆေးဟာ အလုပ်မဖြစ်ဘူးဆိုတာကို ပြနေပါတယ်။ ဒါပေမဲ့ သုတေသနဂျာနယ်တွေက သုတေသနရလဒ်တွေကို P တန်ဖိုး 0.05 ထက်လျော့နည်းမှ (တနည်းအားဖြင့် သူ့ဆေးကို သောက်တဲ့သူ တစ်ရာမှာ ၅ ယောက်လောက်အထိပဲ သွေးတိုးမကျဘူးဆိုမှ) တန်ဖိုးရှိတဲ့ သုတေသနရလဒ်အဖြစ် ဂျာနယ်ထဲမှာ ထည့်သွင်းဖော်ပြပေးပါတယ်။

အဲ့ဒီ့အခါမှာ ဒီဆေးသုတေသနပညာရှင်မှာ မက်လုံးက ရှိသွားပါပြီ။ သူ့ဆေးက အလုပ်မဖြစ်ဘူးဆိုတာသိပေမဲ့ ဂျာနယ်ထဲမှာလည်း ပါချင်တဲ့အတွက် သုတေသနက ရလဒ်ဒေတာတွေကို လေ့လာမှုလုပ်ရင် P တန်ဖိုး 0.05 သာ ထွက်လာစေမဲ့ Analysis နည်းလမ်းမျိုးကို ရွေးချယ်ပြီး သုံးလိုက်ပါတော့တယ်။ ဒါဟာ P-hacking ပဲ ဖြစ်ပါတယ်။ ]

အဓိကပြောချင်တာကတော့ Dataset တစ်ခုကို သုတေသနမေးခွန်းတွေအများကြီး ထပ်ခါထပ်ခါ မေးနေလေလေ ရလာနိုင်တဲ့ အဖြေက အမှားဘက်ကို ဦးတည်သွားနေလေပဲ ဖြစ်ပါတယ်။

2. Comparative VS Non-Comparative Studies

တချို့သုတေသနလေ့လာမှုတွေက သဘာဝအားဖြင့် တစ်ခုနဲ့ တစ်ခုကို အရေအတွက်အားဖြင့် နှိုင်းယှဉ်လေ့လာကြတာဖြစ်ပါတယ်။ ဥပမာ - စိုက်ခင်းထဲက လိမ္မော်ပင်တွေကို မတူညီတဲ့  ဓာတ်မြေဩဇာတွေကျွေးပြီး အသီးသီးနှုန်းကို လေ့လာတာ၊ အွန်လိုင်းမှာအသုံးပြုတဲ့ ကြော်ငြာပုံနှစ်ခုမှာ ဘယ်ကြော်ငြာကို လူတွေကပိုပြီး Click နှိပ်ကြည့်သလဲ ဆိုတာကို လေ့လာတာ စတဲ့ နှိုင်းယှဉ်လေ့လာမှုတွေဖြစ်ပါတယ်။ ဒါတွေကို Comparative Studies လို့ ခေါ်ပါတယ်။

Non-Comparative Studies ဆိုတာက အရေအတွက်ကိန်းဂဏန်းတစ်ခုခုကို ကြိုတင်ခန့်မှန်းတာ၊ ဟောကိန်းထုတ်တာမျိုးကို ဆိုလိုတာ ဖြစ်ပါတယ်။ နှိုင်းယှဉ်လေ့လာတာမျိုး လုံးဝမဟုတ်ပါဘူး။ ဥပမာ - လာမဲ့နှစ်မှာ ဒီကုမ္ပဏီရဲ့ ရှယ်ယာတစ်စုတန်ဖိုးက ဘယ်လောက်ရှိမလဲဆိုတာမျိုး၊ ဒီသွေးတိုးကျဆေးအသစ်ကိုသောက်ရင် ဘယ်လောက်အထိ သွေးတိုးကျသွားသလဲ ဆိုတာမျိုးတွေပဲ ဖြစ်ပါတယ်။

3. Observational Studies vs Experiments

လက်တွေ့မျက်မြင်ကိုအခြေခံပြီး ပြုလုပ်တဲ့ သုတေသနတွေမှာ အရေးကြီးဆုံးအချက်တွေထဲက တစ်ခုက ဒီနှိုင်းယှဉ်မှုတွေဟာ  မေးမြန်းစူးစမ်းပြီး(Observational) ပြုလုပ်တာလား? လက်တွေ့စမ်းသပ်ပြီး(Experimental)ပြုလုပ်တာလား? ဆိုတာပဲ ဖြစ်ပါတယ်။

Observational Study - ဆိုတာက သုတေသီတစ်ဦးဟာ သူသိချင်တဲ့၊ ရယူချင်တဲ့ ဒေတာတွေနဲ့ ပက်သက်တဲ့အကြောင်းအရာ၊ အချက်အလက်တွေကို လုံးဝပြုပြင်စွက်ဖက်ခြင်းမရှိဘဲ မူလအတိုင်း ရှိနေတဲ့ဒေတာတွေကိုသာ စူးစမ်းမေးမြန်းပြီး လေ့လာရယူတာပဲ ဖြစ်ပါတယ်။

ဥပမာ - မြို့တွင်းက လူသွားလူလာများတဲ့ လမ်းတစ်လမ်းမှာ တိရိစ္ဆာန်အစာဆိုင် ဖွင့်ချင်တယ်ဆိုပါစို့။ အဲ့ဒီ့အခါမှာ ဒီလမ်းပေါ်မှာ ဖြတ်သွားနေတဲ့ လူတွေကို 
"အိမ်မွေး တိရိစ္ဆာန်မွေးထားပါသလား?" "ဘယ်တိရိစ္ဆာန်ကို မွေးထားပါသလဲ?" "အစာကို ဘယ်လိုကျွေးပါသလဲ?" စသဖြင့် မေးမြန်း(Observe)ပြီး ရလာတဲ့ ဒေတာတွေကိုမှ တိရိစ္ဆာန်အစာဆိုင်ဖွင့်သင့်/မဖွင့်သင့် ဆုံးဖြတ်ဖို့ အသုံးချတာမျိုး ဖြစ်ပါတယ်။ ဒီလိုမျိုး ဒေတာအရင်းအမြစ်တွေကို ဘာမှပြုပြင်ခြင်း မရှိဘဲ မေးမြန်းစူးစမ်း/တိုင်းတာပြီး လေ့လာတာကို Observational Study လို့ ခေါ်ပါတယ်။

နောက်တစ်ခုကတော့ ဆေးလိပ်ရဲ့ဆိုးကျိုးကို သိချင်တဲ့အခါမှာ ဆေးလိပ်သောက်သူနဲ့ ဆေးလိပ်မသောက်သူရဲ့ သက်တမ်းကို နှိုင်းယှဉ်ကြည့်တာမျိုး၊ အဆုတ်ကင်ဆာဖြစ်ပွားနှုန်းကို နှိုင်းယှဉ်ကြည့်တာမျိုး ဖြစ်ပါတယ်။ ဒါဟာလည်း Observational Study ဖြစ်ပါတယ်။

Experimental Study - ဆိုတာက သုတေသီတစ်ဦးဟာ နှိုင်းယှဉ်လေ့လာမှုပြုလုပ်တဲ့အခါမှာ သူ စမ်းသပ်လေ့လာမဲ့ စမ်းသပ်ခံအရာတွေကို လုပ်ဆောင်ချက်ထည့်သွင်းလိုက်တဲ့အခါမှာ ထွက်ပေါ်လာတဲ့ ရလဒ်နဲ့ လုပ်ဆောင်ချက်မထည့်သွင်းထားတဲ့စမ်းသပ်ခံအရာတွေရဲ့ ရလဒ်နဲ့ နှိုင်းယှဉ်လေ့လာတာပဲ ဖြစ်ပါတယ်။

ဥပမာ - ဓာတ်မြေဩဇာတွေက မုန်လာဥနီရဲ့ ကြီးထွားမှုကို ဘယ်လောက်ထိသက်ရောက်နိုင်တယ်။ ဘယ်ဓာတ်မြေဩဇာက ပိုပြီးကြီးထွားမှုကောင်းစေတယ်ဆိုတာကို သိချင်တယ်ဆိုရင် သုတေသီဟာ မုန်လာဥနီစိုက်ခင်းထဲမှာ သီးခြားအကွက်တွေခွဲပြီး ဓာတ်မြေဩဇာထည့်သွင်းတဲ့အကွက်ရဲ့ ရလဒ်နဲ့ မထည့်သွင်းတဲ့အကွက်၍ ရလဒ်ကို နှိုင်းယှဉ်လေ့လာတာမျိုး ဖြစ်ပါတယ်။ (ဓာတ်မြေဩဇာထည့်ရမဲ့အကွက်နဲ့ မထည့်ရမဲ့ အကွက်တွေကို ကျပန်း Random ရွေးချယ်သတ်မှတ်ပါတယ်။) သုတေသီက စမ်းသပ်ခံအရာတွေကို Observational Study မှာလို ဒီအတိုင်းလေ့လာရုံမဟုတ်ဘဲ လုပ်ဆောင်ချက်ထည့်သွင်းပြီးမှ စမ်းသပ်လေ့လာရတဲ့အတွက် Experimental Study လို့ ခေါ်တာ ဖြစ်ပါတယ်။

Observational Study မှာ မိမိလေ့လာမဲ့အရာတွေကို ကြိုတင်သတ်မှတ်ခြင်းမရှိဘဲ မေးမြန်းတိုင်းတာလေ့လာတာဖြစ်ပြီး လေ့လာမဲ့အရာတွေဟာ သဘာဝအရ ဖြစ်တည်ပေါ်ပေါက်နေတဲ့အရာတွေလည်း ဖြစ်ပါတယ်။

Experimental Study မှာတော့ မိမိလေ့လာမဲ့အရာတွေကို ကျပန်းသတ်မှတ်ပြီး မေးမြန်း
တိုင်းတာလေ့လာတာပဲ ဖြစ်ပါတယ်။

Power and Bias

ယေဘုယျအားဖြင့် ဒေတာတွေများလေ အချက်အလက်တွေ ပိုပြီးရရှိနိုင်လေ ဖြစ်ပါတယ်။ ဒါပေမဲ့ ဒေတာတွေကောက်ယူတဲ့အခါမှာ ဘယ်လိုပုံစံမျိုးနဲ့ ကောက်ယူခဲ့သလဲဆိုတာက အရမ်းကို အရေးကြီးပါတယ်။

လေ့လာမှုလုပ်တဲ့အခါမှာ ကောက်ယူခဲ့တဲ့ဒေတာတွေက မိမိရဲ့သုတေသနမေးခွန်းနဲ့ ပက်သက်ပြီး အချက်အလက်နည်းနည်းလေးပဲ ရရှိနိုင်တဲ့ဒေတာမျိုးတွေဆိုရင် အဲ့ဒီ့ဒေတာတွေကို ခွဲခြမ်းစိတ်ဖြာလေ့လာပြီးရလာတဲ့သုတေသနရလဒ်ကလည်း သိပ်ပြီးတော့ အသုံးကျတဲ့အချက်အလက်မျိုး ဖြစ်လာမှာ မဟုတ်ပါဘူး။

Power Analysis - ဆိုတာက Study Design (လေ့လာမှုဒီဇိုင်း)ပုံစံဟာ အဓိပ္ပာယ်ရှိတဲ့လေ့လာတွေ့ရှိမှုတွေ ဘယ်လောက်ပမာဏထိ ထုတ်ပေးနိုင်သလဲဆိုတာကို အကဲဖြတ်ဖို့ အသုံးပြုတဲ့အရာဖြစ်ပါတယ်။

Bias - ဆိုတာက စနစ်တကျဖြစ်ပေါ်လာပေမဲ့ မိမိလေ့လာလိုတဲ့ အကြောင်းအရာနဲ့ မသက်ဆိုင်တဲ့ တိုင်းတာလေ့လာမှုတွေဖြစ်ပါတယ်။ Bias တွေဟာ မိမိစိတ်ဝင်တစားလေ့လာတဲ့ ဒေတာရင်းမြစ်(Population)ကို ကိုယ်စားမပြုတဲ့အရာ(Sample)တွေ ဖြစ်ပါတယ်။

ဥပမာ - လွှတ်တော်ဟာ ပြည်သူအားလုံးမှ ရွေးကောက်တင်မြှောက်လိုက်တဲ့ အမတ်တွေသာ အလုပ်လုပ်ရတဲ့ နေရာဖြစ်ပါတယ်။ မြန်မာနိုင်ငံလွှတ်တော်ထဲမှာ စစ်တပ်ကိုယ်စားလှယ် ၂၅% ဟာ ပြည်သူရွေးကောက်ခံမဟုတ်ဘဲ ပါဝင်နေတဲ့အတွက် သူတို့ဟာ ပြည်သူကိုကိုယ်စားပြုမဟုတ်လို့ သူတို့ကို Bias လို့ ခေါ်ရမှာပါ။ နိုင်ငံတော်အတွက် အရေးကြီးအဆိုတွေတင်သွင်းကြ၊ အတည်ပြုကြတဲ့အခါမှာ လွှတ်တော်အမတ်တွေရဲ့ ကန့်ကွက်ခြင်း၊ ထောက်ခံခြင်းဟာ ပြည်သူတွေရဲ့ ဆန္ဒကို တိုက်ရိုက်ကိုယ်စားပြုတာဖြစ်ပြီး စစ်တပ်ကိုယ်စားလှယ်တွေရဲ့ ကန့်ကွက်မှုထောက်ခံမှုဟာ ပြည်သူတွေကို ကိုယ်စားပြုခြင်းမရှိပါဘူး။ သူတို့ရဲ့ အဆိုတင်သွင်းမှု၊ ထောက်ခံမှုတွေကို ပြည်သူရဲ့ သဘောဆန္ဒလို့ မှတ်ယူလို့မရပါဘူး။ ဒီလိုမျိုး မူလအကြောင်းအရာလေ့လာမှုနဲ့ မသက်ဆိုင်တဲ့ ထည့်သွင်းစဉ်းစားတွက်ချက်လို့ မရတဲ့ Sample တွေကို Bias လို့ ခေါ်ပါတယ်။

ရွေးကောက်ခံအမတ်တွေချည်းပဲ ၁၀၀ ရာခိုင်နှုန်းရှိနေခဲ့မယ်ဆိုရင် အဆိုတစ်ခုကို ဘယ်လောက်ထိ ပြည်သူတွေထောက်ခံကြမလဲဆိုတာကို ပုံမှန်အတိုင်း တွက်ချက်လို့ ရမှာဖြစ်ပေမဲ့ ရွေးကောက်ခံမဟုတ်တဲ့သူတွေ ပါဝင်နေတဲ့အတွက် သူတို့ဆီက ဒေတာကို ပြည်သူ့ဆန္ဒအဖြစ် ထည့်စဉ်းစားလို့မရတာကြောင့် ပုံမှန်အတိုင်း တွက်ချက်ဆုံးဖြတ်လို့ မရတော့ပါဘူး။

Bias ဟာ ဘယ်လိုသုတေသနလေ့လာမှုမျိုးမှာမဆို ပြဿနာဖြစ်တတ်ပေမဲ့ Observational Study တွေမှာ ပိုပြီးတော့ ပြဿနာကြီးကြီး ဖြစ်လေ့ရှိပါတယ်။

အခုဆိုရင် Study Design နဲ့ ပက်သက်ပြီး အတော်လေး ပြောခဲ့ပြီးပါပြီ။ ဒီဒီဇိုင်းတွေဟာ အမှန်တကယ်ဒေတာတွေနဲ့ သုတေသနတွက်ချက်လေ့လာမှုတွေ လုပ်တဲ့အခါမှာ ပိုပြီးတော့ ထင်သာမြင်သာ ရှိလာမှာပါ။

Comments

Popular posts from this blog

1.3 ဒေတာတွေ ဘယ်ကလာသလဲ? (Where Do Data Come From?)

ဒီအပိုင်းမှာ ဒေတာတွေဘယ်ကလာသလဲ ဆိုတဲ့ အကြောင်းအရာနဲ့ ဒေတာတွေကို ခွဲခြမ်းစိတ်ဖြာလေ့လာရာမှာအသုံးပြုတဲ့ Statistical Approaches (ချဉ်းကပ်ပုံ)တွေအတွက် ဒေတာတွေဘယ်ကလာသလဲဆိုတဲ့အချက်က ဘာကြောင့် အရေးကြီးသလဲဆိုတာကို ဆွေးနွေးပါမယ်။ Data Analysis ပြုလုပ်ရာမှာ ဒေတာတွေဘယ်ကလာသလဲဆိုတာကို ကောင်းကောင်းသိဖို့လိုပြီးတော့ ဒေတာတွေက ဘယ်လိုဖြစ်ပေါ်လာသလဲဆိုပြီး စဉ်းစားတဲ့နေရာမှာ မဖြစ်မနေမေးဖို့လိုအပ်တဲ့ အရေးကြီးမေးခွန်းတွေလည်း ရှိကြပါတယ်။ Research Study ပြုလုပ်ချိန်မှာ ကောက်ယူတဲ့ဒေတာတွေက အမျိုးမျိုးဖြစ်နိုင်ပါတယ်။ (Different Types of Data) ယေဘုယျအားဖြင့် အဓိကဒေတာအမျိုးအစား နှစ်ခု ရှိပါတယ်။ Organic (or) Process Data (သဘာဝအရဖြစ်ပေါ်သောဒေတာ) 'Designed' Data Collection (ဒီဇိုင်းထုတ်စီမံပြီး ကောက်ယူသောဒေတာ) တို့ ဖြစ်ပါတယ်။ Organic (or) Process Data အကြောင်းပြောမယ်ဆိုရင် ဒီဒေတာတွေက ကွန်ပြူတာသတင်းအချက်အလက်စနစ်ကနေ ထုတ်ပေးလိုက်တဲ့ ဒေတာတွေ (ဒါမှမဟုတ်) ဗီဒီယိုနဲ့ အသံ Recordings တွေကနေ ထုတ်ယူထားတဲ့ ဒေတာတွေ ဖြစ်ပါတယ်။ အဓိကအချက်က ဒီဒေတာတွေဟာ Process တွေကနေ သဘာဝအတိုင်း ထွက်ပေါ်လာတဲ့ ဒေတာတွေဖ...

1.2 Statistics ဆိုတာဘာလဲ

By D Wells - Own work, CC BY-SA 4.0, https://commons.wikimedia.org/w/index.php?curid=79921898 Statistics ဆိုတာက ဒေတာကနေ သင်ယူလေ့လာရတဲ့ ဘာသာရပ်တွေအားလုံး အကြုံးဝင်တဲ့ ဘာသာရပ်တစ်ခုဖြစ်ပါတယ်။ Statistics ရဲ့ Methodology (နည်းစနစ်)မှာ ပါဝင်တာကတော့ Tools နဲ့ Methods တွေဖြစ်ပါတယ်။ ဒီ Tools နဲ့ Methods တွေကို ဒေတာတွေကို နားလည်ဖို့အတွက်ရယ်၊ ဒေတာတွေနဲ့ အလုပ်လုပ်ဖို့အတွက်ရယ် အသုံးပြုပါတယ်။

1.1 Data ဆိုတာဘာလဲ

ဒေတာဆိုတာဘာလဲလို့ မေးလာရင် ဘာမဆိုဖြစ်နိုင်တယ်လို့ပဲ ပြောရမှာပါ။ Data can be "Numbers" ပထမဆုံးအနေနဲ့ ဒေတာက ကိန်းဂဏန်းတွေဖြစ်နိုင်ပါတယ်။ ဒေတာလို့ပြောလိုက်တာနဲ့ လူအများစုက ကိန်းဂဏန်းတွေကိုပဲ ပြေးမြင်ကြမှာပါ။ ကိန်းဂဏန်းတွေနဲ့ ပြည့်နေတဲ့ Excel Spreadsheet လိုဟာမျိုးပေါ့။ အောက်မှာပြထားတဲ့ပုံက US က Center for Disease Control က ကောက်ယူထားတဲ့ National Health and Nutrition Examination Survey (NHANES) ဒေတာတွေဖြစ်ပါတယ်။ ကျွန်တော်တို့မြင်နေကြ Spreadsheet Data Format နဲ့ပဲ ဖြစ်ပါတယ်။