خطای نمونه گیری
خطای نمونه گیری به تفاوت بین نمونه و جامعه آماری اشاره دارد که علت آن فقط مشاهداتی است که «اتفاقی به عنوان نمونه انتخاب شده اند». خطای نمونه گیری، خطایی است که انتظار داریم هنگامی رخ دهد که عبارت بیان شده ما درباره یک جامعه آماری، فقط بر مبنای مشاهدات موجود در نمونه اخذ شده از جامعه آماری است.
به بیان بهتر، فرض کنید قصد داریم میانگین درآمد سالانه کارگران را مشخص کنیم. برای تعیین این پارامتر (parameter)، می بایست از هر کارگر درآمدش را بپرسیم. از آنجا که اندازه این جامعه آماری میلیون ها نفر است، انجام این کار پر هزینه و غیر عملی است. لذا می توانیم از استنباط آماری برای برآورد میانگین درآمد جامعه آماری μ استفاده کنیم، البته اگر دقت کمتر از 100% را قبول کنیم. ما درآمدهای نمونه ای از کارگران را ثبت می کنیم و میانگین این نمونه درآمدها (x بار) را پیدا می کنیم. این میانگین نمونه ای، برآوردی از میانگین جامعه آماری است. اما مقدار میانگین نمونه ای، بسته به شانس، متفاوت از میانگین جامعه آماری خواهد بود، زیرا مقدار میانگین نمونه ای به آن درآمدهایی بستگی دارد که به صورت اتفاقی به عنوان نمونه انتخاب شده اند. تفاوت بین مقدار واقعی (نامعلوم) میانگین جامعه آماری و برآورد آن، یعنی میانگین نمونه ای، خطای نمونه گیری است. اندازه این اختلاف ممکن است صرفا به خاطر بد شانسی، بزرگ باشد- بد شانسی از این بابت که به صورت اتفاقی، نمونه ای انتخاب شود که نماینده جامعه آماری نباشد. تنها راهی که می توانیم اندازه مورد انتظار این خطا را کاهش دهیم، انتخاب یک نمونه بزرگتر است.
با توجه به یک اندازه نمونه ثابت، بهترین کاری که می توانیم انجام دهیم، بیان احتمال کمتر بودن خطای نمونه گیری از یک مقدار مشخص است (بعدا بحث می شود). امروزه معمول است که این عبارت به همراه نتایج نظرسنجی (opinion poll) قرار گیرد.
برای مثال، اگر نظرسنجی بر اساس نتایج نمونه بیان کند که در انتخابات آتی کاندیدای فعلی از پشتیبانی 54% رأی دهندگان واجد شرایط برخوردار است، عبارت پس از آن ممکن است چنین باشد: «این درصد در بازه 3% درست است»، 19 بار از 20 بار. این عبارت یعنی ما برآورد می کنیم که سطح واقعی پشتیبانی از این کاندیدا بین 51% و 57% است و در بلندمدت، این روش در 95% موارد درست است.
خطای غیر نمونه گیری
خطای غیر نمونه گیری جدی تر از خطای نمونه گیری است، زیرا انتخاب نمونه بزرگتر، اندازه و احتمال وقوع این خطا را کاهش نمی دهد. حتی یک سرشماری (census) هم ممکن است حاوی خطاهای غیر نمونه گیری باشد. خطاهای غیر نمونه گیری نتیجه اشتباه در جمع آوری داده ها یا انتخاب نامناسب مشاهدات نمونه ای است.
- خطا در جمع آوری داده ها (data acquisition): این نوع خطا ناشی از ثبت پاسخ های نادرست است که خود احتمالا نتیجه اندازه گیری های نادرست به علت به کارگیری تجهیزات معیوب، اشتباهات در هنگام رونوشت برداری از منابع اولیه، ثبت نادرست داده ها به دلیل سوء تعبیر از اصطلاحات یا پاسخ های نادرست به پرسش هایی درباره موضوعات حساس شخصی همانند فرار مالیاتی احتمالی است.
- خطای عدم پاسخ (Nonresponse error): به خطاها (یا جانبداری های) پدید آمده در زمانی اشاره دارد که پاسخ ها از بعضی اعضای نمونه کسب نشده باشد. وقتی این موضوع اتفاق می افتد، مشاهدات نمونه ای جمع آوری شده، ممکن است نماینده جامعه هدف (target population) نباشند، که این خود منجر به نتایج جانبدارانه می شود. عدم پاسخ ممکن است به دلایلی رخ دهد. ممکن است مصاحبه کننده نتواند با فرد ذکر شده در نمونه تماس بگیرد یا اینکه فرد نمونه به دلایلی از پاسخ دهی اجتناب نماید. در هر دو مورد، پاسخ ها از فرد نمونه جمع آوری نمی شوند و جانبداری پدید می آید. مشکل عدم پاسخ در زمانی که پرسشنامه های خود گردان به جای مصاحبه کننده استفاده می شوند، حتی بزرگتر نیز هست، زیرا مصاحبه کننده می تواند نرخ عدم پاسخ (nonresponse rate) را با تماس مجدد کاهش دهد. در واقع، نتیجه نرخ بالای عدم پاسخ، نمونه ای جانبدارانه و خود برگزیده (self-selected) است.
- تعصب انتخاب (Selection bias): زمانی اتفاق می افتد که طرح نمونه گیری (sampling plan) به گونه ای است که احتمالا بعضی اعضای جامعه هدف نمی توانند به عنوان نمونه انتخاب شوند. مثلا در یک نظرسنجی از رأی دهندگان، دسته ای از رأی دهندگان که فاقد تلفن هستند، از نمونه احتمالی حذف شوند.
برچسبها: خطای نمونه گیری, خطای غیر نمونه گیری

