حال که چارک ها معرفی شده اند، می توانیم تکنیک گرافیکی دیگری به نام نمودار جعبه ای (box plot) را معرفی کنیم. این تکنیک 5 آماره را ترسیم می کند: کمترین و بیشترین مشاهدات، و چارک های اول و دوم و سوم. همچنین ویژگیهای دیگر مجموعه داده ها را نیز ترسیم می کند. نمونه ای از نمودار جعبه ای در زیر قابل مشاهده است:

سه خط عمودی جعبه، چارک های اول و دوم و سوم هستند. خطوط گسترش یافته به سمت چپ و راست، whiskers نامیده می شوند. هر نقطه ای که بیرون از whiskers باشد، داده پرت (outlier) نامیده می شود.
whiskers به اندازه 1.5 برابر دامنه بین چارکی یا آخرین نقطه نهایی که داده پرت محسوب نمی شود، امتداد می یابند.
داده های پرت (Outliers)
داده های پرت مشاهدات بزرگ یا کوچک غیر معمول هستند. از آنجا که یک داده پرت از بدنه مجموعه داده ها حذف می شود، اعتبار آن مشکوک است. در نتیجه، داده های پرت می بایست بررسی شوند تا مشخص شود که نتیجه خطا در ثبت مقادیر نیستند. داده های پرت می توانند همچنین نشان دهنده مشاهدات غیر معمولی باشند که باید مورد بررسی قرار گیرند. برای مثال، اگر عملکرد یک فروشنده بسیار پرت است، شرکت می تواند از طریق مشخص کردن آنچه این فروشنده را تا بدین اندازه از سایرین جدا ساخته است، منتفع شود.
توجه: نمودار جعبه ای به طور خاص در هنگام مقایسه دو یا چند مجموعه داده مفید است.
برچسبها: داده پرت, outlier, نمودار جعبه ای, Box Plots

