متغیرهای تصادفی و توزیع های احتمال گسسته
آزمایشی را در نظر بگیرید که دو سکه متعادل را پرتاب می و نتایج را مشاهده می کنیم. ما می توانیم رویدادها را چنین نمایش دهیم
شیر روی سکه اول و شیر روی سکه دوم
شیر روی سکه اول و خط روی سکه دوم
خط روی سکه اول و شیر روی سکه دوم
خط روی سکه اول و خط روی سکه دوم
با این حال ، می توانیم رویدادها را به روشی دیگر فهرست کنیم. به جای تعریف رویدادها با توصیف نتیجه هر سکه ، می توانیم تعداد شیر (یا در صورت تمایل ، تعداد خط) را حساب کنیم. بنابراین ، اکنون رویدادها چنین هستند:
2 شیر
1 شیر
1 شیر
0 شیر
به تعداد شیرها متغیر تصادفی (random variable) گفته می شود. ما اغلب متغیر تصادفی را با X برچسب گذاری می کنیم ، و احتمال هر مقدار X برای ما جالب است. بنابراین ، در این تصویر ، مقادیر X عبارتند از: 0 ، 1 و 2 .
در اینجا یک مثال دیگر ارائه می کنیم. شخصی دو تاس پرتاب می کند. یکی از راه های فهرست کردن رویدادها توصیف عدد روی تاس اول و شماره روی تاس دوم به شرح زیر است:
1, 1 1, 2 1, 3 1, 4 1, 5 1, 6
2, 1 2, 2 2, 3 2, 4 2, 5 2, 6
3, 1 3, 2 3, 3 3, 4 3, 5 3, 6
4, 1 4, 2 4, 3 4, 4 4, 5 4, 6
5, 1 5, 2 5, 3 5, 4 5, 5 5, 6
6, 1 6, 2 6, 3 6, 4 6, 5 6, 6
با این حال ، در اکثر موارد، بازیکن در درجه اول مجموع اعداد مهم است. بر این اساس ، ما می توانیم مجموع دو تاس را به جای اعداد منفرد فهرست کنیم.
2 3 4 5 6 7
3 4 5 6 7 8
4 5 6 7 8 9
5 6 7 8 9 10
6 7 8 9 10 11
7 8 9 10 11 12
اگر متغیر تصادفی X را به صورت مجموع دو تاس تعریف کنیم ، X می تواند برابر باشد
2 ، 3 ، 4 ، 5 ، 6 ، 7 ، 8 ، 9 ، 10 ، 11 و 12.
تعریف متغیر تصادفی (Random Variable)
یک متغیر تصادفی یک تابع یا قانون است که به هر نتیجه آزمایش یک عدد اختصاص می دهد.
در برخی آزمایشات ، نتایج عددی است. به عنوان مثال ، وقتی بازده سرمایه گذاری را مشاهده می کنیم یا مدت زمان اسمبل کردن رایانه را اندازه می گیریم ، آزمایش رویدادهایی را تولید می کند که اعداد هستند. به عبارت ساده ، مقدار یک متغیر تصادفی یک رویداد عددی است.
دو نوع متغیر تصادفی وجود دارد ، گسسته (discrete) و پیوسته (continuous). متغیر تصادفی گسسته (discrete random variable) ، متغیری است که می تواند تعداد قابل شماری از مقادیر را به خود اختصاص دهد. به عنوان مثال ، اگر X را به عنوان تعداد شیرهای مشاهده شده در آزمایشی تعریف كنیم كه یك سكه را 10 برابر پرتاب می کند، در این صورت مقادیر X عبارتند از 0 ، 1 ، 2 ،. . . ، 10. متغیر X می تواند در مجموع 11 مقدار داشته باشد. بدیهی است که ما تعداد مقادیر را حساب کردیم. از این رو ، X گسسته است.
متغیر تصادفی پیوسته (continuous random variable) ، متغیری است که مقادیر آن غیرقابل شمارش باشد. یک مثال عالی از یک متغیر تصادفی پیوسته ، مدت زمان انجام یک کار است. به عنوان مثال ، فرض کنید X = زمان امتحان آمار در دانشگاهی است که محدودیت زمانی 3 ساعت است و دانشجویان نمی توانند قبل از 30 دقیقه آنجا را ترک کنند. کمترین مقدار X برابر 30 دقیقه است. اگر بخواهیم تعداد مقادیری را که X می تواند داشته باشد، محاسبه کنیم ، باید مقدار بعدی را مشخص کنیم. آیا 30.1 دقیقه است؟ 30.01 دقیقه؟ 30.001 دقیقه؟ هیچ یک از اینها دومین مقدار ممکن X نیست زیرا اعداد بزرگتر از 30 و کوچکتر از 30.001 وجود دارد. روشن می شود که ما نمی توانیم مقدار دوم یا سوم یا سایر مقادیر X را شناسایی کنیم (به جز بزرگترین مقدار 180 دقیقه). بنابراین ، ما نمی توانیم تعداد مقادیر را بشماریم ، و X پیوسته است.
توزیع احتمال (probability distribution) یک جدول ، فرمول یا نمودار است که مقادیر یک متغیر تصادفی و احتمال مرتبط با این مقادیر را توصیف می کند. ما توزیع های احتمال گسسته را در ادامه بررسی خواهیم کرد و توزیع های پیوسته را بعدا پوشش خواهیم داد.
همانطور که قبلاً اشاره کردیم ، یک حرف بزرگ نام متغیر تصادفی ، معمولاً X را نشان می دهد. همتای کوچک آن مقدار متغیر تصادفی را نشان می دهد.
بنابراین ، ما این احتمال را نشان می دهیم که متغیر تصادفی X برابر x خواهد بود:
P(X = x)
یا به شکل ساده تر
P(x)
توزیع های احتمال گسسته
احتمالات مقادیر یک متغیر تصادفی گسسته را می توان با استفاده از ابزارهای احتمال مانند نمودارهای درختی (tree diagrams) یا با استفاده از یکی از تعاریف احتمال بدست آورد. با این وجود ، دو الزام اساسی زیر اعمال می شود:
الزامات توزیع یک متغیر تصادفی گسسته
0 ≤ P(x) ≤ 1 برای هر x

که در عبارت های بالا، متغیر تصادفی می تواند مقادیر x را بپذیرد و P(x) احتمال آن است که متغیر تصادفی برابر x باشد.
این الزامات معادل قوانین احتمال ارائه شده قبلی است.
برای توضیح ، مثال زیر را در نظر بگیرید:
مثال: توزیع احتمال افراد در هر خانوار
چکیده آماری منتشر شده، شامل طیف گسترده ای از اطلاعات بر اساس سرشماری و همچنین منابع دیگر است. هدف ارائه اطلاعات در مورد جنبه های مختلف زندگی ساکنان کشور است. یکی از سؤالات از خانوارها می خواهد که تعداد افراد ساکن در خانه را گزارش دهند. جدول زیر خلاصه داده هاست. توزیع احتمال متغیر تصادفی تعریف شده به عنوان تعداد افراد در هر خانوار را ایجاد کنید.
تعداد افراد تعداد خانوارها (به میلیون)
1 31.1
2 38.6
3 18.8
4 16.2
5 7.2
6 2.7
7 یا بیشتر 1.4
جمع 116.0
جواب: احتمال هر مقدار X ، تعداد افراد در هر خانوار، توسط فراوانی نسبی محاسبه می شود. ما فراوانی مربوط به هر مقدار X را بر تعداد کل خانوارها تقسیم می کنیم و توزیع احتمال زیر را تولید می کنیم.
x P(x)
1 31.1/116.0 = .268
2 38.6/116.0 = .333
3 18.8/116.0 = .162
4 16.2/116.0 = .140
5 7.2/116.0 = .062
6 2.7/116.0 = .023
7 or more 1.4/116.0 = .012
Total 1.000
همانطور که می بینید ، الزامات برآورده شده است. هر احتمال بین 0 و 1 است و جمع کل برابر 1 است.
ما احتمالات را به همان روشی که قبلا انجام دادیم تفسیر می کنیم. به عنوان مثال ، اگر یک خانوار را به طور تصادفی انتخاب کنیم ، احتمال اینکه 3 نفر داشته باشد این است که
P(3) = .162
ما همچنین می توانیم قانون جمع را برای رویدادهای دو به دو منحصر به فرد اعمال کنیم. (مقادیر X دو به دو منحصر به فرد هستند ؛ یک خانوار می تواند 1 ، 2 ، 3 ، 4 ، 5 ، 6 یا 7 نفر یا بیشتر داشته باشد.) احتمال اینکه یک خانوار به طور تصادفی انتخاب شده دارای چهار نفر یا بیشتر باشد ، چنین است:
P(X ≥ 4) = P(4) + P(5) + P(6) + P(7 or more) = .140 + .062 + .023 + .012 = .237
در این مثال، ما احتمالات را با استفاده از اطلاعات سرشماری در مورد کل جمعیت محاسبه کردیم. مثال بعدی استفاده از تکنیک های معرفی شده قبلی برای ایجاد توزیع احتمال را نشان می دهد.
مثال: توزیع احتمال تعداد فروش
یک فروشنده صندوق سرمایه گذاری مشترک تصمیم گرفته است که فردا با سه نفر تماس بگیرد. بر اساس تجربه گذشته ، فروشنده می داند که در هر تماس 20٪ احتمال فروش وجود دارد. توزیع احتمال تعداد فروش های فروشنده را تعیین کنید.
جواب: ما می توانیم از قوانین و درخت احتمال معرفی شده در قبل استفاده کنیم. شکل زیر درخت احتمال این مثال را نشان می دهد. فرض کنید X = تعداد فروش:

این درخت هر یک از هشت نتیجه ممکن و احتمالات آنها را به نمایش می گذارد. می بینیم که یک نتیجه وجود دارد که هیچ فروشی را نشان نمی دهد و احتمال آن چنین است:
P(0) = .512
سه نتیجه وجود دارد که نشان دهنده یک فروش است که هر کدام با احتمال .128 وجود دارد ، بنابراین این احتمالات را اضافه می کنیم. بدین ترتیب،
P(1) = .128 + .128 + .128 = 3(.128) = .384
احتمال دو فروش به طور مشابه محاسبه می شود:
P(2) = 3(.032) = .096
یک نتیجه هم وجود دارد با سه فروش:
P(3) = .008
توزیع احتمال X در جدول زیر ذکر شده است:
x P(x)
0 .512
1 .384
2 .096
3 .008
برچسبها: متغیر تصادفی, توزیع احتمال گسسته

