مدیر هوشمند
 
مطالب مفید مدیریتی

محل درج آگهی و تبلیغات
 
نوشته شده در تاريخ سه شنبه بیست و چهارم مهر ۱۳۹۷ توسط یاسر پورداور

فهرست مطالب وبلاگ

شاید بتوان گفت واریانس و مقدار وابسته به آن یعنی انحراف معیار (خطای استاندارد) مهمترین آماره ها هستند؛ زیرا اگرچه برای اندازه گیری تغییرات استفاده می شوند، اما نقش بسیار مهمی در تقریبا تمام روش های استنباط آماری بازی می کنند:

واریانس جامعه آماری:

فرمول واریانس نمونه آماری:

واریانس جامعه آماری با عبارت σ2 (حرف یونانی سیگما به توان دو) نشان داده می شود.


برچسب‌ها: واریانس, Variance, مقادیر پراکندگی, فرمول های آماری

ادامه مطلب
نوشته شده در تاريخ سه شنبه بیست و چهارم مهر ۱۳۹۷ توسط یاسر پورداور

فهرست مطالب وبلاگ

 

   

   مزیت دامنه تغییرات سادگی آن است. اشکال آن هم سادگی آن است! زیرا فقط با استفاده از دو مشاهده محاسبه می شود و در مورد سایر مشاهدات چیزی به ما نمی گوید. برای مثال، دو مجموعه داده های زیر را در نظر بگیرید:

مجموعه1: 4,4,4,4,4,50

مجموعه2: 4,8,15,24,39,50

  دامنه تغییرات هر دو مجموعه 46 است؛ اما این دو مجموعه داده ها کاملا متفاوت هستند، علیرغم اینکه دامنه تغییرات آنها یکسان است. لذا برای محاسبه تغییرات، به آماره های دیگری نیاز داریم که تمام داده ها و نه فقط دو مشاهده را ترکیب کند.


برچسب‌ها: دامنه تغییرات, Range, مقادیر پراکندگی, فرمول های آماری
نوشته شده در تاريخ سه شنبه بیست و چهارم مهر ۱۳۹۷ توسط یاسر پورداور

فهرست مطالب وبلاگ

 

   علاوه بر مقادیر مرکزی، ویژگی های دیگری نیز مورد علاقه متخصصان آماری هستند؛ یکی از این ویژگی ها گستره یا تغییرات داده ها است. در این خصوص چهار مقدار پراکندگی را مطرح خواهیم کرد:

  1. دامنه (Range)
  2. واریانس (Variance)
  3. خطای استاندارد (Standard Deviation)
  4. ضریب تغییرات (Coefficient of Variation)

برچسب‌ها: مقادیر پراکندگی, Measures of Variability
نوشته شده در تاريخ یکشنبه بیست و دوم مهر ۱۳۹۷ توسط یاسر پورداور

فهرست مطالب وبلاگ

 

   میانگین حسابی معروف ترین و مفیدترین مقدار مرکزی داده ها است. با این حال، موقعیت هایی وجود دارد که میانه، مقدار مرکزی بهتری است. اما شرط دیگری هم وجود دارد که هیچکدام از مقادیر میانگین و میانه، دیگر بهترین نیستند. وقتی که متغیر نرخ رشد یا نرخ تغییر باشد، همانند مقدار یک سرمایه گذاری طی دوره زمانی، آنگاه به مقدار دیگری نیاز داریم.

مثال: فرض کنید یک سرمایه گذاری دو ساله به مقدار 1000 دلار انجام داده اید و طی سال اول این سرمایه گذاری به میزان 100% تا مقدار 2000 دلار رشد می کند. اما طی سال دوم ارزش سرمایه گذاری با 50% ضرر از 2000 دلار به 1000 دلار باز می گردد. نرخ های بازگشت برای سال های اول و دوم برابر است با:

R1=100% و R2=-50%

میانگین حسابی چنین محاسبه می شود:

 اما این نتیجه گمراه کننده است، زیرا از ابتدا تا انتهای دو سال تغییری در ارزش سرمایه گذاری ایجاد نشده است و در نهایت میانگین نرخ بازگشت مرکب برابر 0% است. اما این مقدار حاصل محاسبه میانگین هندسی است که به صورت زیر به دست می آید:

 اگر Ri نشان دهنده نرخ بازگشت (اعشاری) در دوره های i باشد که در آن i=1,2,...,n، آنگاه میانگین هندسی یا Rg محاسبه شده برای نرخ های بازگشت R1,R2,...,Rn چنین تعریف می شود:

 که اگر برای Rg حل شود، فرمول ذیل ایجاد می شود:

 لذا میانگین هندسی محاسبه شده در مثال ما برابر خواهد بود با:

   بنابراین میانگین هندسی برابر 0% است. با این عدد می توانیم با استفاده از مقدار اولیه، ارزش سرمایه گذاری را در انتهای دوره سرمایه گذاری محاسبه کنیم:

   هر زمان که بخواهیم میانگین نرخ رشد یا نرخ تغییرات یک متغیر را در طی یک دوره زمانی محاسبه کنیم، از میانگین هندسی استفاده می کنیم.

نکته مهم: اگر بخواهیم میانگین نرخ بازگشت (یا نرخ رشد) را برای یک دوره زمانی خاص در آینده محاسبه کنیم، آنگاه میانگین حسابی n تعداد نرخ بازگشت (یا نرخ رشد) مناسب است. برای مثال بالا اگر بخواهیم نرخ بازگشت را در سال سوم برآورد کنیم، از میانگین حسابی دو نرخ بازگشت سالیانه استفاده می کنیم که نتیجه 25% خواهد بود.

نکته: عواملی که تعیین می کند چه زمانی از میانگین هندسی استفاده شود:

  1. هدف: توصیف مجموعه واحدی از داده ها باشد
  2. نوع داده ها: فاصله ای، نرخ های رشد باشد

برچسب‌ها: میانگین هندسی Geometric Mean, فرمول های آماری
نوشته شده در تاريخ یکشنبه بیست و دوم مهر ۱۳۹۷ توسط یاسر پورداور

فهرست مطالب وبلاگ

 

   زمانی که داده ها فاصله ای است، می توانیم هر کدام از سه مقدار مرکزی را استفاده کنیم. اما محاسبه میانگین برای داده های ترتیبی و اسمی معتبر نیست. از آنجا که محاسبه میانه با مرتب سازی داده ها شروع می شود، این آماره برای داده های ترتیبی مناسب است. مد که با شمارش فراوانی هر مشاهده تعیین می شود، برای داده های اسمی مناسب است. اما داده های اسمی مرکز ندارند، بنابراین نمی توانیم مد داده های اسمی را به همان روش تفسیر کنیم. معمولا محاسبه مد داده های اسمی بی معنا است.


برچسب‌ها: داده های ترتیبی, داده های اسمی, مقادیر مرکزی
نوشته شده در تاريخ شنبه بیست و یکم مهر ۱۳۹۷ توسط یاسر پورداور

فهرست مطالب وبلاگ

 

   با توجه به معرفی سه مقدار برای سنجش مرکز داده ها (میانگین حسابی، میانه، مد)، کدامیک را انتخاب کنیم؟ چندین عامل در هنگام انتخاب مقدار مناسب برای سنجش مرکز داده ها تعیین کننده است. معمولا میانگین اولین انتخاب ما است؛ اما شرایطی هم وجود دارد که میانه بهتر است. میانه به ندرت بهترین مقدار برای نشان دادن مرکز داده ها است.

  • مزیت میانه نسبت به میانگین: یکی از مزیت هایی که میانه دارد، این است که به اندازه میانگین نسبت به مقادیر پرت (Extreme Values) حساس نیست. وقتی که تعداد خیلی کمی از مشاهدات پرت وجود دارد (مقادیر خیلی کوچک یا خیلی بزرگ، اما نه هر دو)، معمولا میانه مقدار محاسبه شده بهتری را برای مرکز داده ها ارائه می کند.
  • مزیت دیگر میانه نسبت به میانگین: زمانی که بخواهیم برای مثال نمره خود را نسبت به بقیه کلاس بسنجیم تا ببینیم که چقدر خوب عمل کرده ایم، به نظرتان کدام مقدار بهتر است؟ آیا میانگین بهتر است؟ اکثر افراد به دنبال مقایسه نمره خود با میانگین کلاس هستند، در حالی که این درست نیست. درست این است که به دنبال میانه باشیم چون کلاس را به دو قسمت تقسیم می کند و با این کار مشخص می شود که نمره ما در کدام نیمه قرار دارد.

خلاصه تکنیک های عددی معرفی شده بدین شرح است:

عوامل تعیین کننده در استفاده از میانگین حسابی (Mean):

  • هدف: توصیف مجموعه ای از داده ها
  • نوع داده ها: فاصله ای
  • مقدار توصیفی: نقطه مرکزی

عوامل تعیین کننده در استفاده از میانه (Median):

  • هدف: توصیف مجموعه ای از داده ها
  • نوع داده ها: ترتیبی یا فاصله ای (با مشاهدات پرت)
  • مقدار توصیفی: نقطه مرکزی

عوامل تعیین کننده در استفاده از مد (Mode):

  • هدف: توصیف مجموعه ای از داده ها
  • نوع داده ها: اسمی، ترتیبی، فاصله ای

عوامل تعیین کننده در استفاده از میانگین هندسی (Geometric Mean):

  • هدف: توصیف مجموعه ای از داده ها
  • نوع داده ها: فاصله ای، نرخ های رشد (growth rates)

برچسب‌ها: میانگین حسابی, میانه, مد
نوشته شده در تاريخ دوشنبه شانزدهم مهر ۱۳۹۷ توسط یاسر پورداور
فهرست مطالب وبلاگ

   سومین و آخرین مقدار مرکزی، مد یا نما (Mode) است. مد به عنوان مشاهده (یا مشاهده هایی) با بیشترین فراوانی تعریف می شود. آماره و پارامتر آن به یک شکل محاسبه می شود. برای جامعه های آماری و نمونه های بزرگ، بهتر است طبقه مد دار (Modal Class) گزارش شود.

   نکته ای که در استفاده از مد باید مورد توجه قرار گیرد این است که گاهی مد محاسبه شده به هیچ وجه نزدیک مرکز داده ها نیست و فاصله زیادی با آن دارد. از این لحاظ مد را مقدار ضعیفی برای مرکز داده ها دانسته اند.

نکته: عواملی که تعیین می کند چه زمانی از مد استفاده شود:

  1. هدف: توصیف مجموعه واحدی از داده ها باشد
  2. نوع داده ها: اسمی، ترتیبی، فاصله ای باشد

برچسب‌ها: مد یا نما Mode, مقادیر مرکزی داده ها
نوشته شده در تاريخ دوشنبه شانزدهم مهر ۱۳۹۷ توسط یاسر پورداور
فهرست مطالب وبلاگ

   میانه با جاگذاری به ترتیب تمام مشاهده ها (صعودی یا نزولی) محاسبه می شود. مشاهده ای که در وسط قرار می گیرد، میانه است. میانه های نمونه و جامعه آماری به یک روش محاسبه می شوند. وقتی تعداد مشاهدات زوج باشد، میانه با محاسبه میانگین حسابی دو مشاهده وسط تعیین می شود. نصف مشاهدات کمتر از میانه و نصف دیگر بیشتر از میانه هستند.

نکته: عواملی که تعیین می کند چه زمانی از میانه استفاده شود:

  1. هدف: توصیف مجموعه واحدی از داده ها باشد
  2. نوع داده ها: ترتیبی یا فاصله ای (با مشاهدات پرت) باشد
  3. مقدار توصیفی: مرکز داده ها باشد

 


برچسب‌ها: میانه Median, مقادیر مرکزی داده ها
نوشته شده در تاريخ دوشنبه شانزدهم مهر ۱۳۹۷ توسط یاسر پورداور

فهرست مطالب وبلاگ

 

   سه مقدار متفاوت وجود دارد که برای توصیف مرکز یک مجموعه داده ها استفاده می شود. اولین آنها که شناخته شده تر هم هست، «میانگین حسابی» است که به طور خلاصه با عنوان میانگین (Mean) مورد اشاره قرار می گیرد. نام دیگر آن نیز Average است. این میانگین از طریق جمع کردن مشاهده ها و تقسیم حاصل جمع بر تعداد مشاهده ها محاسبه می شود.

   مشاهدات یک نمونه به صورت x1, x2,..., xn نشان داده می شود که در آن x1 اولین مشاهده است، x2 دومین مشاهده است و مانند آن تا xn ، و n اندازه نمونه است، و میانگین نمونه با x بار نشان داده می شود. در یک جامعه آماری، تعداد مشاهده ها با N نشان داده می شود و میانگین جامعه هم با «مو» (حرف یونانی):

میانگین حسابی جامعه آماری:

 

میانگین حسابی نمونه:

نکته: عواملی که تعیین می کند چه زمانی از میانگین حسابی استفاده شود:

  1. هدف: توصیف مجموعه واحدی از داده ها باشد
  2. نوع داده ها: فاصله ای باشد
  3. مقدار توصیفی: مرکز داده ها باشد

برچسب‌ها: میانگین حسابی Arithmetic Mean, مقادیر مرکزی داده ها, فرمول های آماری
نوشته شده در تاريخ دوشنبه شانزدهم مهر ۱۳۹۷ توسط یاسر پورداور
فهرست مطالب وبلاگ

   یک پارامتر (Parameter) یک مقدار توصیفی درباره جامعه آماری است و یک آماره (Statistic) یک مقدار توصیفی درباره یک نمونه است. در بیشتر کاربردهای واقعی، جوامع آماری بسیار بزرگ و عملا بی نهایت هستند، لذا فرمول های توصیفی محاسبه پارامترها کاربردی نیستند و به ندرت استفاده می شوند. بیان آنها عمدتا برای تدریس و درک مفاهیم است. لذا مجموعه داده های کوچک عمدتا به عنوان نمونه مطرح هستند.

   البته در بحث توزیع های احتمال (probability distributions) که با استفاده از آنها جوامع آماری توصیف می شوند، نشان داده می شود که پارامترها چگونه با از توزیع های احتمال محاسبه می شوند.


برچسب‌ها: پارامتر, آماره
.: Weblog Themes By Pichak :.


تمامی حقوق این وبلاگ محفوظ است | طراحی : پیچک