فهرست مطالب وبلاگ
در مباحث قبلی، تکنیک های تصویری و جدولی برای تلخیص مجموعه ای از داده های اسمی ارائه شد؛ تکنیک های مورد استفاده برای مجموعه واحدی از داده ها تک متغیره (univariate) نامیده می شود. موقعیت هایی وجود دارد که تمایل داریم رابطه بین متغیرها را نشان دهیم. در این موارد، روش های دومتغیره (bivariate) مورد نیاز است. یک جدول طبقه بندی متقاطع (cross- classification table) که جدول بندی متقاطع (cross- tabulation) هم نامیده می شود، برای توصیف رابطه دو متغیر اسمی به کار می رود. همچنین از نمودارهای ستونی جهت توصیف تصویری این رابطه استفاده می شود. از همین تکنیک برای مقایسه دو یا چند مجموعه داده های اسمی نیز استفاده می شود.
روش های جدولی توصیف رابطه بین دو متغیر اسمی
برای توصیف رابطه دو متغیر اسمی، باید حتما به یاد داشته باشیم که فقط مجازیم فراوانی متغیرها را تعیین نماییم. در اولین گام، نیاز است که یک جدول طبقه بندی متقاطع ایجاد نماییم که فراوانی هر ترکیبی از مقادیر دو متغیر را فهرست می کند.
اگر دو متغیر باهم ارتباط داشته باشند، اختلاف هایی معنادار در اعداد جدول ملاحظه خواهد شد. یک راه ساده برای مشاهده این موضوع، تبدیل فراوانی ها در هر سطر (ستون) به فراوانی های نسبی در هر سطر (ستون) است. این یعنی محاسبه جمع سطر (ستون) و تقسیم هر فراوانی بر جمع آن سطر (ستون).
ترسیم رابطه دو متغیر اسمی
چندین راه برای نمایش تصویری رابطه بین دو متغیر اسمی وجود دارد. مثلا می توان از نمودارهای دو بعدی میله ای استفاده کرد. این نمودارها از خروجی جدول های محوری (Pivot Table) نیز قابل ترسیم هستند (با استفاده از فراوانی یا فراوانی نسبی). اگر دو متغیر با هم مرتبط نباشند، الگوهای به نمایش در آمده در نمودارهای میله ای باید تقریبا یکی باشند. اگر مقدار رابطه ای وجود داشته باشد، آنگاه بعضی نمودارهای میله ای متفاوت از بقیه خواهند بود.
عواملی که تعیین می کند چه زمانی از جدول طبقه بندی متقاطع استفاده شود:
- هدف: توصیف رابطه بین دو متغیر و مقایسه دو یا چند مجموعه داده ها
- نوع داده ها: اسمی
برچسبها:
رابطه دو متغیر اسمی