آشنایی با آزمون کای اسکوئر استقلال
در این مقاله آزمون کای اسکوئر استقلال (Chi-square test of independence) را با مثال بررسی میکنیم.
بطور کلی آزمون کای اسکوئر پیرسون برای سه موضوع مورد استفاده قرار میگیرد.
- نیکویی برازش
- همگنی
- استقلال
آزمون نیکویی برازش و همگنی کای اسکوئر را قبلاً بررسی کردهایم. در این مقاله آزمون کای اسکوئر استقلال را مورد بررسی قرار میدهیم.
کاربرد آزمون کای اسکوئر استقلال
اگر بخواهیم رابطه بین دو متغیر با مقیاس اسمی را بررسی کنیم از آزمون کای اسکوئر استقلال استفاده میکنیم. بنابراین این آزمون بر مبنای یک نمونه است که در آن دو یا چند متغیر اسمی اندازهگیری کردهایم. در این آزمون سنجش میکنیم که آیا این متغیرها مستقل از هم هستند یا خیر؟
مثال آزمون کای اسکوئر استقلال
فرض کنید 8100 فرد تصادفی از یک جمعیت انتخاب کردهایم. دو متغیر سرطان ریه و سیگار کشیدن را نیز در این افراد اندازهگیری کردهایم. حالا میتوانیم از آزمون کای اسکوئر استقلال استفاده کنیم تا ببینیم آیا بین سرطان ریه و مصرف سیگار رابطه وجود دارد؟
روش انجام آزمون کای اسکوئر استقلال با آزمون همگنی کای اسکوئر دقیقاً مشابه است. با این تفاوت که آزمون همگنی کای اسکوئر اختلاف فراوانی را بین دو نمونه بررسی میکند. اما آزمون کای اسکوئر استقلال، ارتباط بین دو متغیر را در یک نمونه بررسی میکند.
ابتدا جدول دو طرفه متقاطع را رسم میکنیم:
شکل 1. جدول متقاطع برای دو متغیر سرطان ریه و مصرف سیگار
آزمون فرضیات
به منظور بررسی رابطه بین سرطان ریه و مصرف سیگار، ابتدا آزمون فرضیات را مانند زیر مینویسیم:
H0: بین سیگاری بودن و سرطان ریه رابطه وجود ندارد.
H1: بین سیگاری بودن و سرطان ریه رابطه وجود دارد.
با دقت در شکل 1 در مییابیم که از افراد سرطانی، 60 % سیگاری بودهاند. اما از افراد غیر سرطانی، تنها 10 درصد سیگاری بودهاند.
محاسبه آماره کای اسکوئر
فرمول محاسبه آماره کای اسکوئر به شرح زیر است:
در این فرمول O، فراوانی مشاهدهای و E فراوانی مورد انتظار را نشان میدهد. قبلاً در طی مقالهای بطور مفصل نحوه محاسبه آماره کای اسکوئر از طریق فراوانیهای مشاهدهای و مورد انتظار را بررسی کردهایم. چنانچه با مراحل محاسبه آماره کای اسکوئر آشنا نیستید میتوانید از مقاله مذکور مطالعه کنید.
اگر با استفاده از این فرمول مقدار آماره کای اسکوئر را محاسبه کنیم، این مقدار 260 میشود.
محاسبه P-value و نتیجهگیری
مقدار P-value برای آماره کای اسکوئر 260 و درجه آزادی 1 را میتوانیم از یک نرم افزار آماری بدست بیاوریم. مقدار P-value، در این آزمایش 0.001> بدست آمد. چون مقدار P-value کمتر از آلفا 0.05 است، میتوانیم فرض صفر (H0) را رد کنیم و نتیجه بگیریم که بین سرطان ریه و سیگاری بودن رابطه وجود دارد.
مطابق شکل 1، نسبت بزرگی از سیگاریها (60 درصد) در گروه سرطان ریه قرار دارند.
نکته مهم در تفسیر نتایج آزمون کای اسکوئر استقلال
اگر چه دوست داریم! نتیجه بگیریم که سیگار باعث سرطان ریه میشود، اما آزمون کای اسکوئر فقط به ما میگوید بین سرطان ریه و مصرف سیگار رابطه وجود دارد و وجود رابطه هیچ دلیلی به ارتباط علّی بین این متغیر نیست.
پس نمیتوانیم نتیجه بگیریم که مصرف سیگار باعث سرطان ریه میشود. هر چند رابطه بین دو متغیر معنیدار است.
نظرات :