۰۹۳۸۴۲۲۶۷۳۸

آشنایی با آزمون کای اسکوئر استقلال

در این مقاله آزمون کای اسکوئر استقلال (Chi-square test of independence) را با مثال بررسی می‌کنیم.

بطور کلی آزمون کای اسکوئر پیرسون برای سه موضوع مورد استفاده قرار می‌گیرد.

آزمون نیکویی برازش و همگنی کای اسکوئر را قبلاً بررسی کرده‌ایم. در این مقاله آزمون کای اسکوئر استقلال را مورد بررسی قرار می‌دهیم.

کاربرد آزمون کای اسکوئر استقلال

اگر بخواهیم رابطه بین دو متغیر با مقیاس اسمی را بررسی کنیم از آزمون کای اسکوئر استقلال استفاده می‌کنیم. بنابراین این آزمون بر مبنای یک نمونه است که در آن دو یا چند متغیر اسمی اندازه‌گیری کرده‌ایم. در این آزمون سنجش می‌کنیم که آیا این متغیرها مستقل از هم هستند یا خیر؟

مثال آزمون کای اسکوئر استقلال

فرض کنید 8100 فرد تصادفی از یک جمعیت انتخاب کرده‌ایم. دو متغیر سرطان ریه و سیگار کشیدن را نیز در این افراد اندازه‌گیری کرده‌ایم. حالا می‌توانیم از آزمون کای اسکوئر استقلال استفاده کنیم تا ببینیم آیا بین سرطان ریه و مصرف سیگار رابطه وجود دارد؟

روش انجام آزمون کای اسکوئر استقلال با آزمون همگنی کای اسکوئر دقیقاً مشابه است. با این تفاوت که آزمون همگنی کای اسکوئر اختلاف فراوانی را بین دو نمونه بررسی می‌کند. اما آزمون کای اسکوئر استقلال، ارتباط بین دو متغیر را در یک نمونه بررسی می‌کند.

ابتدا جدول دو طرفه متقاطع را رسم می‌کنیم:

جدول متقاطع برای آزمون کای اسکوئر استقلال

شکل 1. جدول متقاطع برای دو متغیر سرطان ریه و مصرف سیگار

آزمون فرضیات

به منظور بررسی رابطه بین سرطان ریه و مصرف سیگار، ابتدا آزمون فرضیات را مانند زیر می‌نویسیم:

H0: بین سیگاری بودن و سرطان ریه رابطه وجود ندارد.

H1: بین سیگاری بودن و سرطان ریه رابطه وجود دارد.

با دقت در شکل 1 در می‌یابیم که از افراد سرطانی، 60 % سیگاری بوده‌اند. اما از افراد غیر سرطانی، تنها 10 درصد سیگاری بوده‌اند.

محاسبه آماره کای اسکوئر

فرمول محاسبه آماره کای اسکوئر به شرح زیر است:

فرمول محاسبه آماره کای اسکوئر

در این فرمول O، فراوانی مشاهده‌ای و E فراوانی مورد انتظار را نشان می‌دهد. قبلاً در طی مقاله‌ای بطور مفصل نحوه محاسبه آماره کای اسکوئر از طریق فراوانی‌های مشاهده‌ای و مورد انتظار را بررسی کرده‌ایم. چنانچه با مراحل محاسبه آماره کای اسکوئر آشنا نیستید می‌توانید از مقاله مذکور مطالعه کنید.

اگر با استفاده از این فرمول مقدار آماره کای اسکوئر را محاسبه کنیم، این مقدار 260 می‌شود.

محاسبه آماره کای اسکوئر

محاسبه P-value و نتیجه‌گیری

مقدار P-value برای آماره کای اسکوئر 260 و درجه آزادی 1 را می‌توانیم از یک نرم افزار آماری بدست بیاوریم. مقدار P-value، در این آزمایش 0.001> بدست آمد. چون مقدار P-value کمتر از آلفا 0.05 است، می‌توانیم فرض صفر (H0) را رد کنیم و نتیجه بگیریم که بین سرطان ریه و سیگاری بودن رابطه وجود دارد.

مطابق شکل 1، نسبت بزرگی از سیگاری‌ها (60 درصد) در گروه سرطان ریه قرار دارند.

نکته مهم در تفسیر نتایج آزمون کای اسکوئر استقلال

اگر چه دوست داریم! نتیجه بگیریم که سیگار باعث سرطان ریه می‌شود، اما آزمون کای اسکوئر فقط به ما می‌گوید بین سرطان ریه و مصرف سیگار رابطه وجود دارد و وجود رابطه هیچ دلیلی به ارتباط علّی بین این متغیر نیست.

پس نمی‌توانیم نتیجه بگیریم که مصرف سیگار باعث سرطان ریه می‌شود. هر چند رابطه بین دو متغیر معنی‌دار است.

رسول محمدی

برای مشاوره یا انجام پژوهش‌های آماری در تلگرام یا ایتا با شماره 09384226738 بطور مستقیم با من در ارتباط باشید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

4 × 3 =