۰۹۳۸۴۲۲۶۷۳۸

آشنایی با آزمون همگنی کای اسکوئر

در این مقاله با آزمون همگنی کای اسکوئر (Chi-square test of homogeneity) آشنا می‌شویم.

تعریف آزمون همگنی کای اسکوئر

برای مقایسه دو یا چند نسبت نمونه‌ای، از آزمون همگنی کای اسکوئر استفاده می‌کنیم. این آزمون فراوانی‌های مشاهده‌ای را نسبت به فراوانی‌های مورد انتظار در جدول متقاطع مقایسه می‌کند.

مثال برای آزمون همگنی کای اسکوئر

فرض کنید می‌خواهیم دو تیمار مختلف را در ارتباط با محافظت از گیاهان در برابر یک پاتوژن مقایسه کنیم. به این منظور 100 گیاه بطور تصادفی به تیمار A و 100 گیاه را به تیمار B اختصاص می‌دهیم. بعد از گذشت دو ماه میزان آلودگی در گیاهان را بررسی می‌کنیم. فرض کنید 25 درصد از گیاهان مربوط به تیمار A آلوده شوند. در حالی‌که از گیاهان تیمار B مقدار 31 درصد مبتلا به بیماری شوند (شکل 1).

"شکل

شکل 1. درصد گیاهان آلوده در تیمارهای A و B

حالا می‌توانیم اطلاعاتمان را در یک جدول متقاطع خلاصه کنیم. شکل 2، فراوانی و درصد گیاهان آلوده و غیر آلوده را تحت دو تیمار A و B نشان می‌دهد (شکل 2).

"شکل

شکل 2. جدول متقاطع برای نمایش درصد گیاهان آلوده و غیر آلوده تحت دو تیمار A و B

مطابق شکل 2، به ترتیب 25 و 31درصد از گیاهان تحت دو تیمار A و B آلوده شدند. در جمعیت کلی نیز 28 درصد آلودگی مشاهده می‌شود.

به منظور مقایسه فراوانی گیاهان بیمار و غیر بیمار بین دو جمعیت A و B از آزمون همگنی کای اسکوئر استفاده می‌کنیم.

آزمون فرضیات

برای مقایسه نسبت گیاهان آلوده بین دو تیمار A و B ابتدا آزمون فرضیات را به شرح زیر می‌نویسیم:

آزمون فرضیات همگنی کای اسکوئر

فرض صفر (H0) در این آزمون برابری نسبت گیاهان آلوده بین دو تیمار را نشان می‌دهد. در حالی‌که فرض مخالف (H1) بیان می‌کند که دو تیمار A و B با هم تفاوت معنی‌دار دارند.

مشخص کردن سطح معنی‌دار (آلفا)

ما در این آزمایش از سطح 5 درصد برای آزمون استفاده می‌کنیم.

مقدار آلفا

محاسبه آماره کای اسکوئر

فرمول آزمون همگنی کای اسکوئر دقیقاً برابر با فرمول آزمون نیکویی برازش کای اسکوئر است.

فرمول آماره کای اسکوئر

در این فرمول، O، فراوانی مشاهده‌ای و E فراوانی مورد انتظار را نشان می‌دهد.

فراوانی‌های مشاهده‌ای

فراوانی‌های مشاهده‌ای در جدول متقاطع ما کاملاً مشخص هستند (2). به این ترتیب که برای تیمار A، 25 گیاه آلوده و برای تیمار B، 31 گیاه آلوده مشاهده می‌شود.

فراوانی‌های مورد انتظار

برای هر یک از سلول‌های جدول متقاطع باید فراوانی مورد انتظار محاسبه کنیم. مثلاً فراوانی مورد انتظار سلول واقع در ردیف و ستون اول با فرمول زیر محاسبه می‌شود:

فراوانی مورد انتظار در آزمون همگنی کای اسکوئر

در این فرمول R1، تعداد کل موارد در ردیف اول را نشان می‌دهد. برای مثال R1 برابر با 56 است. حرف N، تعداد کل موارد موجود در آزمایش را نشان می‌دهد. در آزمایش ما بطور کل 200 مورد وجود دارد. حرف C1 تعداد کل موارد در ستون اول را نشان می‌دهد. در تحقیق ما 100 مورد در ستون اول وجود دارد. با عملیات ریاضی می‌توانیم فراوانی مورد انتظار سلول اول (28) را بدست بیاوریم.

حالا با استفاده از موارد موجود در ردیف و ستون‌های هر یک از سلول‌ها می‌توانیم فراوانی‌های مورد انتظار سایر سلول‌های جدول را نیز بدست بیاوریم (شکل 3).

شکل 3. فراوانی‌های مشاهده‌ای و مورد انتظار در آزمون همگنی کای اسکوئر

شکل 3. فراوانی‌های مشاهده‌ای و مورد انتظار

محاسبه آماره کای اسکوئر

الان با استفاده از مقادیر مشاهده‌ای و مورد انتظار می‌توانیم آماره کای اسکوئر را محاسبه کنیم.

محاسبه آماره کای اسکوئر

برای هر سلول باید فراوانی مورد انتظار را از فراوانی مشاهده‌ای کم کنیم. عدد حاصل را به توان دو برسانیم و تقسیم بر فراوانی مورد انتظار کنیم. نهایتاً اعداد مربوط به تمام سلول‌ها را با هم جمع کنیم. در آزمایش ما آماره کای اسکوئر را 0.89 آوردیم.

درجه آزادی برای این آزمون برابر است:

df = (R-1)(C-1)

در این فرمول R تعداد ردیف و C تعداد ستون را نشان می‌دهد. چون تعداد ستون و جدول در این مثال 2 است، درجه آزادی ما 1 بدست می‌آید.

پس باید از توزیع کای اسکوئر با درجه آزادی 1 استفاده کنیم.

محاسبه مقدار P-value و نتیجه گیری

می‌توانیم برای محاسبه مقدار P-value از یک نرم افزار آماری استفاده کنیم. ناحیه سمت راست عدد 0.89 مقدار P-value را به ما نشان می‌دهد (شکل 4).

توزیع کای اسکوئر و P-value

شکل 4. محاسبه مقدار P-value در آزمون کای اسکوئر

در این آزمایش مقدار P-value را 0.34 بدست آورده‌ایم. اگر مقاله مربوط به آزمون مقایسه دو نسبت را مطالعه کرده‌ باشید، می‌دانید که این مقدار دقیقاً همان مقداری است که از آزمون دو نسبت بدست آورده‌ایم.

نکات مهم در مورد آزمون همگنی کای اسکوئر

  • هر چه تفاوت بین فراوانی‌های مورد انتظار و مشاهده‌ای بیشتر باشد، آماره کای اسکوئر بزرگتر و احتمال معنی‌داری آزمون بیشتر می‌شود.
  • شرط لازم برای انجام آزمون کای اسکوئر این است که تمام خانه‌های جدول حداقل فراوانی مورد انتظار 5 داشته باشند. اگر این شرط برقرار نباشد از آزمون‌های حقیقی مانند آزمون واقعی فیشر (Fisher’s exact test) استفاده می‌کنیم.
  • یکی از مزایای آزمون همگنی کای اسکوئر نسبت به آزمون دو نسبت (Z-test) این است که ما می‌توانیم مقایسات را برای بیش دو گروه نیز داشته باشیم.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *