آشنایی با آزمون مقایسه دو نسبت (Z-test)

۰۱ بهمن ۱۴۰۲

رسول محمدی

156 بازدید

تاریخ ویرایش : 06 بهمن 1402

در این مقاله در مورد مقایسه دو نسبت (Comparing two sample proportions) و حدود اطمینان نسبت‌ها با شما صحبت می‌کنیم.

مثال برای آزمون دو نسبت

فرض کنید می‌خواهیم دو تیمار مختلف را در ارتباط با محافظت از گیاهان در برابر یک پاتوژن مقایسه کنیم. به این منظور 100 گیاه بطور تصادفی به تیمار A و 100 گیاه را به تیمار B اختصاص می‌دهیم. بعد از گذشت دو ماه میزان آلودگی در گیاهان را بررسی می‌کنیم. فرض کنید 25 درصد از گیاهان مربوط به تیمار A مبتلا به بیماری می‌شوند. در حالی‌که از گیاهان تیمار B، مقدار 31 درصد مبتلا به بیماری می‌شوند (شکل 1).

"شکل

شکل 1. درصد گیاهان آلوده در تیمارهای A و B

حالا می‌توانیم اطلاعاتمان را در یک جدول متقاطع خلاصه کنیم. شکل 2، فراوانی و درصد گیاهان بیمار و غیر بیمار را تحت دو تیمار A و B نشان می‌دهد (شکل 2).

"شکل

شکل 2. جدول متقاطع برای نمایش درصد گیاهان آلوده و غیر آلوده تحت دو تیمار A و B

مطابق شکل 2، به ترتیب 25 و 31درصد از گیاهان تحت دو تیمار A و B بیمار شدند. در جمعیت کلی نیز 28 درصد آلودگی مشاهده می‌شود.

آزمون فرضیات

برای مقایسه نسبت گیاهان بیمار بین دو تیمار A و B ابتدا آزمون فرضیات را به شرح زیر می‌نویسیم:

آزمون فرضیات برای مقایسه دو نسبت

فرض صفر (H0) در این آزمون برابری نسبت بین دو تیمار را نشان می‌دهد. در حالی‌که فرض مخالف (H1) بیان می‌کند که دو تیمار A و B با هم تفاوت معنی‌دار دارند.

مشخص کردن سطح معنی‌دار (آلفا)

ما در این آزمایش از سطح 5 درصد برای آزمون استفاده می‌کنیم.

محاسبه مقدار Z

فرمول برای مقایسه دو نسبت به شرح زیر است:

فرمول آزمون مقایسه دو نسبت

صورت کسر در این فرمول تفاوت نسبت دو نمونه را نشان می‌دهد.

در مخرج کسر نیز خطای استاندارد تفاوت نسبت دو نمونه قرار دارد. n1 و n2 به ترتیب حجم نمونه اول و دوم را نشان می‌دهد. p در مخرج کسر، نسبت ادغام شده دو نمونه را نشان می‌دهد که از فرمول زیر محاسبه می‌شود:

فرمول ادغام دو نسبت

برای محاسبه مقدار Z ابتدا باید مقدار p ادغام شده را محاسبه کنیم.

محاسبه نسبت ادغام شده

با جایگذاری مقادیر در فرمول، نسبت ادغام شده نمونه‌ها 0.28 بدست می‌آید. توجه کنید که ما اگر تعداد کل گیاهان آلوده را تقسیم بر تعداد کل گیاهان کنیم، همان نسبت ادغام شده بدست می‌آید.

در مرحله بعد با جایگذاری مقادیر در فرمول، مقدار Z را محاسبه می‌کنیم:

محاسبه مقدار Z در آزمون مقایسه دو نسبت

می‌بینیم که مقدار آماره Z برای مقایسه دو نسبت 0.94- بدست می‌آید.

محاسبه مقدار P-value

نواحی سمت راست و چپ عدد 0.94 در توزیع نرمال استاندارد، برابر با مقدار P-value است.

مقدار P-value در مقایسه دو نسبت

شکل 3. محاسبه مقدار P-value

چون مقدار P-value بزرگتر از مقدار آلفا 0.05 است، نمی‌توانیم فرض صفر (H0) را رد کنیم. بنابراین نتیجه می‌گیریم که تفاوت معنی‌دار بین نسبت‌های گیاهان بیمار دو تیمار وجود ندارد و دو تیمار از نظر کشندگی بطور برابر عمل می‌کنند.

حدود اطمینان 95 درصد نسبت‌ها

الان می‌توانیم برای تفاوت نسبت‌ها حدود اطمینان 95% محاسبه کنیم. فرمول حدود اطمینان تفاوت نسبت‌ها به شرح زیر است:

حدود اطمینان تفاوت دو نسبت

از محاسبات قبلی تفاوت نسبت دو نمونه را 0.06- بدست آوردیم. خطای استاندارد تفاوت نسبت دو نمونه نیز 0.0635 محاسبه شد. از مقاله مربوط به توزیع نرمال نیز به خاطر دارید که مقدار بحرانی حد بالا که باعث پوشش 95 درصدی توزیع نرمال استاندارد می‌شود، 1.96 است. حالا با استفاده از فرمول می‌توانیم حدود اطمینان محاسبه کنیم.

محاسبه حدود اطمینان نسبت‌ها

پس از عملیات ریاضی، بازه حدود اطمینان 0.184- تا 0.064 بدست می‌آید.

توجه کنید که این حدود اطمینان، عدد صفر را در بر می‌گیرد و عدد صفر برای این بازه اطمینان عددی کاملاً منطقی است. این به این معنی است که ما نمی‌توانیم فرض صفر (H0) خود را رد کنیم. این همان نتیجه‌ای است که در مرحله قبل از P-value بدست آوردیم.

آزمون کای اسکوئر

ما می‌توانیم به جای آزمون Z از آزمون همگنی کای اسکوئر برای مقایسه دو نسبت استفاده کنیم که در مقاله جداگانه این آزمون را بررسی می‌کنیم.