آشنایی با آزمون مقایسه دو نسبت (Z-test)
در این مقاله در مورد مقایسه دو نسبت (Comparing two sample proportions) و حدود اطمینان نسبتها با شما صحبت میکنیم.
مثال برای آزمون دو نسبت
فرض کنید میخواهیم دو تیمار مختلف را در ارتباط با محافظت از گیاهان در برابر یک پاتوژن مقایسه کنیم. به این منظور 100 گیاه بطور تصادفی به تیمار A و 100 گیاه را به تیمار B اختصاص میدهیم. بعد از گذشت دو ماه میزان آلودگی در گیاهان را بررسی میکنیم. فرض کنید 25 درصد از گیاهان مربوط به تیمار A مبتلا به بیماری میشوند. در حالیکه از گیاهان تیمار B، مقدار 31 درصد مبتلا به بیماری میشوند (شکل 1).
شکل 1. درصد گیاهان آلوده در تیمارهای A و B
حالا میتوانیم اطلاعاتمان را در یک جدول متقاطع خلاصه کنیم. شکل 2، فراوانی و درصد گیاهان بیمار و غیر بیمار را تحت دو تیمار A و B نشان میدهد (شکل 2).
شکل 2. جدول متقاطع برای نمایش درصد گیاهان آلوده و غیر آلوده تحت دو تیمار A و B
مطابق شکل 2، به ترتیب 25 و 31درصد از گیاهان تحت دو تیمار A و B بیمار شدند. در جمعیت کلی نیز 28 درصد آلودگی مشاهده میشود.
آزمون فرضیات
برای مقایسه نسبت گیاهان بیمار بین دو تیمار A و B ابتدا آزمون فرضیات را به شرح زیر مینویسیم:
فرض صفر (H0) در این آزمون برابری نسبت بین دو تیمار را نشان میدهد. در حالیکه فرض مخالف (H1) بیان میکند که دو تیمار A و B با هم تفاوت معنیدار دارند.
مشخص کردن سطح معنیدار (آلفا)
ما در این آزمایش از سطح 5 درصد برای آزمون استفاده میکنیم.
محاسبه مقدار Z
فرمول برای مقایسه دو نسبت به شرح زیر است:
صورت کسر در این فرمول تفاوت نسبت دو نمونه را نشان میدهد.
در مخرج کسر نیز خطای استاندارد تفاوت نسبت دو نمونه قرار دارد. n1 و n2 به ترتیب حجم نمونه اول و دوم را نشان میدهد. p در مخرج کسر، نسبت ادغام شده دو نمونه را نشان میدهد که از فرمول زیر محاسبه میشود:
برای محاسبه مقدار Z ابتدا باید مقدار p ادغام شده را محاسبه کنیم.
با جایگذاری مقادیر در فرمول، نسبت ادغام شده نمونهها 0.28 بدست میآید. توجه کنید که ما اگر تعداد کل گیاهان آلوده را تقسیم بر تعداد کل گیاهان کنیم، همان نسبت ادغام شده بدست میآید.
در مرحله بعد با جایگذاری مقادیر در فرمول، مقدار Z را محاسبه میکنیم:
میبینیم که مقدار آماره Z برای مقایسه دو نسبت 0.94- بدست میآید.
محاسبه مقدار P-value
نواحی سمت راست و چپ عدد 0.94 در توزیع نرمال استاندارد، برابر با مقدار P-value است.
شکل 3. محاسبه مقدار P-value
چون مقدار P-value بزرگتر از مقدار آلفا 0.05 است، نمیتوانیم فرض صفر (H0) را رد کنیم. بنابراین نتیجه میگیریم که تفاوت معنیدار بین نسبتهای گیاهان بیمار دو تیمار وجود ندارد و دو تیمار از نظر کشندگی بطور برابر عمل میکنند.
حدود اطمینان 95 درصد نسبتها
الان میتوانیم برای تفاوت نسبتها حدود اطمینان 95% محاسبه کنیم. فرمول حدود اطمینان تفاوت نسبتها به شرح زیر است:
از محاسبات قبلی تفاوت نسبت دو نمونه را 0.06- بدست آوردیم. خطای استاندارد تفاوت نسبت دو نمونه نیز 0.0635 محاسبه شد. از مقاله مربوط به توزیع نرمال نیز به خاطر دارید که مقدار بحرانی حد بالا که باعث پوشش 95 درصدی توزیع نرمال استاندارد میشود، 1.96 است. حالا با استفاده از فرمول میتوانیم حدود اطمینان محاسبه کنیم.
پس از عملیات ریاضی، بازه حدود اطمینان 0.184- تا 0.064 بدست میآید.
توجه کنید که این حدود اطمینان، عدد صفر را در بر میگیرد و عدد صفر برای این بازه اطمینان عددی کاملاً منطقی است. این به این معنی است که ما نمیتوانیم فرض صفر (H0) خود را رد کنیم. این همان نتیجهای است که در مرحله قبل از P-value بدست آوردیم.
آزمون کای اسکوئر
ما میتوانیم به جای آزمون Z از آزمون همگنی کای اسکوئر برای مقایسه دو نسبت استفاده کنیم که در مقاله جداگانه این آزمون را بررسی میکنیم.
نظرات :