۰۹۳۸۴۲۲۶۷۳۸

آشنایی با خطای استاندارد میانگین

در این مقاله مفهوم خطای استاندارد میانگین (Standard error of the mean) را یاد می‌گیریم و تفاوت آن را با انحراف استاندارد بررسی می‌کنیم.

قبل از مشاهده این قسمت باید با مفهوم میانگین و انحراف استاندارد آشنا باشید. برای آشنایی به مقالات مربوطه مراجعه نمایید.

خطای استاندارد میانگین با استفاده از فرمول زیر محاسبه می‌شود.

فرمول خطای استاندارد میانگین

در این فرمول سیکما نشان دهنده انحراف استاندارد و n حجم نمونه را نشان می‌دهد.

مثال خطای استاندارد میانگین

فرض کنید قد تمام افراد یک جامعه 10000 نفری را اندازه‌گیری کرده‌ایم. میانگین قد 170 و انحراف استاندارد 10 بدست آمده است. شکل 1 هیستوگرام داده‌ها را نشان می‌دهد.

شکل 1. هیستوگرام قد افراد

شکل 1. هیستوگرام قد افراد

حالا فرض کنید یک نمونه شامل 4 نفری از این جامعه می‌گیریم. میانگین این نمونه بطور تصادفی 166 بدست می‌آید (شکل 2).

شکل 2. اخذ نمونه چهار نفری از جامعه و محاسبه میانگین

شکل 2. اخذ نمونه چهار نفری از جامعه و محاسبه میانگین

اگر به همین ترتیب نمونه‌های متعددی از این جامعه بگیریم و میانگین این نمونه‌ها را محاسبه کنیم. جامعه دیگری به نام جامعه میانگین نمونه‌ها خواهیم داشت. فرض کنید مثلاً 10000 بار از این جامعه نمونه‌های 4 نفری اخذ می‌کنیم. در این صورت 10000 میانگین خواهیم داشت (شکل 3). توجه کنید که در هر بار نمونه‌گیری افراد متفاوتی در نمونه‌های ما حضور دارند. بنابراین میانگین‌های ما مقداری تفاوت خواهند داشت.

شکل 3. اخذ 10000 نمونه چهار نفری و محاسبه میانگین

شکل 3. اخذ 10000 نمونه چهار نفری و محاسبه میانگین

تشکیل جامعه نمونه‌ها

اگر برای 10000 نمونه هیستوگرام رسم کنیم، مشاهده می‌کنیم که توزیع مقادیر میانگین شکلی شبیه به توزیع نرمال دارد. قبلاً این مطلب را در قالب قضیه حد مرکزی بیان کرده‌ایم. توزیع جمعیت و توزیع نمونه‌ها در شکل 4 زیر قابل مشاهده است.

شکل 4. تشکیل جامعه نمونه‌ها

شکل 4. تشکیل جامعه نمونه‌ها

نکته مهم در این رابطه این است که اگرچه مقادیر میانگین محدوده‌ای بین 130 تا 210 دارند، توزیع میانگین نمونه‌ها محدوده‌ای بین 153 تا 187 است. اما چرا پراکندگی جامعه نمونه‌ها کمتر از جامعه اصلی است؟

به دلیل اینکه افراد بسیار کمی در جمعیت وجود دارند که قد خیلی کوتاه یا خیلی بلند داشته باشند، احتمال بسیار کمی وجود دارد که مثلاً 4 فرد بسیار قد کوتاه یا بسیار قد بلند بصورت تصادفی از جمعیت انتخاب شود. به همین خاطر هیچیک از میانگین‌ها خیلی کوچک یا خیلی بزرگ نیست. بنابراین انحراف استاندارد توزیع میانگین‌ها کمتر از انحراف استاندارد جمعیت اصلی است.

محاسبه انحراف استاندارد جامعه میانگین نمونه‌ها

در این بخش خطای استاندارد میانگین نمونه‌ها را محاسبه می‌کنیم. اگر انحراف استاندارد جامعه اصلی 10 و حجم نمونه‌های ما 4 باشد، می‌توانیم با استفاده از فرمول شکل 5، خطای استاندارد میانگین‌ها را محاسبه کنیم. توجه کنید که ما می‌توانیم بدون نمونه‌ گیری های متعدد از جامعه اصلی و با استفاده از انحراف استاندارد جامعه اصلی، انحراف استاندارد جامعه نمونه‌ها را محاسبه کنیم. کافی است انحراف استاندارد جامعه اصلی را تقسیم بر ریشه دوم حجم نمونه کنیم تا انحراف استاندارد جامعه نمونه‌ها بدست آید.

شکل 5. محاسبه خطای استاندارد

شکل 5. محاسبه خطای استاندارد

پس، خطای استاندارد دقیقاً تخمینی از انحراف استاندارد توزیع میانگین‌ نمونه‌هاست. بنابراین اگر ما انحراف استاندارد میانگین 10000 نمونه را از جمعیت مورد بررسی در مثال مذکور محاسبه کنیم، انتظار داریم که مقدار 5 بدست آید.

بنابراین انتظار داریم که تقریباً 68 درصد از میانگین نمونه‌های ما بین 165 تا 175 باشد. چون این فاصله به اندازه یک انحراف استاندارد از توزیع میانگین توزیع نمونه‌ها است.

نکته مهم در مورد خطای استاندارد میانگین

بار دیگر به فرمول خطای استاندارد دقت کنید.

word image 506 7

از فرمول خطای استاندارد مشخص است که وقتی حجم نمونه (n) افزایش می‌یابد، خطای استاندارد کم می‌شود. پس زمانی که حجم نمونه‌های ما زیاد شود، توزیع میانگین نمونه‌های ما باریک‌تر می‌شود.

فرض کنید ما مجدداً نمونه‌گیری را انجام دهیم. اما این بار به جای 4 فرد، 25 فرد از جامعه را انتخاب کنیم و میانگین آن‌ها را محاسبه کنیم (شکل 6).

شکل 6. محاسبه خطای استاندارد با نمونه‌های 25 تایی

شکل 6. محاسبه خطای استاندارد با نمونه‌های 25 تایی

همانطور که ملاحظه می‌کنید، وقتی اندازه نمونه از 4 به 25 افزایش می‌یابد خطای استاندارد میانگین از 5 به 2 کاهش می یابد. پس اگر از همین جمعیت، 10000 نمونه 25 تایی بگیریم و هیستوگرام میانگین آن‌ها را رسم کنیم شکلی مانند شکل 6 حاصل می‌شود. توجه کنید که پراکندگی توزیع میانگین‌ها نمونه‌ها نسبت به حالتی که حجم نمونه‌ها 4 نفری بود کم می‌شود و توزیع باریکتر خواهد بود.

مقایسه انحراف استاندارد و خطای استاندارد میانگین

ما می‌توانیم کل داده‌های مثال قبل را مانند شکل 7 نشان دهیم.

شکل 7. میانگین، انحراف استاندارد و خطای استاندارد

شکل 7. میانگین، انحراف استاندارد و خطای استاندارد

در شکل 7 ارتفاع ستون‌ها نشان دهنده میانگین است. انحراف استاندارد (SD) در این شکل در مورد پراکندگی داده‌ها در اطراف میانگین صحبت می‌کند. انحراف استاندارد را می‌توانیم اینطور تفسیر کنیم که 68 درصد از نقاط داده‌ها به فاصله یک انحراف استاندارد از میانگین قرار می‌گیرند (شکل 7).

شکل 8. نمایش خطای استاندارد میانگین روی نمودار

شکل 8. نمایش خطای استاندارد میانگین روی نمودار

در مقایسه با انحراف استاندارد، خطای استاندارد هیچ اطلاعاتی در مورد تنوع داده‌ها در اطراف میانگین ارائه نمی‌دهد. خطای استاندارد بیان می‌کند که چقدر می‌توانیم به میانگین تخمینی از جمعیت اطمینان داشته باشیم (شکل 8).

شکل 9. نمایش میانگین،‌انحراف معیار و خطای استاندارد در حالت حجم نمونه بالا

شکل 9. نمایش میانگین،‌انحراف استاندارد و خطای استاندارد در حالت حجم نمونه بالا

چنانچه حجم نمونه ما زیاد باشد و اروربار را به اندازه یک خطای استاندارد از میانگین رسم کرده باشیم، این فاصله را می‌توانیم به این صورت تفسیر کنیم که حدوداً 68 درصد مطمئن هستیم که میانگین حقیقی جامعه در محدوده‌ای بین 3.5 تا 4.5 است(شکل 9).

تفاوت مهم دیگر انحراف استاندارد و خطای استاندارد این است که مقدار خطای استاندارد با افزایش حجم نمونه کاهش می‌یابد. زیرا ما اطمینان بیشتری داریم که میانگین تخمینی ما خیلی به میانگین جمعیت نزدیک است (شکل 9). اما انحراف استاندارد با افزایش حجم نمونه تغییری نمی‌کند. چرا که افزایش حجم نمونه تأثیری بر پراکندگی داده‌ها ندارد.

البته نکته‌ای که باید به آن توجه نمود این است که بالا بودن حجم نمونه باعث دقت زیاد در بدست آوردن انحراف استاندارد می‌شود. بنابراین ما می‌توانیم به انحراف استاندارد تخمینی جامعه از روی نمونه اعتماد بیشتری داشته باشیم.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *