۰۹۳۸۴۲۲۶۷۳۸

انحراف استاندارد به زبان ساده: راهنمای تصویری برای درک پراکندگی داده‌ها

آیا تا به حال به این فکر کرده‌اید که چرا نمرات دانش‌آموزان یک کلاس همیشه یکسان نیست؟ یا چرا قد افراد یک جامعه متفاوت است؟ پاسخ این سوال‌ها در مفهومی به نام “انحراف استاندارد” نهفته است.

انحراف استاندارد، مثل یک متر، به ما کمک می‌کند تا پراکندگی داده‌ها را اندازه‌گیری کنیم. به زبان ساده‌تر، انحراف استاندارد نشان می‌دهد که به طور متوسط، داده‌ها چقدر از میانگین فاصله دارند. هرچه انحراف استاندارد بیشتر باشد، به این معنی است که داده‌ها پراکنده‌تر هستند و برعکس.

چرا دانستن انحراف استاندارد مهم است؟

  • تفسیر نتایج تحقیقات: با دانستن انحراف استاندارد، می‌توانیم نتایج تحقیقات را بهتر تفسیر کنیم. مثلاً، اگر دو گروه از دانش‌آموزان را با هم مقایسه کنیم، می‌توانیم بگوییم که آیا تفاوت نمرات آن‌ها معنی‌دار است یا خیر.
  • کنترل کیفیت: در صنایع مختلف، از انحراف استاندارد برای کنترل کیفیت محصولات استفاده می‌شود. مثلاً، اگر انحراف استاندارد وزن یک محصول خیلی زیاد باشد، به این معنی است که کیفیت محصول یکنواخت نیست.
  • پیش‌بینی آینده: با استفاده از انحراف استاندارد می‌توانیم پیش‌بینی کنیم که داده‌های آینده چگونه خواهند بود. مثلاً، اگر انحراف استاندارد بازده یک سهام زیاد باشد، به این معنی است که سهام نوسانات زیادی دارد و سرمایه‌گذاری در آن ریسک بیشتری دارد.

در این مقاله، شما یاد خواهید گرفت:

  • انحراف استاندارد چیست و چرا مهم است؟
  • چگونه انحراف استاندارد را محاسبه کنیم؟
  • چه تفاوتی بین انحراف استاندارد و واریانس وجود دارد؟
  • چگونه انحراف استاندارد را تفسیر کنیم؟
  • کاربردهای انحراف استاندارد

اگر می‌خواهید به دنیای آمار و تحلیل داده‌ها قدم بگذارید و داده‌های خود را بهتر درک کنید، این مقاله را از دست ندهید. با ما همراه باشید تا با استفاده از مثال‌های ساده و نمودارهای جذاب، مفهوم انحراف استاندارد را به طور کامل فرا بگیرید.

قبلاً در طی مقاله‌ای معیارهای دیگری از پراکندگی داده‌ها را شامل محدوده‌ داده‌ها، دامنه میان چارکی و نمودار باکس پلات را بررسی کرده‌ایم که برای یادگیری این معیارهای میتوانید مقاله مذکور را مطالعه کنید.

انحراف استاندارد

انحراف استاندارد با استفاده از فرمول زیر بدست می آید.

فرمول انحراف معیار

اجزای فرمول به شرح زیر است:

n، حجم نمونه

Xi، ارزش مشاهده X در جایگاه i

ایکس-بار: میانگین مقادیر

مثال

فرض کنید ارتفاع سه گیاه را اندازه‌گیری کرده‌اید. ارتفاع این سه گیاه به ترتیب 3، 4 و 6 سانتیمتر است (شکل 1).

شکل 1. نمایش ارتفاع گیاه روی نمودار

شکل 1. نمایش ارتفاع گیاه روی نمودار

برای محاسبه انحراف استاندارد باید مراحل زیر را انجام دهیم:

  • محاسبه میانگین

میانگین از جمع مقادیر تقسیم بر تعداد آن‌ها حاصل می‌شود. در مثال ما میانگین عدد 4 بدست آمد.

میانگین اعداد

  • محاسبه مجموع مربعات

حالا باید تفاوت هر یک از نقاط را نسبت به میانگین محاسبه و به توان دو برسانیم. در شکل 2 فاصله نقاط نسبت به میانگین را نشان داده‌ایم. همچنین فاصله هر نقطه نسبت به میانگین را ابتدا محاسبه و سپس به توان دو رساندیم. نهایتاً مجموع مجذور تفاوت‌ها از میانگین را محاسبه کردیم که عدد 8 بدست آمد. عدد 8 در صورت کسر واریانس قرار می‌گیرد.

شکل 2. نحوه محاسبه مجموع مربعات

شکل 2. نحوه محاسبه مجموع مربعات

  • محاسبه انحراف استاندارد

در نهایت عدد 8 را تقسیم بر درجه آزادی می‌کنیم و از آن جذر می‌گیریم تا واریانس بدست آید. نهایتاً از واریانس جذر می‌گیریم.

محاسبه انحراف معیار

 

میانگین همراه با انحراف استاندارد

اگر انحراف استاندارد را به علاوه-منهای میانگین کنیم، یک بازه بدست می‌آید. برای مثال ما می‌توانیم میانگین و انحراف استاندارد را به شکل زیر بنویسیم.

میانگین و انحراف معیار

اگر عدد 4 را یکبار با عدد 2 جمع کنیم و بار دیگر 2 را از 4 کم کنیم یک بازه حاصل می‌شود. این بازه را می‌توان روی یک نمودار میله‌ای مانند شکل 3 نشان داد.

شکل 3. نمایش میانگین و انحراف معیار روی نمودار ستونی

شکل 3. نمایش میانگین و انحراف معیار روی نمودار ستونی

اگر توزیع داده‌های ما نرمال باشد، می‌توانیم این بازه را به این صورت تفسیر کنیم که حدود 68 درصد از داده‌ها در محدوده یک انحراف استاندارد از میانگین قرار می‌گیرند. چون در این مثال 3 عدد بیشتر نداشتیم، تصور این موضوع کمی مشکل است. اجازه دهید با یک مثال دیگر مطلب را بهتر شرح بدهیم.

مثال

تصور کنید ارتفاع 70 گیاه را اندازه گیری کرده‌ و روی یک نمودار ستونی نمایش داده‌ایم (شکل 4).

شکل 4. نمایش میانگین و انحراف معیار روی نمودار ستونی

شکل 4. نمایش میانگین و انحراف معیار روی نمودار ستونی

الان میتوانیم ارور بار را به این شکل تفسیر کنیم که حدود 68 درصد از اعداد بین محدوده ارور بار قرار می گیرند. مقدار 68% را از خصوصیات توزیع نرمال گرفته‌ایم. توزیع نرمال را در جلسه جداگانه‌ای بطور مفصل بررسی کرده‌ایم.

واریانس

واریانس نمونه را می‌توانیم از فرمول زیر بدست آوریم.

واریانس

به عبارت دیگر، واریانس از مجموع توان دوم انحراف‌ها از میانگین تقسیم بر درجه آزادی حاصل می‌شود. نکته‌ای باید توجه کنیم این است که عموماً برای اندازه‌گیری پراکندگی از انحراف استاندارد که ریشه دوم واریانس است استفاده می‌کنیم. چون مقیاس آن مشابه با مقیاس‌ داده‌ها است.

بررسی پراکندگی داده ها: انحراف استاندارد یا دامنه میان چارکی؟

انتخاب بین انحراف استاندارد و دامنه میان چارکی دقیقاً به این موضوع ارتباط دارد که برای کمیت تمایل به مرکز از میانگین استفاده کنیم یا از میانه؟ یعنی میانگین همیشه با انحراف استاندارد و میانه با دامنه میان چارکی گزارش می‌شود.

میانگین، انحراف معیار، میانه و دامنه میان چارکی

به عبارت بهتر، چنانچه داده‌های ما انحراف مشخصی از توزیع نرمال نداشته باشد و توزیع داده‌های ما متقارن باشد، از میانگین و انحراف معیار استفاده می‌کنیم.

اما اگر داده‌‌های ما دارای چولگی یا کشیدگی باشد یا در داده‌های ما مشاهده‌های پرت یا دورافتاده وجود دارد، از میانه و دامنه میان چارکی استفاده می‌کنیم.

نکته‌ای باید توجه کنیم این است محدوده یک انحراف معیار از میانگین حدود 68 % از داده‌ها قرار دارد. در حالی در محدوده دامنه میان چارکی 50 % از اعداد قرار می‌گیرد.

رسول محمدی

برای مشاوره یا انجام پژوهش‌های آماری در تلگرام یا ایتا با شماره 09384226738 بطور مستقیم با من در ارتباط باشید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

14 − نه =