چطور همبستگی پیرسون را در SPSS محاسبه کنیم؟ | آموزش گام به گام و تفسیر خروجی
یا قد افراد با وزن آنها رابطه دارد؟ آیا بین میزان مطالعه و نمره امتحان واقعاً ارتباطی هست؟ اینها سوالهایی هستند که ذهن هر پژوهشگر، دانشجو یا تحلیلگر داده را به خود مشغول میکنند. برای پاسخ به چنین سوالاتی، یکی از دقیقترین ابزارهای آماری که به کار ما میآید همبستگی پیرسون (Pearson Correlation) است.
در این قسمت از آموزش SPSS با هم بررسی میکنیم:
- همبستگی پیرسون چیست و در چه مواقعی کاربرد دارد؟
- چگونه شدت و جهت رابطه بین دو متغیر عددی را بسنجیم؟
- چطور این آزمون را در SPSS اجرا و خروجی آن را تفسیر کنیم؟
- از کجا بفهمیم که رابطهای واقعی و معنادار بین متغیرها وجود دارد یا نه؟
اگر میخواهید مهارت تحلیل رابطه بین متغیرها را به شکل حرفهای یاد بگیرید، این آموزش پایهای و مهم را از دست ندهید. شناخت همبستگیها، اولین قدم برای ساخت مدلهای آماری پیشرفتهتر است.
بررسی رابطه با نمودار پراکنش (همبستگی)
نمودارهای پراکنش ابزاری بصری برای توصیف رابطه بین دو متغیری که عموماً پیوسته هستند، فراهم میکنند. به طور خاص، این نمودار شامل ترسیم مختصات مجموعهای از موارد منفرد در یک مجموعه داده بر روی یک جفت متغیر (X و Y) است (شکل زیر). محل تقاطع این دو نقطه برای هر مورد معین در مجموعه داده، مختصات XY برای آن مورد نامیده میشود. نمودار مشاهدات روی X و Y میتواند برای توصیف رابطه بین X و Y از نظر جهت و/یا شدت آن استفاده شود.

در شکل بالا سه مدل رابطه بین دو متغیر ترسیم شده است. ارتباط مثبت، بدون ارتباط و ارتباط منفی. برای رابطه مثبت میتوان ارتباط مثبت بین معیارهای انگیزه دانشآموز (X) و پیشرفت تحصیلی دانشآموز (Y) را نام برد. برای رابطه منفی میتوان به ارتباط منفی بین معیارهای اضطراب دانشآموز (X) و پیشرفت تحصیلی دانشآموز (Y) اشاره کرد.
رسم نمودار پراکنش و بررسی ارتباط
تصویر زیر زیرمجموعهای از دادههای موجود در فایل دادهها ماست. اولین نمودار پراکندگی که ایجاد میکنیم، شامل ترسیم رابطه بین علاقه «interest» و پیشرفت تحصیلی دانشآموزان «achieve» است.

از مسیر Graphs>Legacy Dialogs>ScatterDot اقدام به رسم نمودار میکنیم. در پنجره باز شده «Simple Scatter» را انتخاب میکنیم. متغیر «achieve» را به محور Y و متغیر «interest» را به محور X اختصاص میدهیم. نهایتاً «OK» میکنیم تا نتایج در خروجی ظاهر شود.

بررسی یک ارتباط مثبت با استفاده از نمودار پراکنش
با توجه به نمودار پراکندگی، به نظر میرسد که بین دو متغیر علاقه «interest» و پیشرفت تحصیلی دانشآموزان «achieve» تا حدودی رابطه مثبت وجود دارد. گاهی اوقات تفسیر نمودارهای پراکندگی میتواند دشوار باشد. با این حال، یک ابزار مفید برای افزایش توانایی ما در تشخیص مثبت یا منفی بودن رابطه، یا تشخیص بالقوه روندهای غیرخطی، دوبار کلیک کردن روی نمودار پراکندگی و رفتن به حالت ویرایشگر نمودار است.

در قسمت ویرایشگر، ابتدا روی آیکون «Add Fit Line at Total» کلیک میکنیم تا روی نقاط خط برازش ایجاد شود. در پنجره باز شده نوع خط برازش را متناسب با دادهها انتخاب میکنیم. در حال حاضر، ما روی برازش خطی «Linear» را انتخاب میکنیم. اگر بخواهیم یک روند غیرخطی را برازش دهیم، میتوانیم از «Quadratic» یا «Cubic» استفاده کنیم.

تصویر زیر به وضوح رابطه خطی بین دو متغیر را نشان میدهد. معادله روی خط، معادله یک مدل رگرسیون خطی ساده است که در آن علاقه «interest» به عنوان پیشبینیکننده پیشرفت تحصیلی «achieve» عمل میکند.

بررسی یک ارتباط منفی با استفاده از نمودار پراکنش
حالا، بیایید یک نمودار پراکندگی برای رابطه بین اضطراب «anxiety» و موفقیت «achieve» رسم کنیم. نمودار را مانند آنچه که قبلاً انجام دادیم رسم میکنیم.

در اینجا، به نظر میرسد که بین اضطراب (X) و موفقیت (Y) رابطه منفی وجود دارد.

مثال برای رابطه کامل و مثبت
وقتی ارتباط کامل و مثبت (خطی) بین دو متغیر (X و Y) وجود داشته باشد، نقاط روی یک خط صعودی واقع میشوند (شکل زیر).

مثال برای رابطه کامل و منفی
وقتی ارتباط کامل و منفی (خطی) بین دو متغیر (X و Y) وجود داشته باشد، نقاط روی یک خط نزولی قرار میگیرند.

مثال برای نبود وجود رابطه بین متغیرها
نمودار زیر حالتی را نشان میدهد که بین دو متغیر هیچگونه رابطهای وجود ندارد.

اگر هیچ رابطهای بین متغیرها وجود نداشته باشد، خط برازش افقی (یا تقریباً افقی) خواهد بود و نقاط داده به طور تصادفی در اطراف آن خط پراکنده شدهاند. بنابراین، وقتی نمودارهای پراکندگی که تاکنون ایجاد کردهایم را مقایسه میکنیم، میتوانیم ببینید که وقتی ارتباط کمی بین متغیرها وجود دارد یا اصلاً ارتباطی وجود ندارد، نقاط داده پراکندگی بیشتری در اطراف خط رگرسیون نسبت به زمانی که ارتباط قویتری بین متغیرها وجود دارد، نشان میدهند.
مثال برای وجود رابطه غیر خطی بین متغیرها
نمودارهای قبلی تلاشهایی را برای توصیف روابط خطی بین دو متغیر با استفاده از نمودارهای پراکندگی نشان میدهند. با این حال، ما میتوانیم روابط غیرخطی را نیز ثبت کنیم (شکل زیر).

رابطه غیر خطی
در زیر شکل سمت چپ یک نمودار پراکندگی با فرض یک رابطه درجه دوم رسم شده است. در سمت راست یک نمودار پراکندگی را با فرض یک رابطه خطی رسم کردهایم. به نظر میرسد رابطه درجه دوم بهتر از رابطه خطی برازش را نشان میدهد.

کوواریانس
روش دوم برای توصیف رابطه بین دو متغیر پیوسته، شاخصی به نام کوواریانس است. در شکل زیر، محدوده مقادیری که کوواریانس میتواند اختیار کند، نشان داده شده است. کوواریانس از نظر تئوری از منفی تا مثبت بینهایت متغیر است. کوواریانس صفر نشاندهنده عدم وجود رابطه بین دو متغیر است. کوواریانس مثبت نشاندهنده رابطه مثبت بین متغیرها و کوواریانس منفی نشاندهنده ارتباط منفی است. کوواریانس فرض میکند که رابطه بین X و Y خطی است.

نکته منفی تکیه بر کوواریانس برای توصیف رابطه بین متغیرها این است که این شاخص وابسته به مقیاس است. به طوری که مقدار مطلق این شاخص به واریانس متغیرهای X و Y که بر قدرت (بزرگی) رابطه مشاهده شده تأثیر میگذارند، بستگی دارد. ما میتوانیم از کوواریانس برای صحبت در مورد مثبت یا منفی بودن یا صفر بودن یک رابطه استفاده کنیم، اما برای توصیف اینکه آیا قدرت رابطه کوچک، متوسط یا بزرگ است، مشکل داریم (زیرا مقیاس از نظر تئوری میتواند از ∞-تا ∞+ متغیر باشد).
همبستگی پیرسون
همبستگی پیرسون (یا r پیرسون) راه سومی برای توصیف رابطه بین دو متغیر پیوسته ارائه میدهد. از نظر ریاضی، r پیرسون چیزی بیش از کوواریانس بین دو متغیر استاندارد نیست (یعنی میانگین آنها 0 و انحراف معیار آنها 1 است). از آنجا که X و Y استاندارد شدهاند (که عملاً آنها را مستقل از مقیاس میکند)، محدوده نظری r پیرسون میتواند از 1- تا 1+ باشد. در مرکز این مقیاس 0 قرار دارد که نشان دهنده عدم وجود رابطه بین دو متغیر است. در زیر محدوده مقادیری که r پیرسون میتواند داشته باشد، نشان داده شده است. همانند کوواریانس، r پیرسون فرض میکند که رابطهای خطی بین X و Y وجود دارد.

اغلب اوقات وقتی گزارشهای تحقیقاتی را میخوانید که در آنها r پیرسون محاسبه میشود، آزمونهای معناداری ضریب همبستگی را خواهید یافت. در واقع، محقق در حال آزمایش این است که آیا ضریب همبستگی مشاهده شده در دادههای نمونه از نظر آماری تفاوت معناداری با 0 ( فرضیه تحقیق غیر جهتدار ) یا به طور معناداری بزرگتر یا کوچکتر از 0 ( فرضیه جهتدار ) دارد یا خیر؟ هنگامی که ضریب همبستگی از نظر آماری معنادار تلقی میشود، محقق استنباط میکند که همبستگی در جامعه غیر صفر است (در مورد فرضیه غیر جهتدار) یا اینکه بزرگتر یا کوچکتر از صفر است (در مورد فرضیه جهتدار).
آزمون فرضیات (غیر جهتدار)
هنگام انجام آزمون معناداری شامل یک فرضیه غیر جهتدار (یعنی همبستگی جمعیت غیر صفر است)، فرضیه صفر ( ) را میتوان به صورت زیر نوشت:

علامت فرضیه صفر بیان میکند که همبستگی جمعیت بین دو متغیر صفر است. فرضیه جایگزین بیان میکند که همبستگی جمعیت غیر صفر است. در هر دو مورد، r پیرسون نمونه به عنوان تخمینگر همبستگی جمعیت (یعنی rho) عمل میکند.
ضریب همبستگی نمونه، r، برای معناداری، همانند اکثر آزمونهای معناداری، مورد آزمون قرار میگیرد. ابتدا آلفا (α) (α یعنی درصد احتمال ارتکاب خطای نوع ۱) را برای مطالعه خود تعیین میکنیم. سپس، معناداری آماری r پیرسون بهدستآمده در دادههای خود را با مقایسه مقدار p مشاهدهشده آن در برابر آلفا تعیین میکنیم. اگر مقدار P≤α باشد فرضیه صفر را رد میکنیم و همبستگی غیر صفر را در جمعیت استنباط میکنیم. اگر P≥α باشد فرضیه صفر را حفظ میکنیم و همبستگی جمعیت را صفر استنباط میکنیم.
مثال برای آزمون فرضیات غیر جهتدار ضریب همبستگی
بیایید با استفاده از مجموعه دادههایمان به سراغ یک مثال برویم. در این مورد، یک فرضیه تحقیق غیر جهتدار را آزمایش خواهیم کرد. یعنی همبستگی جمعیت بین دو متغیر غیر صفر است.
فرض کنید میخواهیم همبستگی پیرسون را بین تسلط «mastery» و پیشرفت تحصیلی دانشآموز «achieve» را محاسبه کنیم و آن را از نظر معناداری آزمایش کنیم.

از مسیر Analyze>Correlate>Bivariate میتوانیم مقدار ضریب همبستگی را بدست آوریم. پس از باز کردن پنجره مربوط به ضریب همبستگی از قسمت «Correlation Coefficients» پیرسون «Pearson» را انتخاب میکنیم و متغیرهای خود را به کادر سمت راست منتقل میکنیم. نهایتا روی «OK» کلیک میکنیم تا نتایج بدست آید.
تفسیر همبستگی پیرسون در خروجی نرم افزار SPSS
در خروجی نرم افزار SPSS، یک ماتریس همبستگی را مشاهده میکنیم. مقادیر موجود در قطر اصلی 1 هستند (که همیشه در مورد ماتریسهای همبستگی صادق است).

همبستگی پیرسون بین تسلط و پیشرفت تحصیلی، r=0.575 بدست آمده است. عبارت Sig. (2-tailed)، مقدار p (یا سطح معنیداری) است. عدد «0.000» که در اینجا میبینید، با 3 رقم اعشار گرد شده است. از نظر فنی، مقدار p هرگز دقیقاً برابر با 0 نیست. به این ترتیب، مقدار نشان داده شده در این جدول صرفاً یک عدد بسیار کوچک نزدیک به صفر است. به طور مرسوم، محققان مقدار p چاپ شده «0.000»یا کمتر را به صورت «P<0.001» گزارش میکنند. از آنجایی که مقدار p در خروجی ما کمتر از آلفا «0.05» است، فرضیه صفر را رد میکنیم و همبستگی غیر صفر بین متغیرها را استنباط میکنیم.
اندازه اثر برای همبستگی پیرسون
اگر بخواهیم میزان رابطه بین دو متغیر را در دادههای خود توصیف کنیم، میتوانیم به معیار کوهن (۱۹۸۸) برای قضاوت در مورد اندازه اثر (بر اساس ضرایب همبستگی) تکیه کنیم:

با استفاده از این معیار، همبستگی مشاهده شده در دادههای نمونه ما را میتوان بزرگ توصیف کرد.
جهت اطلاع، در اینجا نمودار پراکندگی رابطه بین دو متغیر را نیز آوردهایم.

کوواریانس بین دو متغیر
اگرچه معمولاً در نتایج آماری گزارش نمیشود، اما میتوانیم کوواریانس بین دو متغیر خود را در SPSS نیز به دست آوریم. این کار را میتوان هنگام اجرای تحلیل همبستگی با کلیک روی قسمت «Options» و سپس انتخاب «Cross-product deviations and covariances» انجام داد.

کوواریانس بین میزان تسلط و پیشرفت تحصیلی «1.025» است. واریانس متغیرهای اصلی میزان تسلط «1.958» و پیشرفت تحصیلی « 1.624» نیز در قطر اصلی ماتریس همبستگی درج شدهاند.
فرضیات بدون جهت برای همبستگی
فرضیه تحقیق ما این بود که همبستگی جمعیت بین متغیرهای X و Y غیر صفر است. دراینصورت، فرضیه مقابل(یا تحقیق) به عنوان غیر جهتدار مشخص میشود. وقتی فرضیه ما به این شکل بیان میشود، ما سعی در استنباط مثبت یا منفی بودن همبستگی جمعیت نداریم، بلکه فقط استنباط میکنیم که آیا همبستگی با صفر متفاوت است یا خیر. فرضیههای غیر جهتدار نیاز به استفاده از آزمون تی دو طرفه دارند .
فرضیات جهتدار برای همبستگی
امکان دارد دلیل قانعکنندهای (مثلاً وقتی مبنای نظری یا تجربی قوی داریم) برای آزمایش اینکه آیا همبستگی جمعیت مثبت است (یعنی به طور قابل توجهی بزرگتر از صفر است) یا منفی (یعنی به طور قابل توجهی کوچکتر از صفر است) داشته باشیم – نه تنها اینکه همبستگی جمعیت با صفر متفاوت است. در این صورت، فرضیه تحقیق به عنوان جهتدار مشخص میشود. این نوع فرضیه را میتوان با استفاده از یک معیار یکطرفه آزمایش کرد.
شایان ذکر است که در مطالعات تحقیقاتی منتشر شده، محققان معمولاً نتایج آزمون معناداری (یعنی مقادیر p) را بر اساس نتایج آزمون غیر جهتدار (دو دامنه) ارائه میدهند، صرف نظر از اینکه فرضیههای اصلی آنها جهتدار یا غیرجهتدار باشد. اما باید در نظر داشته باشید که در شرایط برابر، فرضیههای جهتداری که با استفاده از معیار یکطرفه آزمایش میشوند، قویتر از فرضیههای دوطرفه خواهند بود.
مثال برای آزمون فرضیات جهتدار ضریب همبستگی
فرض کنید که ما فرضیهای داریم مبنی بر اینکه همبستگی جمعیت بین علاقه دانشآموز «interest» و پیشرفت تحصیلی دانشآموز «achieve» مثبت است( دقت کنید که فرضیه ما یک فرضیه جهتدار است).
فرضیههای صفر و جایگزین را میتوان به صورت زیر نوشت:

در این حالت، فرضیه صفر بیان میکند که همبستگی جمعیت کمتر یا مساوی ۰ است، در حالی که فرضیه جایگزین این است که همبستگی جمعیت بیشتر از ۰ است.
شخصاً، من این روش نوشتاری را نسبت به رویکرد بالا ترجیح میدهم، زیرا توصیف بیشتری از طیف همبستگیهای بالقوهای که ممکن است در دادههای نمونه شما مشاهده شود و با مقدار صفر سازگار است، ارائه میدهد. با این حال، هر دو رویکرد ارائه شدهاند تا بتوانید روشهای مختلفی را که مقدار صفر هنگام آزمایش یک فرضیه جهتدار نوشته میشود، مشاهده کنید.
محاسبه سطح معناداری در حالت فرضیه جهتدار
حال، بیایید تحلیل خود را در SPSS اجرا کنیم و در آن فرضیه مثبت بودن همبستگی جمعیت بین علاقه دانشآموز «interest» و پیشرفت تحصیلی «achieve» را آزمون کنیم.

همبستگی پیرسون بین علاقه و پیشرفت تحصیلی مثبت و معنادار است (r=0.534, P<0.001) با استفاده از روش کوهن (1988)، این همبستگی را میتوان بزرگ توصیف کرد.
نظرات :