چطور همبستگی پیرسون را در SPSS محاسبه کنیم؟ | آموزش گام‌ به‌ گام و تفسیر خروجی

۲۷ تیر ۱۴۰۴

رسول محمدی

278 بازدید

تاریخ ویرایش : 19 مرداد 1404

یا قد افراد با وزن آن‌ها رابطه دارد؟ آیا بین میزان مطالعه و نمره امتحان واقعاً ارتباطی هست؟ این‌ها سوال‌هایی هستند که ذهن هر پژوهشگر، دانشجو یا تحلیل‌گر داده را به خود مشغول می‌کنند. برای پاسخ به چنین سوالاتی، یکی از دقیق‌ترین ابزارهای آماری که به کار ما می‌آید همبستگی پیرسون (Pearson Correlation) است.

در این قسمت از آموزش SPSS با هم بررسی می‌کنیم:

همبستگی پیرسون چیست و در چه مواقعی کاربرد دارد؟
چگونه شدت و جهت رابطه بین دو متغیر عددی را بسنجیم؟
چطور این آزمون را در SPSS اجرا و خروجی آن را تفسیر کنیم؟
از کجا بفهمیم که رابطه‌ای واقعی و معنادار بین متغیرها وجود دارد یا نه؟

اگر می‌خواهید مهارت تحلیل رابطه بین متغیرها را به شکل حرفه‌ای یاد بگیرید، این آموزش پایه‌ای و مهم را از دست ندهید. شناخت همبستگی‌ها، اولین قدم برای ساخت مدل‌های آماری پیشرفته‌تر است.

بررسی رابطه با نمودار پراکنش (همبستگی)

نمودارهای پراکنش ابزاری بصری برای توصیف رابطه بین دو متغیری که عموماً پیوسته هستند، فراهم می‌کنند. به طور خاص، این نمودار شامل ترسیم مختصات مجموعه‌ای از موارد منفرد در یک مجموعه داده بر روی یک جفت متغیر (X و Y) است (شکل زیر). محل تقاطع این دو نقطه برای هر مورد معین در مجموعه داده، مختصات XY برای آن مورد نامیده می‌شود. نمودار مشاهدات روی X و Y می‌تواند برای توصیف رابطه بین X و Y از نظر جهت و/یا شدت آن استفاده شود.

گراف ارتباط بین دو متغیر

در شکل بالا سه مدل رابطه بین دو متغیر ترسیم شده است. ارتباط مثبت، بدون ارتباط و ارتباط منفی. برای رابطه مثبت می‌توان ارتباط مثبت بین معیارهای انگیزه دانش‌آموز (X) و پیشرفت تحصیلی دانش‌آموز (Y) را نام برد. برای رابطه منفی می‌توان به ارتباط منفی بین معیارهای اضطراب دانش‌آموز (X) و پیشرفت تحصیلی دانش‌آموز (Y) اشاره کرد.

رسم نمودار پراکنش و بررسی ارتباط

تصویر زیر زیرمجموعه‌ای از داده‌های موجود در فایل داده‌ها ماست. اولین نمودار پراکندگی که ایجاد می‌کنیم، شامل ترسیم رابطه بین علاقه «interest» و پیشرفت تحصیلی دانش‌آموزان «achieve» است.

نمایی داده‌ها در نرم افزار SPSS

از مسیر Graphs>Legacy Dialogs>ScatterDot اقدام به رسم نمودار می‌کنیم. در پنجره باز شده «Simple Scatter» را انتخاب می‌کنیم. متغیر «achieve» را به محور Y و متغیر «interest» را به محور X اختصاص می‌دهیم. نهایتاً «OK» می‌کنیم تا نتایج در خروجی ظاهر شود.

مسیر رسم نمودار پراکنش در نرم افزار SPSS

بررسی یک ارتباط مثبت با استفاده از نمودار پراکنش

با توجه به نمودار پراکندگی، به نظر می‌رسد که بین دو متغیر علاقه «interest» و پیشرفت تحصیلی دانش‌آموزان «achieve» تا حدودی رابطه مثبت وجود دارد. گاهی اوقات تفسیر نمودارهای پراکندگی می‌تواند دشوار باشد. با این حال، یک ابزار مفید برای افزایش توانایی ما در تشخیص مثبت یا منفی بودن رابطه، یا تشخیص بالقوه روندهای غیرخطی، دوبار کلیک کردن روی نمودار پراکندگی و رفتن به حالت ویرایشگر نمودار است.

نمودار پراکنش

در قسمت ویرایشگر، ابتدا روی آیکون «Add Fit Line at Total» کلیک می‌کنیم تا روی نقاط خط برازش ایجاد شود. در پنجره باز شده نوع خط برازش را متناسب با داده‌ها انتخاب می‌کنیم. در حال حاضر، ما روی برازش خطی «Linear» را انتخاب می‌کنیم. اگر بخواهیم یک روند غیرخطی را برازش دهیم، می‌توانیم از «Quadratic» یا «Cubic» استفاده کنیم.

رسم خط برازش در نمودار پراکنش

تصویر زیر به وضوح رابطه خطی بین دو متغیر را نشان می‌دهد. معادله روی خط، معادله یک مدل رگرسیون خطی ساده است که در آن علاقه «interest» به عنوان پیش‌بینی‌کننده پیشرفت تحصیلی «achieve» عمل می‌کند.

معادله خط رگرسیونی روی نمودار پراکنش

بررسی یک ارتباط منفی با استفاده از نمودار پراکنش

حالا، بیایید یک نمودار پراکندگی برای رابطه بین اضطراب «anxiety» و موفقیت «achieve» رسم کنیم. نمودار را مانند آنچه که قبلاً انجام دادیم رسم می‌کنیم.

رسم نمودار پراکنش در حالت وجود همبستگی منفی بین دو متغیر

در اینجا، به نظر می‌رسد که بین اضطراب (X) و موفقیت (Y) رابطه منفی وجود دارد.

معادله خط رگرسیون در صورت وجود رابطه منفی خطی بین دو متغیر

مثال برای رابطه کامل و مثبت

وقتی ارتباط کامل و مثبت (خطی) بین دو متغیر (X و Y) وجود داشته باشد، نقاط روی یک خط صعودی واقع می‌شوند (شکل زیر).

نمودار پراکنش در صورت وجود رابطه مثبت کامل بین دو متغیر

مثال برای رابطه کامل و منفی

وقتی ارتباط کامل و منفی (خطی) بین دو متغیر (X و Y) وجود داشته باشد، نقاط روی یک خط نزولی قرار می‌گیرند.

نمودار پراکنش در صورت وجود رابطه منفی خطی بین دو متغیر

مثال برای نبود وجود رابطه بین متغیرها

نمودار زیر حالتی را نشان می‌دهد که بین دو متغیر هیچگونه رابطه‌ای وجود ندارد.

نمودار پراکنش خطی در حالت نبود همبستگی بین دو متغیر

اگر هیچ رابطه‌ای بین متغیرها وجود نداشته باشد، خط برازش افقی (یا تقریباً افقی) خواهد بود و نقاط داده به طور تصادفی در اطراف آن خط پراکنده شده‌اند. بنابراین، وقتی نمودارهای پراکندگی که تاکنون ایجاد کرده‌ایم را مقایسه می‌کنیم، می‌توانیم ببینید که وقتی ارتباط کمی بین متغیرها وجود دارد یا اصلاً ارتباطی وجود ندارد، نقاط داده پراکندگی بیشتری در اطراف خط رگرسیون نسبت به زمانی که ارتباط قوی‌تری بین متغیرها وجود دارد، نشان می‌دهند.

مثال برای وجود رابطه غیر خطی بین متغیرها

نمودارهای قبلی تلاش‌هایی را برای توصیف روابط خطی بین دو متغیر با استفاده از نمودارهای پراکندگی نشان می‌دهند. با این حال، ما می‌توانیم روابط غیرخطی را نیز ثبت کنیم (شکل زیر).

نمودار پراکنش در حالت وجود رابطه غیر خطی از نوع درجه دوم

رابطه غیر خطی

در زیر شکل سمت چپ یک نمودار پراکندگی با فرض یک رابطه درجه دوم رسم شده است. در سمت راست یک نمودار پراکندگی را با فرض یک رابطه خطی رسم کرده‌ایم. به نظر می‌رسد رابطه درجه دوم بهتر از رابطه خطی برازش را نشان می‌دهد.

مقایسه نمودارهای پراکنش در صورت وجود رابطه خطی و غیر خطی

کوواریانس

روش دوم برای توصیف رابطه بین دو متغیر پیوسته، شاخصی به نام کوواریانس است. در شکل زیر، محدوده مقادیری که کوواریانس می‌تواند اختیار کند، نشان داده شده است. کوواریانس از نظر تئوری از منفی تا مثبت بی‌نهایت متغیر است. کوواریانس صفر نشان‌دهنده عدم وجود رابطه بین دو متغیر است. کوواریانس مثبت نشان‌دهنده رابطه مثبت بین متغیرها و کوواریانس منفی نشان‌دهنده ارتباط منفی است. کوواریانس فرض می‌کند که رابطه بین X و Y خطی است.

محدوده وجود مقادیر کوواریانس

نکته منفی تکیه بر کوواریانس برای توصیف رابطه بین متغیرها این است که این شاخص وابسته به مقیاس است. به طوری که مقدار مطلق این شاخص به واریانس متغیرهای X و Y که بر قدرت (بزرگی) رابطه مشاهده شده تأثیر می‌گذارند، بستگی دارد. ما می‌توانیم از کوواریانس برای صحبت در مورد مثبت یا منفی بودن یا صفر بودن یک رابطه استفاده کنیم، اما برای توصیف اینکه آیا قدرت رابطه کوچک، متوسط یا بزرگ است، مشکل داریم (زیرا مقیاس از نظر تئوری می‌تواند از ∞-تا ∞+ متغیر باشد).

همبستگی پیرسون

همبستگی پیرسون (یا r پیرسون) راه سومی برای توصیف رابطه بین دو متغیر پیوسته ارائه می‌دهد. از نظر ریاضی، r پیرسون چیزی بیش از کوواریانس بین دو متغیر استاندارد نیست (یعنی میانگین آنها 0 و انحراف معیار آنها 1 است). از آنجا که X و Y استاندارد شده‌اند (که عملاً آنها را مستقل از مقیاس می‌کند)، محدوده نظری r پیرسون می‌تواند از 1- تا 1+ باشد. در مرکز این مقیاس 0 قرار دارد که نشان دهنده عدم وجود رابطه بین دو متغیر است. در زیر محدوده مقادیری که r پیرسون می‌تواند داشته باشد، نشان داده شده است. همانند کوواریانس، r پیرسون فرض می‌کند که رابطه‌ای خطی بین X و Y وجود دارد.

محدوده وجود مقادیر همبستگی پیرسون

اغلب اوقات وقتی گزارش‌های تحقیقاتی را می‌خوانید که در آن‌ها r پیرسون محاسبه می‌شود، آزمون‌های معناداری ضریب همبستگی را خواهید یافت. در واقع، محقق در حال آزمایش این است که آیا ضریب همبستگی مشاهده شده در داده‌های نمونه از نظر آماری تفاوت معناداری با 0 ( فرضیه تحقیق غیر جهت‌دار ) یا به طور معناداری بزرگتر یا کوچکتر از 0 ( فرضیه جهت‌دار ) دارد یا خیر؟ هنگامی که ضریب همبستگی از نظر آماری معنادار تلقی می‌شود، محقق استنباط می‌کند که همبستگی در جامعه غیر صفر است (در مورد فرضیه غیر جهت‌دار) یا اینکه بزرگتر یا کوچکتر از صفر است (در مورد فرضیه جهت‌دار).

آزمون فرضیات (غیر جهت‌دار)

هنگام انجام آزمون معناداری شامل یک فرضیه غیر جهت‌دار (یعنی همبستگی جمعیت غیر صفر است)، فرضیه صفر ( ) را می‌توان به صورت زیر نوشت:

آزمون فرضیات غیر جهت‌دار در مورد همبستگی پیرسون

علامت فرضیه صفر بیان می‌کند که همبستگی جمعیت بین دو متغیر صفر است. فرضیه جایگزین بیان می‌کند که همبستگی جمعیت غیر صفر است. در هر دو مورد، r پیرسون نمونه به عنوان تخمین‌گر همبستگی جمعیت (یعنی rho) عمل می‌کند.

ضریب همبستگی نمونه، r، برای معناداری، همانند اکثر آزمون‌های معناداری، مورد آزمون قرار می‌گیرد. ابتدا آلفا (α) (α یعنی درصد احتمال ارتکاب خطای نوع ۱) را برای مطالعه خود تعیین می‌کنیم. سپس، معناداری آماری r پیرسون به‌دست‌آمده در داده‌های خود را با مقایسه مقدار p مشاهده‌شده آن در برابر آلفا تعیین می‌کنیم. اگر مقدار P≤α باشد فرضیه صفر را رد می‌کنیم و همبستگی غیر صفر را در جمعیت استنباط می‌کنیم. اگر P≥α باشد فرضیه صفر را حفظ می‌کنیم و همبستگی جمعیت را صفر استنباط می‌کنیم.

مثال برای آزمون فرضیات غیر جهت‌‌دار ضریب همبستگی

بیایید با استفاده از مجموعه داده‌هایمان به سراغ یک مثال برویم. در این مورد، یک فرضیه تحقیق غیر جهت‌دار را آزمایش خواهیم کرد. یعنی همبستگی جمعیت بین دو متغیر غیر صفر است.

فرض کنید می‌خواهیم همبستگی پیرسون را بین تسلط «mastery» و پیشرفت تحصیلی دانش‌آموز «achieve» را محاسبه کنیم و آن را از نظر معناداری آزمایش کنیم.

مسیر محاسبه ضریب همبستگی پیرسون در نرم افزار SPSS

از مسیر Analyze>Correlate>Bivariate می‌توانیم مقدار ضریب همبستگی را بدست آوریم. پس از باز کردن پنجره مربوط به ضریب همبستگی از قسمت «Correlation Coefficients» پیرسون «Pearson» را انتخاب می‌کنیم و متغیرهای خود را به کادر سمت راست منتقل می‌کنیم. نهایتا روی «OK» کلیک می‌کنیم تا نتایج بدست آید.

تفسیر همبستگی پیرسون در خروجی نرم افزار SPSS

در خروجی نرم افزار SPSS، یک ماتریس همبستگی را مشاهده می‌کنیم. مقادیر موجود در قطر اصلی 1 هستند (که همیشه در مورد ماتریس‌های همبستگی صادق است).

خروجی نرم افزار SPSS در مورد ضریب همبستگی پیرسون

همبستگی پیرسون بین تسلط و پیشرفت تحصیلی، r=0.575 بدست آمده است. عبارت Sig. (2-tailed)، مقدار p (یا سطح معنی‌داری) است. عدد «0.000» که در اینجا می‌بینید، با 3 رقم اعشار گرد شده است. از نظر فنی، مقدار p هرگز دقیقاً برابر با 0 نیست. به این ترتیب، مقدار نشان داده شده در این جدول صرفاً یک عدد بسیار کوچک نزدیک به صفر است. به طور مرسوم، محققان مقدار p چاپ شده «0.000»یا کمتر را به صورت «P<0.001» گزارش می‌کنند. از آنجایی که مقدار p در خروجی ما کمتر از آلفا «0.05» است، فرضیه صفر را رد می‌کنیم و همبستگی غیر صفر بین متغیرها را استنباط می‌کنیم.

اندازه اثر برای همبستگی پیرسون

اگر بخواهیم میزان رابطه بین دو متغیر را در داده‌های خود توصیف کنیم، می‌توانیم به معیار کوهن (۱۹۸۸) برای قضاوت در مورد اندازه اثر (بر اساس ضرایب همبستگی) تکیه کنیم:

word image 1738 19

با استفاده از این معیار، همبستگی مشاهده شده در داده‌های نمونه ما را می‌توان بزرگ توصیف کرد.

جهت اطلاع، در اینجا نمودار پراکندگی رابطه بین دو متغیر را نیز آورده‌ایم.

ضریب همبستگی پیرسون و مقایسه آن با نمودار پراکنش خطی

کوواریانس بین دو متغیر

اگرچه معمولاً در نتایج آماری گزارش نمی‌شود، اما می‌توانیم کوواریانس بین دو متغیر خود را در SPSS نیز به دست آوریم. این کار را می‌توان هنگام اجرای تحلیل همبستگی با کلیک روی قسمت «Options» و سپس انتخاب «Cross-product deviations and covariances» انجام داد.

مسیر محاسبه کوواریانس در نرم افزار SPSS

کوواریانس بین میزان تسلط و پیشرفت تحصیلی «1.025» است. واریانس متغیرهای اصلی میزان تسلط «1.958» و پیشرفت تحصیلی « 1.624» نیز در قطر اصلی ماتریس همبستگی درج شده‌اند.

فرضیات بدون جهت برای همبستگی

فرضیه تحقیق ما این بود که همبستگی جمعیت بین متغیرهای X و Y غیر صفر است. دراینصورت، فرضیه مقابل(یا تحقیق) به عنوان غیر جهت‌دار مشخص می‌شود. وقتی فرضیه ما به این شکل بیان می‌شود، ما سعی در استنباط مثبت یا منفی بودن همبستگی جمعیت نداریم، بلکه فقط استنباط می‌کنیم که آیا همبستگی با صفر متفاوت است یا خیر. فرضیه‌های غیر جهت‌دار نیاز به استفاده از آزمون تی دو طرفه دارند .

فرضیات جهت‌دار برای همبستگی

امکان دارد دلیل قانع‌کننده‌ای (مثلاً وقتی مبنای نظری یا تجربی قوی داریم) برای آزمایش اینکه آیا همبستگی جمعیت مثبت است (یعنی به طور قابل توجهی بزرگتر از صفر است) یا منفی (یعنی به طور قابل توجهی کوچکتر از صفر است) داشته باشیم – نه تنها اینکه همبستگی جمعیت با صفر متفاوت است. در این صورت، فرضیه تحقیق به عنوان جهت‌دار مشخص می‌شود. این نوع فرضیه را می‌توان با استفاده از یک معیار یک‌طرفه آزمایش کرد.

شایان ذکر است که در مطالعات تحقیقاتی منتشر شده، محققان معمولاً نتایج آزمون معناداری (یعنی مقادیر p) را بر اساس نتایج آزمون غیر جهت‌دار (دو دامنه) ارائه می‌دهند، صرف نظر از اینکه فرضیه‌های اصلی آنها جهت‌دار یا غیرجهت‌دار باشد. اما باید در نظر داشته باشید که در شرایط برابر، فرضیه‌های جهت‌داری که با استفاده از معیار یک‌طرفه آزمایش می‌شوند، قوی‌تر از فرضیه‌های دوطرفه خواهند بود.

مثال برای آزمون فرضیات جهت‌دار ضریب همبستگی

فرض کنید که ما فرضیه‌ای داریم مبنی بر اینکه همبستگی جمعیت بین علاقه دانش‌آموز «interest» و پیشرفت تحصیلی دانش‌آموز «achieve» مثبت است( دقت کنید که فرضیه ما یک فرضیه جهت‌دار است).

فرضیه‌های صفر و جایگزین را می‌توان به صورت زیر نوشت:

آزمون فرضیات جهت‌دار برای ضریب همبستگی

در این حالت، فرضیه صفر بیان می‌کند که همبستگی جمعیت کمتر یا مساوی ۰ است، در حالی که فرضیه جایگزین این است که همبستگی جمعیت بیشتر از ۰ است.

شخصاً، من این روش نوشتاری را نسبت به رویکرد بالا ترجیح می‌دهم، زیرا توصیف بیشتری از طیف همبستگی‌های بالقوه‌ای که ممکن است در داده‌های نمونه شما مشاهده شود و با مقدار صفر سازگار است، ارائه می‌دهد. با این حال، هر دو رویکرد ارائه شده‌اند تا بتوانید روش‌های مختلفی را که مقدار صفر هنگام آزمایش یک فرضیه جهت‌دار نوشته می‌شود، مشاهده کنید.

محاسبه سطح معناداری در حالت فرضیه جهت‌دار

حال، بیایید تحلیل خود را در SPSS اجرا کنیم و در آن فرضیه مثبت بودن همبستگی جمعیت بین علاقه دانش‌آموز «interest» و پیشرفت تحصیلی «achieve» را آزمون کنیم.

مسیر محاسبه ضریب همبستگی خط در حالت آزمون فرضیات جهت‌دار

همبستگی پیرسون بین علاقه و پیشرفت تحصیلی مثبت و معنادار است (r=0.534, P<0.001) با استفاده از روش کوهن (1988)، این همبستگی را می‌توان بزرگ توصیف کرد.

ادامه یادگیری شما اینجاست

ویدیوی قبلی

آموزش آزمون t زوجی در SPSS | آموزش گام به گام و تفسیر خروجی

ویدیوی بعدی

چطور رگرسیون خطی ساده را در SPSS اجرا کنیم؟ | گام به گام تا تفسیر نتایج

رسول محمدی

برای مشاوره یا انجام پژوهش‌های آماری در تلگرام یا ایتا با شماره 09384226738 بطور مستقیم با من در ارتباط باشید.

دیدگاهتان را بنویسید لغو پاسخ