چطور رگرسیون خطی ساده را در SPSS اجرا کنیم؟ | گام به گام تا تفسیر نتایج

۲۷ تیر ۱۴۰۴

رسول محمدی

505 بازدید

تاریخ ویرایش : 19 مرداد 1404

آیا می‌توان بر اساس نمره آزمون‌های میان‌ترم، نمره نهایی دانشجویان را پیش‌بینی کرد؟ آیا می‌شود با دانستن میزان تبلیغات، میزان فروش را تخمین زد؟ پاسخ این سوال‌ها در یکی از مهم‌ترین و کاربردی‌ترین ابزارهای آماری به نام رگرسیون خطی ساده (Simple Linear Regression) نهفته است.

در این قسمت از آموزش SPSS، یاد می‌گیرید چگونه با استفاده از یک متغیر مستقل، رفتار یا مقدار یک متغیر وابسته را مدل‌سازی و پیش‌بینی کنید.

آنچه در این آموزش خواهید دید:

مفهوم رگرسیون خطی ساده به زبان ساده
اجرای گام ‌به‌ گام آن در SPSS
تحلیل خروجی‌ها شامل ضریب همبستگی چندگانه، معادله رگرسیون و نمودار خطی
تفسیر کاربردی نتایج برای استفاده در تحقیقات علمی یا تصمیم‌گیری‌های حرفه‌ای

اگر به دنبال یادگیری پیش‌بینی آماری و تحلیل رابطه بین متغیرها در محیط SPSS هستید، این قسمت را از دست ندهید. اینجا دقیقاً جایی‌ست که تحلیل داده‌ها به ابزار تصمیم‌گیری واقعی تبدیل می‌شود.

رگرسیون خطی ساده

رگرسیون خطی روشی است که می‌تواند برای آزمایش رابطه پیش‌بینی یک متغیر وابسته توسط یک یا چند متغیر مستقل مورد استفاده قرار گیرد. وقتی فقط یک متغیر پیش‌بینی‌کننده در مدل باشد، رگرسیون خطی از نوع ساده است. اگر دو یا چند متغیر پیش‌بینی‌کننده در مدل باشد، رگرسیون خطی چندگانه است.

مدل رگرسیون خطی ساده را می‌توان به صورت معادله زیر بیان کرد:

word image 1739 2

شیب خط رگرسیون

شیب رگرسیون (b1) در معادله بالا به عنوان تغییر پیش‌بینی‌شده در Y (متغیر پاسخ) به ازای یک واحد افزایش نمره خام در متغیر پیش‌بینی‌کننده (X) تفسیر می‌شود.

شیب رگرسیون مثبت نشان‌دهنده یک رابطه پیش‌بینی‌کننده مثبت بین X و Y است، که در آن مقادیر بالاتر در X، نمرات بالاتر در Y را پیش‌بینی می‌کنند (و Xهای پایین‌تر، Yهای پایین‌تر را پیش‌بینی می‌کنند). شیب منفی نشان‌دهنده یک رابطه منفی بین X و Y است، که در آن مقادیر بالاتر در X، مقادیر پایین‌تر در Y را پیش‌بینی می‌کنند (و Xهای پایین‌تر، Yهای بالاتر را پیش‌بینی می‌کنند). شیب 0 نشان‌دهنده نبود رابطه بین متغیرهای مستقل و وابسته است. شیب رگرسیون غیراستاندارد وابسته به مقیاس است و از نظر تئوری می‌تواند از منفی تا مثبت بی‌نهایت متغیر باشد.

محدوده شیب خط رگرسیون

معادله رگرسیون قبلی را می‌توان به دو جزء جداگانه، یک معادله پیش‌بینی رگرسیون و یک خطای پیش‌بینی، تجزیه کرد.

معادله خط رگرسیون

معادله پیش‌بینی رگرسیون ساده، که در آن نمره پیش‌بینی‌شده برای مورد ( i ) روی متغیر وابسته (Y) است. در این عبارت، هر مشاهده روی Y برابر با مجموع عرض از مبدأ برای خط و حاصلضرب شیب و امتیاز فرد (i) روی X است.

معادله خط رگرسیون

با مرتب‌سازی مجدد معادله اول و سپس جایگزینی آن با ، می‌بینیم که هر خطای پیش‌بینی برابر با مقدار مشاهده ‌شده روی Y و مقدار پیش‌بینی‌شده Y برای حالت (i) است.

ei در رگرسیون خطی به عنوان باقیمانده‌ شناخته می‌شود.

خطای رگرسیون

طریقه نوشتن آزمون فرضیات برای رگرسیون

شیب خط رگرسیون معمولاً برای معنی‌داری آماری مورد آزمایش قرار می‌گیرد، که در آن رد فرضیه صفر به معنای شیب جامعه ( ) غیر صفر (در مورد فرضیه غیر جهت‌دار) یا بزرگتر یا کوچکتر از ۰ (در مورد فرضیه جهت‌دار) است. حفظ فرضیه صفر منجر به این استنباط می‌شود که شیب رگرسیون جامعه برابر با ۰ است (که نشان‌دهنده عدم وجود رابطه بین دو متغیر است).

آزمون فرضیات (غیر جهت‌دار)

وقتی محقق می‌خواهد یک فرضیه غیر جهت‌دار (یعنی اینکه شیب رگرسیون جامعه غیر صفر است) را بر اساس داده‌های نمونه آزمایش کند، فرضیه‌های صفر و جایگزین/تحقیق را می‌توان به صورت زیر نوشت:

آزمون فرضیات غیر جهت‌دار برای شیب خط رگرسیون

آزمون فرضیات (جهت‌دار)

وقتی محقق می‌خواهد یک فرضیه جهت‌دار را آزمایش کند (یعنی اینکه شیب رگرسیون جامعه بزرگتر از صفر است)، فرضیه‌های صفر وجایگزین/تحقیق را می‌توان به صورت زیر نوشت:

آزمون فرضیات جهت‌دار برای شیب خط رگرسیون

مثال برای رگرسیون خطی ساده در SPSS

در این مثال یک آزمون رگرسیون خطی ساده انجام می‌دهیم تا ببینیم آیا رابطه پیش‌بینی‌کننده معناداری بین میزان تسلط «mastery» و پیشرفت تحصیلی دانش‌آموزان «achieve» وجود دارد یا خیر؟ هر دو متغیر به صورت پیوسته در نظر گرفته شده‌اند ( فرضیه خود را با در نظر گرفتن α=0.05 آزمایش می‌کنیم).

داده‌های وارد شده در نرم افزار SPSS

تأثیر تسلط روی پیشرفت

آزمون فرضیات

از آنجایی که ما فقط بررسی می‌کنیم که آیا شیب جامعه غیر صفر است یا خیر، فرضیه‌های صفر و جایگزین خود را به صورت زیر می‌نویسیم:

آزمون فرضیات غیر جهت‌دار برای مثال رگرسیون خطی ساده

مسیر انجام رگرسیون در SPSS

برای انجام رگرسیون خطی ساده به مسیر Analyze>Regression>Linear می‌رویم. در این بخش متغیر وابسته (پیشرفت تحصیلی) «achieve» را به قسمت «Dependent» و متغیر تسلط «mastery» را به قسمت «Independent» منتقل می‌کنیم. در نهایت روی «OK» کلیک می‌کنیم تا نتایج را ببینیم.

مسیر انجام رگرسیون خطی ساده در نرم افزار spss

خروجی نرم افزار

خروجی نرم افزار شامل سه جدول است که در ادامه مطالب مهم هر جدول را توضیح خواهیم داد.

خروجی نرم افزار برای رگرسیون خطی ساده

مفهوم از عرض از مبدأ در رگرسیون خطی ساده

عرض از مبدا ( ) به صورت زیر تفسیر می‌شود. نمره پیشرفت پیش‌بینی‌شده برای دانش‌آموزی که در معیار تسلط نمره ۰ می‌گیرد، 1.852 است. قابل ذکر است که اگر ۰ یک مقدار غیر منطقی برای معیار تسلط باشد، عرض از مبدأ لزوما برای ما مفهوم ندارد.

عرض از مبدأ در رگرسیون خطی ساده

در اینجا، ضرایب بالا را در معادله پیش‌بینی رگرسیون جایگزین کرده‌ام.

word image 1739 15

مفهوم شیب در رگرسیون خطی ساده

شیب خط رگرسیون (b1) را می‌توان به صورت زیر تفسیر کرد: «به ازای هر یک واحد افزایش در نمره تسلط، نمره پیشرفت پیش‌بینی‌شده برای دانش‌آموزان به میزان 0.524 واحد افزایش می‌یابد.»

ستون Sig. شامل مقدار p (دو طرفه) مرتبط با شیب رگرسیون است. به طور کلی، اگر p≤α باشد، فرضیه صفر را رد می‌کنیم و استنباط می‌کنیم که شیب رگرسیون جمعیت برابر با 0 نیست. در این مثال، مقدار p به صورت «0.000» نشان داده شده است. وقتی این اتفاق می‌افتد، مقدار p صفر نیست، بلکه بسیار نزدیک به 0 است (SPSS این عدد را تا 3 رقم اعشار نشان می‌دهد). در این صورت، محققان معمولاً این نتیجه را به صورت p<0.001 گزارش می‌کنند. چون مقدار p از مقدار α (0.05)کوچکتر است، فرضیه صفر را رد می‌کنیم و استنباط می‌کنیم که شیب رگرسیون جمعیت صفر نیست.

شیب در رگرسیون خطی ساده

آزمون معنی‌داری عرض از مبدأ

در شرایطی که تفسیر عرض از مبدأ امکان پذیر باشد، آزمون معناداری آزمونی است که نشان می‌دهد آیا عرض از مبدأ به طور معنی‌داری با 0 تفاوت معنی‌دار دارد یا خیر؟

آزمون معنی‌داری عرض از مبدأ در رگرسیون خطی ساده

در مثال ما چون مقدار P کوچکتر از 0.05 است، نتیجه می‌گیریم که مقدار عرض از مبدأ با 0 تفاوت معنی‌دار دارد.

ضریب رگرسیون استاندارد

در رگرسیون خطی ساده، ضریب رگرسیون استاندارد شده برابر با همبستگی پیرسون بین متغیر مستقل و وابسته است. ضریب رگرسیون استاندارد شده اغلب به عنوان بتا شناخته می‌شود. از آنجایی که این ضریب هنگام اجرای رگرسیون ساده برابر با r پیرسون است، می‌توانیم از معیار کوهن (1988) برای قضاوت در مورد بزرگی رابطه بین دو متغیر بر اساس همبستگی استفاده کنیم (قابل ذکر است که محدوده نظری همبستگی بین 1- و 1+ است):

ضریب رگرسیون استاندارد (بتا) در رگرسیون خطی ساده

معیار کوهن (1988) برای توصیف رابطه بین دو متغیر به شرح زیر است:

معیار کوهن برای سنجش بزرگی رابطه در رگرسیون خطی ساده

با استفاده از این معیار، می‌توانیم رابطه بین تسلط و پیشرفت را بزرگ توصیف کنیم.

همبستگی چندگانه

جدول اول در خروجی نرم افزار SPSS، خلاصه نتایج رگرسیون را نمایش می‌دهد. این بخش از خروجی در زمینه رگرسیون خطی ساده کاربرد کمتری دارد، اما در زمینه رگرسیون چندگانه اهمیت بسیار بیشتری پیدا می‌کند. با این وجود، R در جدول خلاصه مدل، «همبستگی چندگانه» است (یعنی همبستگی بین مجموعه‌ای از متغیرهای مستقل و متغیر وابسته). مقدار این همبستگی بین ۰ و ۱ است. مربع R ضریب تعیین است که مقادیر مرزی آن ۰ و ۱ است. این ضریب، نسبت تغییرات در متغیر وابسته را که توسط متغیر مستقل قابل توضیح است را نشان می‌دهد. در اینجا، می‌توانیم بگوییم که تسلط، 33 درصد از تغییرات در پیشرفت تحصیلی را توضیح می‌دهد.

آزمون F آزمونی است که برای بررسی ارتباط بین متغیرهای مستقل و متغیرهای وابسته در یک مدل رگرسیون استفاده می‌شود. در این مثال مقدار P، «0.000» بدست آمده است که کوچکتر از 0.05 است. بنابراین متغیر مستقل و وابسته رابطه دارند.

ضریب همبستگی و ضریب تبیین در رگرسیون خطی ساده

نمودار پراکنش برای بررسی رابطه

می‌توانیم رابطه بین دو متغیر خود را با استفاده از تابع نمودار پراکندگی در SPSS نشان دهیم. به این منظور از مسیر Analyze>Legacy Dialogs>Scatter/Dot اقدام می‌کنیم. در پنجره باز شده «Simple Scatter» را انتخاب و «Define» را کلیک می‌کنیم.

مسیر رسم نمودار پراکنش برای دو متغیر

در مرحله بعد متغیر پاسخ «achieve» را به «Y Axis» و متغیر توضیحی «mastery» را به «X axis» انتقال می‌دهیم. در نهایت روی «OK» کلیک می‌کنیم تا نتایج در خروجی درج شود.

در خروجی نرم افزار اگر روی نمودار دوبار کلیک کنیم، یک ویرایشگر نمودار باز می‌شود که در آن می‌توانیم بهترین خط را برازش کنیم.

نمودار پراکنش دو متغیر

برازش خط رگرسیونی میان نقاط

در قسمت ویرایشگر نمودار روی آیکون «Add Fit Line at Total» کلیک کنید. روی پنجره باز شده نوع نمودار را خطی «Linear» انتخاب می‌‌کنیم تا روی نمودار پراکنش، برازش خط انجام شود.

برازش خط بین نقاط در نمودار پراکنش

معادله نشان داده شده روی این نمودار، معادله پیش‌بینی رگرسیون است. این معادله با همان عرض از مبدا و شیب خروجی رگرسیون است که قبلاً در خروجی مشاهده کردیم (شکل زیر).

مقایسه ضرایب رگرسیون روی خط پراکنش و رگرسیون خطی ساده

رگرسیون خطی ساده با استفاده از یک متغیر اسمی دودویی

رگرسیون خطی ساده را می‌توان با استفاده از متغیر اسمی دو وجهی به عنوان متغیر توضیحی نیز انجام داد. به عنوان مثال رابطه بین جنسیت «genderid» و پیشرفت تحصیلی «achieve» را در ادامه بررسی می‌کنیم. مانند مثال قبل پنجره رگرسیون خطی را باز می‌کنیم و متغیر جنسیت را به قسمت «Independent» و متغیر پیشرفت تحصیلی را به بخش «achieve» انتقال می‌دهیم.

انجام رگرسیون برای متغیر مستقل اسمی

در اینجا، می‌توانیم یک رگرسیون خطی با جنسیت با کدهای 0 برای مردان و 1 برای زنان انجام دهیم. متغیر جنسیت در مدل به عنوان متغیر مستقل در نظر گرفته می‌شود.

این رگرسیون با سایر سیستم‌های کدگذاری دودویی نیز کار خواهد کرد، اما از آنجایی که متغیر مستقل با ۰ و ۱ کدگذاری شده است، اکنون می‌توانیم عرض از مبدأ را در تفسیر خود استفاده کنیم.

تأثیر جنسیت بر پیشرفت تحصیلی

نتایج رگرسیون در شکل زیر نشان داده شده است. شیب رگرسیون برای «جنسیت» معنی‌دار نیست (P=0.205). با این حال، می‌توانیم عرض از مبدأ و شیب را تفسیر کنیم.

عرض از مبدا، مقدار پیش‌بینی‌شده متغیر Y وقتی x=0 است، می‌باشد. در واقع، این مقدار، میانگین Y وقتی x=0 است، می‌باشد. از آنجایی که در متغیر «جنسیت» کد مردان 0 است، می‌توانیم عرض از مبدا را به عنوان میانگین برای افراد مرد تفسیر کنیم (یعنی میانگین پیشرفت تحصیلی برای مردان 3.598 است). شیب، افزایش پیش‌بینی‌شده روی Y را به ازای یک واحد افزایش روی X نشان می‌دهد. در این مطالعه، شیب، تفاوت میانگین‌ها بین مردان و زنان است. بنابراین می‌توان گفت میانگین پیشرفت تحصیلی در زنان 0.326- واحد نسبت به مردان کمتر است.

جدول ضرایب رگرسیون

نمودار پراکندگی رابطه بین جنسیت و پیشرفت تحصیلی

نمودار پراکندگی رابطه بین جنسیت و پیشرفت تحصیلی در ادامه رسم شده است.

رسم نمودار پراکندگی برای دو متغیر جنسیت و پیشرفت تحصیلی

در x=0 (مردان)، نمره پیشرفت پیش‌بینی شده 3.598 است. در حالیکه در x=1 (زنان)، نمره پیشرفت پیش‌بینی شده 3.272 است. این مقدار 0.326- کمتر از مردان است. اطلاعات نمایش داده شده روی نمودار دقیقاً با جدول ضرایب رگرسیونی مشابه است.

ادامه یادگیری شما اینجاست

ویدیوی قبلی

چطور همبستگی پیرسون را در SPSS محاسبه کنیم؟ | آموزش گام‌ به‌ گام و تفسیر خروجی

ویدیوی بعدی

بررسی فرض‌های رگرسیون خطی در SPSS | کلید تحلیل صحیح و معتبر مدل

رسول محمدی

برای مشاوره یا انجام پژوهش‌های آماری در تلگرام یا ایتا با شماره 09384226738 بطور مستقیم با من در ارتباط باشید.

دیدگاهتان را بنویسید لغو پاسخ