چطور رگرسیون خطی ساده را در SPSS اجرا کنیم؟ | گام به گام تا تفسیر نتایج
آیا میتوان بر اساس نمره آزمونهای میانترم، نمره نهایی دانشجویان را پیشبینی کرد؟ آیا میشود با دانستن میزان تبلیغات، میزان فروش را تخمین زد؟ پاسخ این سوالها در یکی از مهمترین و کاربردیترین ابزارهای آماری به نام رگرسیون خطی ساده (Simple Linear Regression) نهفته است.
در این قسمت از آموزش SPSS، یاد میگیرید چگونه با استفاده از یک متغیر مستقل، رفتار یا مقدار یک متغیر وابسته را مدلسازی و پیشبینی کنید.
آنچه در این آموزش خواهید دید:
- مفهوم رگرسیون خطی ساده به زبان ساده
- اجرای گام به گام آن در SPSS
- تحلیل خروجیها شامل ضریب همبستگی چندگانه، معادله رگرسیون و نمودار خطی
- تفسیر کاربردی نتایج برای استفاده در تحقیقات علمی یا تصمیمگیریهای حرفهای
اگر به دنبال یادگیری پیشبینی آماری و تحلیل رابطه بین متغیرها در محیط SPSS هستید، این قسمت را از دست ندهید. اینجا دقیقاً جاییست که تحلیل دادهها به ابزار تصمیمگیری واقعی تبدیل میشود.
رگرسیون خطی ساده
رگرسیون خطی روشی است که میتواند برای آزمایش رابطه پیشبینی یک متغیر وابسته توسط یک یا چند متغیر مستقل مورد استفاده قرار گیرد. وقتی فقط یک متغیر پیشبینیکننده در مدل باشد، رگرسیون خطی از نوع ساده است. اگر دو یا چند متغیر پیشبینیکننده در مدل باشد، رگرسیون خطی چندگانه است.
مدل رگرسیون خطی ساده را میتوان به صورت معادله زیر بیان کرد:
![]()

شیب خط رگرسیون
شیب رگرسیون (b1) در معادله بالا به عنوان تغییر پیشبینیشده در Y (متغیر پاسخ) به ازای یک واحد افزایش نمره خام در متغیر پیشبینیکننده (X) تفسیر میشود.
شیب رگرسیون مثبت نشاندهنده یک رابطه پیشبینیکننده مثبت بین X و Y است، که در آن مقادیر بالاتر در X، نمرات بالاتر در Y را پیشبینی میکنند (و Xهای پایینتر، Yهای پایینتر را پیشبینی میکنند). شیب منفی نشاندهنده یک رابطه منفی بین X و Y است، که در آن مقادیر بالاتر در X، مقادیر پایینتر در Y را پیشبینی میکنند (و Xهای پایینتر، Yهای بالاتر را پیشبینی میکنند). شیب 0 نشاندهنده نبود رابطه بین متغیرهای مستقل و وابسته است. شیب رگرسیون غیراستاندارد وابسته به مقیاس است و از نظر تئوری میتواند از منفی تا مثبت بینهایت متغیر باشد.

معادله رگرسیون قبلی را میتوان به دو جزء جداگانه، یک معادله پیشبینی رگرسیون و یک خطای پیشبینی، تجزیه کرد.

معادله پیشبینی رگرسیون ساده، که در آن نمره پیشبینیشده برای مورد ( i ) روی متغیر وابسته (Y) است. در این عبارت، هر مشاهده روی Y برابر با مجموع عرض از مبدأ برای خط و حاصلضرب شیب و امتیاز فرد (i) روی X است.

با مرتبسازی مجدد معادله اول و سپس جایگزینی آن با ، میبینیم که هر خطای پیشبینی برابر با مقدار مشاهده شده روی Y و مقدار پیشبینیشده Y برای حالت (i) است.
ei در رگرسیون خطی به عنوان باقیمانده شناخته میشود.

طریقه نوشتن آزمون فرضیات برای رگرسیون
شیب خط رگرسیون معمولاً برای معنیداری آماری مورد آزمایش قرار میگیرد، که در آن رد فرضیه صفر به معنای شیب جامعه ( ) غیر صفر (در مورد فرضیه غیر جهتدار) یا بزرگتر یا کوچکتر از ۰ (در مورد فرضیه جهتدار) است. حفظ فرضیه صفر منجر به این استنباط میشود که شیب رگرسیون جامعه برابر با ۰ است (که نشاندهنده عدم وجود رابطه بین دو متغیر است).
آزمون فرضیات (غیر جهتدار)
وقتی محقق میخواهد یک فرضیه غیر جهتدار (یعنی اینکه شیب رگرسیون جامعه غیر صفر است) را بر اساس دادههای نمونه آزمایش کند، فرضیههای صفر و جایگزین/تحقیق را میتوان به صورت زیر نوشت:

آزمون فرضیات (جهتدار)
وقتی محقق میخواهد یک فرضیه جهتدار را آزمایش کند (یعنی اینکه شیب رگرسیون جامعه بزرگتر از صفر است)، فرضیههای صفر وجایگزین/تحقیق را میتوان به صورت زیر نوشت:

مثال برای رگرسیون خطی ساده در SPSS
در این مثال یک آزمون رگرسیون خطی ساده انجام میدهیم تا ببینیم آیا رابطه پیشبینیکننده معناداری بین میزان تسلط «mastery» و پیشرفت تحصیلی دانشآموزان «achieve» وجود دارد یا خیر؟ هر دو متغیر به صورت پیوسته در نظر گرفته شدهاند ( فرضیه خود را با در نظر گرفتن α=0.05 آزمایش میکنیم).


آزمون فرضیات
از آنجایی که ما فقط بررسی میکنیم که آیا شیب جامعه غیر صفر است یا خیر، فرضیههای صفر و جایگزین خود را به صورت زیر مینویسیم:

مسیر انجام رگرسیون در SPSS
برای انجام رگرسیون خطی ساده به مسیر Analyze>Regression>Linear میرویم. در این بخش متغیر وابسته (پیشرفت تحصیلی) «achieve» را به قسمت «Dependent» و متغیر تسلط «mastery» را به قسمت «Independent» منتقل میکنیم. در نهایت روی «OK» کلیک میکنیم تا نتایج را ببینیم.

خروجی نرم افزار
خروجی نرم افزار شامل سه جدول است که در ادامه مطالب مهم هر جدول را توضیح خواهیم داد.

مفهوم از عرض از مبدأ در رگرسیون خطی ساده
عرض از مبدا ( ) به صورت زیر تفسیر میشود. نمره پیشرفت پیشبینیشده برای دانشآموزی که در معیار تسلط نمره ۰ میگیرد، 1.852 است. قابل ذکر است که اگر ۰ یک مقدار غیر منطقی برای معیار تسلط باشد، عرض از مبدأ لزوما برای ما مفهوم ندارد.

در اینجا، ضرایب بالا را در معادله پیشبینی رگرسیون جایگزین کردهام.

مفهوم شیب در رگرسیون خطی ساده
شیب خط رگرسیون (b1) را میتوان به صورت زیر تفسیر کرد: «به ازای هر یک واحد افزایش در نمره تسلط، نمره پیشرفت پیشبینیشده برای دانشآموزان به میزان 0.524 واحد افزایش مییابد.»
ستون Sig. شامل مقدار p (دو طرفه) مرتبط با شیب رگرسیون است. به طور کلی، اگر p≤α باشد، فرضیه صفر را رد میکنیم و استنباط میکنیم که شیب رگرسیون جمعیت برابر با 0 نیست. در این مثال، مقدار p به صورت «0.000» نشان داده شده است. وقتی این اتفاق میافتد، مقدار p صفر نیست، بلکه بسیار نزدیک به 0 است (SPSS این عدد را تا 3 رقم اعشار نشان میدهد). در این صورت، محققان معمولاً این نتیجه را به صورت p<0.001 گزارش میکنند. چون مقدار p از مقدار α (0.05)کوچکتر است، فرضیه صفر را رد میکنیم و استنباط میکنیم که شیب رگرسیون جمعیت صفر نیست.

آزمون معنیداری عرض از مبدأ
در شرایطی که تفسیر عرض از مبدأ امکان پذیر باشد، آزمون معناداری آزمونی است که نشان میدهد آیا عرض از مبدأ به طور معنیداری با 0 تفاوت معنیدار دارد یا خیر؟

در مثال ما چون مقدار P کوچکتر از 0.05 است، نتیجه میگیریم که مقدار عرض از مبدأ با 0 تفاوت معنیدار دارد.
ضریب رگرسیون استاندارد
در رگرسیون خطی ساده، ضریب رگرسیون استاندارد شده برابر با همبستگی پیرسون بین متغیر مستقل و وابسته است. ضریب رگرسیون استاندارد شده اغلب به عنوان بتا شناخته میشود. از آنجایی که این ضریب هنگام اجرای رگرسیون ساده برابر با r پیرسون است، میتوانیم از معیار کوهن (1988) برای قضاوت در مورد بزرگی رابطه بین دو متغیر بر اساس همبستگی استفاده کنیم (قابل ذکر است که محدوده نظری همبستگی بین 1- و 1+ است):

معیار کوهن (1988) برای توصیف رابطه بین دو متغیر به شرح زیر است:

با استفاده از این معیار، میتوانیم رابطه بین تسلط و پیشرفت را بزرگ توصیف کنیم.
همبستگی چندگانه
جدول اول در خروجی نرم افزار SPSS، خلاصه نتایج رگرسیون را نمایش میدهد. این بخش از خروجی در زمینه رگرسیون خطی ساده کاربرد کمتری دارد، اما در زمینه رگرسیون چندگانه اهمیت بسیار بیشتری پیدا میکند. با این وجود، R در جدول خلاصه مدل، «همبستگی چندگانه» است (یعنی همبستگی بین مجموعهای از متغیرهای مستقل و متغیر وابسته). مقدار این همبستگی بین ۰ و ۱ است. مربع R ضریب تعیین است که مقادیر مرزی آن ۰ و ۱ است. این ضریب، نسبت تغییرات در متغیر وابسته را که توسط متغیر مستقل قابل توضیح است را نشان میدهد. در اینجا، میتوانیم بگوییم که تسلط، 33 درصد از تغییرات در پیشرفت تحصیلی را توضیح میدهد.
آزمون F آزمونی است که برای بررسی ارتباط بین متغیرهای مستقل و متغیرهای وابسته در یک مدل رگرسیون استفاده میشود. در این مثال مقدار P، «0.000» بدست آمده است که کوچکتر از 0.05 است. بنابراین متغیر مستقل و وابسته رابطه دارند.

نمودار پراکنش برای بررسی رابطه
میتوانیم رابطه بین دو متغیر خود را با استفاده از تابع نمودار پراکندگی در SPSS نشان دهیم. به این منظور از مسیر Analyze>Legacy Dialogs>Scatter/Dot اقدام میکنیم. در پنجره باز شده «Simple Scatter» را انتخاب و «Define» را کلیک میکنیم.

در مرحله بعد متغیر پاسخ «achieve» را به «Y Axis» و متغیر توضیحی «mastery» را به «X axis» انتقال میدهیم. در نهایت روی «OK» کلیک میکنیم تا نتایج در خروجی درج شود.
در خروجی نرم افزار اگر روی نمودار دوبار کلیک کنیم، یک ویرایشگر نمودار باز میشود که در آن میتوانیم بهترین خط را برازش کنیم.

برازش خط رگرسیونی میان نقاط
در قسمت ویرایشگر نمودار روی آیکون «Add Fit Line at Total» کلیک کنید. روی پنجره باز شده نوع نمودار را خطی «Linear» انتخاب میکنیم تا روی نمودار پراکنش، برازش خط انجام شود.

معادله نشان داده شده روی این نمودار، معادله پیشبینی رگرسیون است. این معادله با همان عرض از مبدا و شیب خروجی رگرسیون است که قبلاً در خروجی مشاهده کردیم (شکل زیر).

رگرسیون خطی ساده با استفاده از یک متغیر اسمی دودویی
رگرسیون خطی ساده را میتوان با استفاده از متغیر اسمی دو وجهی به عنوان متغیر توضیحی نیز انجام داد. به عنوان مثال رابطه بین جنسیت «genderid» و پیشرفت تحصیلی «achieve» را در ادامه بررسی میکنیم. مانند مثال قبل پنجره رگرسیون خطی را باز میکنیم و متغیر جنسیت را به قسمت «Independent» و متغیر پیشرفت تحصیلی را به بخش «achieve» انتقال میدهیم.

در اینجا، میتوانیم یک رگرسیون خطی با جنسیت با کدهای 0 برای مردان و 1 برای زنان انجام دهیم. متغیر جنسیت در مدل به عنوان متغیر مستقل در نظر گرفته میشود.
این رگرسیون با سایر سیستمهای کدگذاری دودویی نیز کار خواهد کرد، اما از آنجایی که متغیر مستقل با ۰ و ۱ کدگذاری شده است، اکنون میتوانیم عرض از مبدأ را در تفسیر خود استفاده کنیم.

نتایج رگرسیون در شکل زیر نشان داده شده است. شیب رگرسیون برای «جنسیت» معنیدار نیست (P=0.205). با این حال، میتوانیم عرض از مبدأ و شیب را تفسیر کنیم.
عرض از مبدا، مقدار پیشبینیشده متغیر Y وقتی x=0 است، میباشد. در واقع، این مقدار، میانگین Y وقتی x=0 است، میباشد. از آنجایی که در متغیر «جنسیت» کد مردان 0 است، میتوانیم عرض از مبدا را به عنوان میانگین برای افراد مرد تفسیر کنیم (یعنی میانگین پیشرفت تحصیلی برای مردان 3.598 است). شیب، افزایش پیشبینیشده روی Y را به ازای یک واحد افزایش روی X نشان میدهد. در این مطالعه، شیب، تفاوت میانگینها بین مردان و زنان است. بنابراین میتوان گفت میانگین پیشرفت تحصیلی در زنان 0.326- واحد نسبت به مردان کمتر است.

نمودار پراکندگی رابطه بین جنسیت و پیشرفت تحصیلی
نمودار پراکندگی رابطه بین جنسیت و پیشرفت تحصیلی در ادامه رسم شده است.

در x=0 (مردان)، نمره پیشرفت پیشبینی شده 3.598 است. در حالیکه در x=1 (زنان)، نمره پیشرفت پیشبینی شده 3.272 است. این مقدار 0.326- کمتر از مردان است. اطلاعات نمایش داده شده روی نمودار دقیقاً با جدول ضرایب رگرسیونی مشابه است.
نظرات :