آیا بین یک متغییر و متغییر دیگر رابطه معناداری (همبستگی) وجود دارد؟

آیا بین میزان تخفیف و فروش روزانه در فلان بیزینس رابطه ای وجود داره؟ اگر آری رابطه چه مدلی هست؟

ازینجا یه مقدار و یه مقدارم PDF

منظورم از مدل این است که ایا رابطه مثبت است یا منفی (یعنی اگر مثلا تخفیف رفت بالا فروش بره بالا که میشه مثبت یا برعکس میشه منفی)

خب چند تا متن کپی می کنم برای راهنمایی:

گاهی اوقات پژوهشگری علاقه دارد بداند که چه رابطه‌ای بین دو متغیر وجود دارد. برای مثال آیا بین میزان بارش در ۱۰ نقطه با میزان رشد گیاهان در این ۱۰ نقطه رابطه‌ای وجود دارد یا خیر. یا اینکه آیا بین میزان افسردگی افراد با میزان عزت نفس فرد رابطه‌ای وجود دارد یا نه. برای این منظور می‌توان از آزمون‌های همبستگی استفاده کرد. آزمون‌های همبستگی به دو دسته کلی پارامتریک (تحلیل همبستگی پیرسون) و ناپارامتریک (تحلیل همبستگی اسپیرمن) تقسیم می‌شوند.

-ضریب همبستگی کندال: میزان ارتباط بین متغیر های رتبه ای و اسمی را می دهد.

تفاوت تحلیل همبستگی پیرسون و همبستگی اسپیرمن

برای بررسی همبستگی باید حداقل دو متغیر داشته باشید. اگر داده‌های شما در سطح فاصله‌ای یا نسبی باشند مانند نمره افسردگی، شادکامی، سن، قد، میزان پرش یک ورزشکار و … از تحلیل همبستگی پیرسون استفاده خواهد شد. همچنین اگر داده‌های شما به صورت رتبه‌ای باشند مانند تحصیلات، سال ورود به دانشگاه، مرتبه شغلی و … از تحلیل همبستگی اسپیرمن استفاده خواهد شد.

نکته مهم: برخی از متغیرها را می‌توان هم به صورت فاصله‌ای یا نسبی به کار برد و هم به صورت رتبه‌ای. برای مثال اگر شما سن آزمودنی‌های خود را به صورت عدد (برای مثال ۲۶، ۲۷، ۲۸) ثبت کرده باشید این متغیر فاصله‌ای است اما اگر به صورت طیف قرار داده باشید (برای مثال ۰ تا ۱۰ سال، ۱۰ تا ۲۰ سال، ۲۰ تا ۳۰ سال) در این صورت این متغیر رتبه‌ایی است.

ضریب همبستگی چه معنایی دارد؟

ضریب همسبتگی همیشه عددی بین ۱ تا ۱- است. ضریب همبستگی بین ۰ تا ۱ به معنی داشتن همبستگی مثبت است و هرچه این ضریب به ۱ نزدیک‌تر باشد همبستگی قوی‌تر است. همبستگی مثبت یعنی با افزایش نمره یک متغیر نمره متغیر دیگر نیز افزایش می‌یابد، مثلاً با افزایش نمره افسردگی نمره اضطراب نیز افزایش می‌یابد. ضریب همبستگی بین ۰ تا ۱- به معنی داشتن همبستگی منفی بین دو متغیر است و هرچه عدد به ۱- نزدیک‌‎تر باشد یعنی همبستگی منفی قوی‌تر است. همبستگی منفی یعنی با کاهش نمره یک متغیر نمره متغیر دیگر افزایش می‌یابد، مثلاً با افزایش افسردگی میزان شادکامی کاهش می‌یابد.

نحوه تفسیر ضریب همبستگی

در بالا گفتیم که ضریب همبستگی بین ۱ تا ۱- است. اما اعداد این ضریب چه معنایی دارند؟ برای مثال ضریب همبستگی ۰٫۴۷ نشان دهنده ارتباط قوی بین دو متغیر است یا ارتباط ضعیف؟ برای تفسیر ضریب همبستگی می‌توان از راهنمای زیر استفاده کرد که در بسیاری از کتاب‌های آماری آمده است:

– ضریب بین ۰ تا ۰٫۲۹ نشان دهنده همبستگی ضعیف

– ضریب بین ۰٫۳۰ تا ۰٫۶۹ نشان دهنده همبستگی متوسط

– ضریب بین ۰٫۷۰ تا ۱ نشان دهنده همبستگی قوی

برخی از موضوعاتی که با استفاده از تحلیل همبستگی انجام گرفته‌اند آورده شده است:

 – رابطه بین سلامت روانی با نمره درسی

 – رابطه بین جذابیت با اعتماد دیگران به فرد

 – رابطه بین رضایت مشتریان از پاسخگویی پرسنل با میزان خرید آنان از فروشگاه

 – رابطه بین عزت نفس با ابتلا به بیماری روانی در دانش آموزان

– رابطه بین ساعات استفاده از اینترنت با نمره کسب شده توسط دانشجویان

کد پایتون

12345678import pandas as pd
a = [[1, 2, 3],
     [5, 6, 9],
     [5, 6, 11],
     [5, 6, 13],
     [5, 3, 13]]
df = pd.DataFrame(data=a)
df.corr()

Result:

1234         0         1         2
0  1.000000  0.745601  0.916579
1  0.745601  1.000000  0.544248
2  0.916579  0.544248  1.000000

فرض های مسئله:

-مشاهدات باید مستقل باشند.
-برای تمام مقادیر متغیر مستقل، توزیع مقادیر متغیر وابسته باید نرمال باشد.
-واریانس متغیر وابسته باید برای تمام مقادیر متغیر مستقل یکسان باشد.
-رابطه بین متغیر مستقل و وابسته در جامعه باید خطی باشد.

رگرسیون:


اگر بین دو متغیر X و Y همبستگی وجود داشته باشد می توان یکی از این دو متغیر را بر حسب دیگری برآورد
کرد این عمل محتوای مبحث رگرسیون است. خط رگرسیون ما را به پیش بینی ویژگی های آنچه که در نمونه ما
موجود نیست قادر می‌سازد.

Leave a comment

Your email address will not be published. Required fields are marked *