آیا بین میزان تخفیف و فروش روزانه در فلان بیزینس رابطه ای وجود داره؟ اگر آری رابطه چه مدلی هست؟
ازینجا یه مقدار و یه مقدارم PDF
منظورم از مدل این است که ایا رابطه مثبت است یا منفی (یعنی اگر مثلا تخفیف رفت بالا فروش بره بالا که میشه مثبت یا برعکس میشه منفی)
خب چند تا متن کپی می کنم برای راهنمایی:
گاهی اوقات پژوهشگری علاقه دارد بداند که چه رابطهای بین دو متغیر وجود دارد. برای مثال آیا بین میزان بارش در ۱۰ نقطه با میزان رشد گیاهان در این ۱۰ نقطه رابطهای وجود دارد یا خیر. یا اینکه آیا بین میزان افسردگی افراد با میزان عزت نفس فرد رابطهای وجود دارد یا نه. برای این منظور میتوان از آزمونهای همبستگی استفاده کرد. آزمونهای همبستگی به دو دسته کلی پارامتریک (تحلیل همبستگی پیرسون) و ناپارامتریک (تحلیل همبستگی اسپیرمن) تقسیم میشوند.
-ضریب همبستگی کندال: میزان ارتباط بین متغیر های رتبه ای و اسمی را می دهد.
تفاوت تحلیل همبستگی پیرسون و همبستگی اسپیرمن
برای بررسی همبستگی باید حداقل دو متغیر داشته باشید. اگر دادههای شما در سطح فاصلهای یا نسبی باشند مانند نمره افسردگی، شادکامی، سن، قد، میزان پرش یک ورزشکار و … از تحلیل همبستگی پیرسون استفاده خواهد شد. همچنین اگر دادههای شما به صورت رتبهای باشند مانند تحصیلات، سال ورود به دانشگاه، مرتبه شغلی و … از تحلیل همبستگی اسپیرمن استفاده خواهد شد.
نکته مهم: برخی از متغیرها را میتوان هم به صورت فاصلهای یا نسبی به کار برد و هم به صورت رتبهای. برای مثال اگر شما سن آزمودنیهای خود را به صورت عدد (برای مثال ۲۶، ۲۷، ۲۸) ثبت کرده باشید این متغیر فاصلهای است اما اگر به صورت طیف قرار داده باشید (برای مثال ۰ تا ۱۰ سال، ۱۰ تا ۲۰ سال، ۲۰ تا ۳۰ سال) در این صورت این متغیر رتبهایی است.
ضریب همبستگی چه معنایی دارد؟
ضریب همسبتگی همیشه عددی بین ۱ تا ۱- است. ضریب همبستگی بین ۰ تا ۱ به معنی داشتن همبستگی مثبت است و هرچه این ضریب به ۱ نزدیکتر باشد همبستگی قویتر است. همبستگی مثبت یعنی با افزایش نمره یک متغیر نمره متغیر دیگر نیز افزایش مییابد، مثلاً با افزایش نمره افسردگی نمره اضطراب نیز افزایش مییابد. ضریب همبستگی بین ۰ تا ۱- به معنی داشتن همبستگی منفی بین دو متغیر است و هرچه عدد به ۱- نزدیکتر باشد یعنی همبستگی منفی قویتر است. همبستگی منفی یعنی با کاهش نمره یک متغیر نمره متغیر دیگر افزایش مییابد، مثلاً با افزایش افسردگی میزان شادکامی کاهش مییابد.
نحوه تفسیر ضریب همبستگی
در بالا گفتیم که ضریب همبستگی بین ۱ تا ۱- است. اما اعداد این ضریب چه معنایی دارند؟ برای مثال ضریب همبستگی ۰٫۴۷ نشان دهنده ارتباط قوی بین دو متغیر است یا ارتباط ضعیف؟ برای تفسیر ضریب همبستگی میتوان از راهنمای زیر استفاده کرد که در بسیاری از کتابهای آماری آمده است:
– ضریب بین ۰ تا ۰٫۲۹ نشان دهنده همبستگی ضعیف
– ضریب بین ۰٫۳۰ تا ۰٫۶۹ نشان دهنده همبستگی متوسط
– ضریب بین ۰٫۷۰ تا ۱ نشان دهنده همبستگی قوی
برخی از موضوعاتی که با استفاده از تحلیل همبستگی انجام گرفتهاند آورده شده است:
– رابطه بین سلامت روانی با نمره درسی
– رابطه بین جذابیت با اعتماد دیگران به فرد
– رابطه بین رضایت مشتریان از پاسخگویی پرسنل با میزان خرید آنان از فروشگاه
– رابطه بین عزت نفس با ابتلا به بیماری روانی در دانش آموزان
– رابطه بین ساعات استفاده از اینترنت با نمره کسب شده توسط دانشجویان
کد پایتون
12345678import pandas as pd
a = [[1, 2, 3],
[5, 6, 9],
[5, 6, 11],
[5, 6, 13],
[5, 3, 13]]
df = pd.DataFrame(data=a)
df.corr()
Result:
1234 0 1 2
0 1.000000 0.745601 0.916579
1 0.745601 1.000000 0.544248
2 0.916579 0.544248 1.000000
فرض های مسئله:
-مشاهدات باید مستقل باشند.
-برای تمام مقادیر متغیر مستقل، توزیع مقادیر متغیر وابسته باید نرمال باشد.
-واریانس متغیر وابسته باید برای تمام مقادیر متغیر مستقل یکسان باشد.
-رابطه بین متغیر مستقل و وابسته در جامعه باید خطی باشد.
رگرسیون:
اگر بین دو متغیر X و Y همبستگی وجود داشته باشد می توان یکی از این دو متغیر را بر حسب دیگری برآورد
کرد این عمل محتوای مبحث رگرسیون است. خط رگرسیون ما را به پیش بینی ویژگی های آنچه که در نمونه ما
موجود نیست قادر میسازد.