تفاوت آمار و احتمال ریاضی

من سوار یک اتوبوس می‌شم،‌ که همه صندلی‌هاش پر هستند و من مثلا ۴ ایستگاه دیگه پیاده می‌شم.طبق قضایای احتمال (یا در واقع آمار ریاضی)،‌من هیچ احتمالی برای نشتن ندارم!!اما طبق آمار بیزی می‌تونم حدس بزنم (مطابق تجربه و یا داده‌های قبلی)‌، ایستگاه سوم یه عده پیاده می‌شن 80٪ محتمله که من بتونم بشینم.

خلاصه خطاهای سوگیری

اعتماد به نفس زیاد (اعتماد به سقف!) (Over Confidence) توهم اطلاعات بیش از حد دقیق. Over Precession . مثل استفاده از میانگین بدون در نظر گرفتن واریانس توهم برآورد بیش از حد Over Estimationتوهم بهتر بودن از بقیه. مثبت دیدن توانایی هامدت زمان انجام پروژه کوتاه‌تر در نظر گرفتهمی‌شود. خطای لنگر گیری (Anchoring) تصمیمات متوالی،… Continue reading خلاصه خطاهای سوگیری

آیا بین یک متغییر و متغییر دیگر رابطه معناداری (همبستگی) وجود دارد؟

آیا بین میزان تخفیف و فروش روزانه در فلان بیزینس رابطه ای وجود داره؟ اگر آری رابطه چه مدلی هست؟ ازینجا یه مقدار و یه مقدارم PDF منظورم از مدل این است که ایا رابطه مثبت است یا منفی (یعنی اگر مثلا تخفیف رفت بالا فروش بره بالا که میشه مثبت یا برعکس میشه منفی)… Continue reading آیا بین یک متغییر و متغییر دیگر رابطه معناداری (همبستگی) وجود دارد؟

10 Top Types of Data Analysis Methods

from Data is everywhere around us. A report shows that people, things, and organizations are generating 2.5 quintillion bytes of data each day. It is a staggering figure indeed, but there is a clear explanation for it. For example, you are not only reading this post right now but also leaving digital traces about your content interests… Continue reading 10 Top Types of Data Analysis Methods

Practical RFM analysis to increase repeat sales

from This method as the easiest way to visualize the behavior of the clients is important.   Numbers mean nothing if they do not change our actions tomorrow.Twit it This time I will share with you the experience and tips how to benefit from RFM even without a three-year sales history. We provided the RFM… Continue reading Practical RFM analysis to increase repeat sales

Anomaly Detection

Introduction: Anomaly Detection From Anomaly detection is a technique used to identify unusual patterns that do not conform to expected behavior, called outliers. It has many applications in business, from intrusion detection (identifying strange patterns in network traffic that could signal a hack) to system health monitoring (spotting a malignant tumor in an MRI scan),… Continue reading Anomaly Detection

تشخیص تقلب با تحلیل رفتار

در این مقاله روش تشخیص تقلب یا بهتر بگم تشخیص رفتار نامتعارف با تحلیل داده رو با کمک پایتون (Python)‌ توضیح می‌دم. برای این منظور از مثال تقلب فروشندگان در یک وبگاه بازار آنلاین (Market place) استفاده می‌کنم. فرض کنیم در این وبگاه، یک عده فروشنده هستند و مشتری بعد از اینکه محصولات یا خدماتشون… Continue reading تشخیص تقلب با تحلیل رفتار

Multiple Linear Regression

from here We just performed linear regression in the above section involving two variables. Almost all the real-world problems that you are going to encounter will have more than two variables. Linear regression involving multiple variables is called “multiple linear regression” or multivariate linear regression. The steps to perform multiple linear regression are almost similar… Continue reading Multiple Linear Regression