تفاوت آمار و احتمال ریاضی

من سوار یک اتوبوس می‌شم،‌ که همه صندلی‌هاش پر هستند و من مثلا ۴ ایستگاه دیگه پیاده می‌شم.طبق قضایای احتمال (یا در واقع آمار ریاضی)،‌من هیچ احتمالی برای نشتن ندارم!!اما طبق آمار بیزی می‌تونم حدس بزنم (مطابق تجربه و یا داده‌های قبلی)‌، ایستگاه سوم یه عده پیاده می‌شن 80٪ محتمله که من بتونم بشینم.

خلاصه خطاهای سوگیری

اعتماد به نفس زیاد (اعتماد به سقف!) (Over Confidence) توهم اطلاعات بیش از حد دقیق. Over Precession . مثل استفاده از میانگین بدون در نظر گرفتن واریانس توهم برآورد بیش از حد Over Estimationتوهم بهتر بودن از بقیه. مثبت دیدن توانایی هامدت زمان انجام پروژه کوتاه‌تر در نظر گرفتهمی‌شود. خطای لنگر گیری (Anchoring) تصمیمات متوالی،… ادامه خواندن خلاصه خطاهای سوگیری

آیا بین یک متغییر و متغییر دیگر رابطه معناداری (همبستگی) وجود دارد؟

آیا بین میزان تخفیف و فروش روزانه در فلان بیزینس رابطه ای وجود داره؟ اگر آری رابطه چه مدلی هست؟ ازینجا یه مقدار و یه مقدارم PDF منظورم از مدل این است که ایا رابطه مثبت است یا منفی (یعنی اگر مثلا تخفیف رفت بالا فروش بره بالا که میشه مثبت یا برعکس میشه منفی)… ادامه خواندن آیا بین یک متغییر و متغییر دیگر رابطه معناداری (همبستگی) وجود دارد؟

10 Top Types of Data Analysis Methods

from Data is everywhere around us. A report shows that people, things, and organizations are generating 2.5 quintillion bytes of data each day. It is a staggering figure indeed, but there is a clear explanation for it. For example, you are not only reading this post right now but also leaving digital traces about your content interests… ادامه خواندن 10 Top Types of Data Analysis Methods

Practical RFM analysis to increase repeat sales

from This method as the easiest way to visualize the behavior of the clients is important.   Numbers mean nothing if they do not change our actions tomorrow.Twit it This time I will share with you the experience and tips how to benefit from RFM even without a three-year sales history. We provided the RFM… ادامه خواندن Practical RFM analysis to increase repeat sales

Anomaly Detection

Introduction: Anomaly Detection From Anomaly detection is a technique used to identify unusual patterns that do not conform to expected behavior, called outliers. It has many applications in business, from intrusion detection (identifying strange patterns in network traffic that could signal a hack) to system health monitoring (spotting a malignant tumor in an MRI scan),… ادامه خواندن Anomaly Detection

تشخیص تقلب با تحلیل رفتار

در این مقاله روش تشخیص تقلب یا بهتر بگم تشخیص رفتار نامتعارف با تحلیل داده رو با کمک پایتون (Python)‌ توضیح می‌دم. برای این منظور از مثال تقلب فروشندگان در یک وبگاه بازار آنلاین (Market place) استفاده می‌کنم. فرض کنیم در این وبگاه، یک عده فروشنده هستند و مشتری بعد از اینکه محصولات یا خدماتشون… ادامه خواندن تشخیص تقلب با تحلیل رفتار

Multiple Linear Regression

from here We just performed linear regression in the above section involving two variables. Almost all the real-world problems that you are going to encounter will have more than two variables. Linear regression involving multiple variables is called “multiple linear regression” or multivariate linear regression. The steps to perform multiple linear regression are almost similar… ادامه خواندن Multiple Linear Regression

A beginner’s guide to Linear Regression in Python with Scikit-Learn

from here There are two types of supervised machine learning algorithms: Regression and classification. The former predicts continuous value outputs while the latter predicts discrete outputs. For instance, predicting the price of a house in dollars is a regression problem whereas predicting whether a tumor is malignant or benign is a classification problem. In this… ادامه خواندن A beginner’s guide to Linear Regression in Python with Scikit-Learn