python, Pandas Categorize the range

df[‘PriceBin’] = pd.cut(df[‘PriceAvg’], bins = 3)df[‘PriceBin’].value_counts() (54060.0, 2040000.0] 209 (2040000.0, 4020000.0] 4 (4020000.0, 6000000.0] 1 Name: PriceBin, dtype: int64 df[‘PriceBin’] = pd.qcut(df[‘PriceAvg’], q=3) df[‘PriceBin’].value_counts().sort_index() (59999.999, 210000.0] 77 (210000.0, 315000.0] 66 (315000.0, 6000000.0] 71 Name: PriceBin, dtype: int64 PriceBin SalesAvg0(59999.999, 210000.0] 42.0000001(210000.0, 315000.0] 145.1666672(315000.0, 6000000.0] 114.200000

Useful Python pandas codes

– To Rename the data framedf.rename(columns={“contract_id”:”deal_id”},inplace=True) – Where statement tips[tips[‘time’] == ‘Dinner’].head(۵) – vlookupmg = pd.merge(df,AgReg,on=”deal_id”,how=”left”) – choose the first column of an array or first part of a string with a delimitter df[“cat”] = df[“CategoryID”].str.split(‘,’,1).str[0] – filling na or nan or Null values df[“CategoryID”].fillna(“”,inplace=True) – Convert To date time pd.to_datetime(df[“start_date”],errors=’ignore’) combination of where and select some.… Continue reading Useful Python pandas codes

Process mining – Introduction 2

Case ID Activity Name Time Stamp Play out: A possible scenario Play in: simple process allowing for 4 traces Replay Process mining: Discovery Conformance Enhancement Machine learning: Supervised learning: response variable that labels each instance (we labeled each data and the machine will learn from that) Classification: classify to predict (i.e. decision tree) Regression: final… Continue reading Process mining – Introduction 2

Process mining – Introduction 1

Process mining is the combination of Data mining and Business process management. It works with log files. Every log file must have: Case ID (order ID) Activity (purchased, Request, rejected, …) Time stamp Process mining Internet of events Big data Internet of contents (google, Wikipedia) Social media Internet of people Cloud Internet of things Mobility Internet… Continue reading Process mining – Introduction 1

Pandas V.S SQL

If you knew SQL before and want to migrate to Python, you can use this article. TiTle SQL Pandas Desc Simple SELECT total_bill, tip, smoker, time FROM tips LIMIT ۵; tips[[‘total_bill’, ‘tip’, ‘smoker’, ‘time’]].head(۵)   Where SELECT * FROM tips WHERE time = ‘Dinner’ LIMIT ۵; tips[tips[‘time’] == ‘Dinner’].head(۵)   Multiple conditions SELECT * FROM tips WHERE… Continue reading Pandas V.S SQL

سوگیری خودانتخابی چیست؟

از اینجا معمولاً اگر شما یک وب‌سایت داشته باشید، گهگاه مشکلاتی برایتان رخ می‌دهد که نیاز دارید برای رفع آن به بخش خدمات مشتریان شرکت میزبان وب مراجعه کنید. من برای وب‌سایتم از خدمات میزبانی شرکتی استفاده می‌کنم که به‌صورت آنلاین می‌توانم با یک کارشناس فنی گفتگو کنم. پس از پایان گفتگو پنجره‌ای باز می‌شود… Continue reading سوگیری خودانتخابی چیست؟

قانون ده دقیقه

I made a new rule for my online searches. If my search fails in ten minutes, then I need to change my search. یه قانون جدید گذاشتم برای جستجوهای آنلاینم. اگر جستجوی من بعد از ده دقیقه به نتیجه مطلوب نرسید، پس باید شیوه جستجوم رو تغییر بدم.