دسته‌ها
Data Science علمی

تفاوت همبستگی و رابطه علّی

مطالعه علت پدیده‌ها بسیار اهمیت دارد چراکه به ما کمک می‌کند تا اقدامات و سیاست‌های بهتر و مؤثرتری طراحی کنیم. در مقابل عدم فهم علت یک پدیده می‌تواند موجب اتخاذ اقدامات بی‌اثر شود و حتی نتایج ناخوشایندی به همراه بیاورد. برای مثال اگر شما فکر کنید یک نوع پشه موجب بروز بیماری مالاریا است، در سفر خود به منطقه‌ای که مالاریا شایع است، خود را مجهز به پشه‌بند می‌کنید؛ اما اگر فکر کنید هوای آلوده موجب بروز این بیماری است، به‌مانند آنچه درگذشته تصور می‌شد، ماسک تنفسی به همراه خواهید برد. امروزه می‌دانیم رویکرد دوم برای سلامتی شما کاملاً بی‌فایده و حتی خطرناک است!

شاید بتوان گفت در بیشتر موارد مدیریت یعنی ایجاد تغییر در چیزهایی که تحت کنترل است به‌منظور آن‌که روی چیزهای دیگری که تحت کنترل نیست، اثر گذاشت تا به نتیجه دلخواه رسید. برای مثال یک مدیر بودجه تبلیغات سازمان خود را افزایش می‌دهد (آنچه تحت کنترل است) به امید آنکه فروش بیشتری ایجاد کند (نتیجه دلخواه). یا دستمزد سال آتی کارمند خود را افزایش می‌دهد (آنچه تحت کنترل است) تا انگیزه او را برای کار کردن بیشتر کند (نتیجه دلخواه). پس نکته مهم آن می‌شود که یک مدیر بتواند علت پدیده‌ها را درست تشخیص دهد.

اما مثال‌های زیادی وجود دارد که افراد روابطی بین پدیده‌ها فرض کرده‌اند که وجود خارجی نداشته است. یکی از دلایل مهم بروز این مسئله را باید در عدم درک صحیح تفاوت بین همبستگی (Correlation) و رابطه علّی (Causation) جست. همبستگی یک مفهوم آماری است و به زبان ساده نشان می‌دهد که افزایش یا کاهش یک متغیر با افزایش یا کاهش متغیر دیگری همراه است. برای مثال، بین سیگار کشیدن و مصرف نوشیدنی‌های الکلی همبستگی وجود دارد ولی سیگار کشیدن عامل اعتیاد به الکل نیست. درحالی‌که سیگار کشیدن یکی از عوامل اصلی ابتلا به سرطان ریه است.

عدم درک تفاوت این دو مفهوم می‌تواند به نتیجه‌گیری‌های گمراه‌کننده و سیاست‌گذاری‌های نادرست منجر شود. در این مقاله با تکیه‌بر مثال‌هایی از دنیای واقعی به توضیح این موضوع می‌پردازم.

همبستگی، رابطه علّی، مصرف سیگار و سرطان

در دهه ۱۹۵۰، مطالعاتی مدعی شدند سیگار کشیدن موجب ابتلا به سرطان ریه می‌شود. متأسفانه آن مطالعات مبتنی بر رابطه همبستگی بین مصرف سیگار و نرخ ابتلا به سرطان ریه بود. به همین دلیل بلافاصله گزارش نه‌تنها توسط شرکت‌های سیگارسازی بلکه توسط برخی آماردانان معروف مانند رونالد فیشر (Ronald Fisher)، زیر سؤال رفت. آنان ادعا کردند که شاید فاکتور پنهانی دیگری مانند عامل ژنتیکی باعث به وجود آمدن سرطان و تمایل به سیگار کشیدن می‌شود. اگر این فرضیه درست می‌بود، آنگاه کشیدن یا نکشیدن سیگار اثری روی ابتلا به سرطان نمی‌گذاشت.

یک روش نشان دادن این‌که آیا واقعاً سیگار کشیدن موجب سرطان می‌شود استفاده از آزمایش کنترل‌شده با نمونه تصادفی (Randomized Controlled Experiment) است. فرض کنید آزمایشگری وجود داشت که می‌توانست افراد را وادار کند که سیگار بکشند یا نکشند. سپس آزمایشگر تعداد زیادی از افراد را برای آزمایش جمع می‌کرد و آنان را به‌صورت تصادفی به دو گروه تقسیم می‌کرد. یک گروه مجبور می‌شدند که سیگار بکشند و گروه دیگر نباید سیگار می‌کشیدند. به‌این‌ترتیب آزمایشگر ارتباط بین سیگار کشیدن و هر عامل پنهان دیگر را که موجب سرطان و سیگار کشیدن می‌شود، قطع می‌کرد. با مطالعه نرخ ابتلا به سرطان در دو گروه، مشخص می‌شد آیا سیگار کشیدن حقیقتاً عامل ایجاد سرطان است یا خیر.

گرچه روش آزمایش کنترل‌شده با نمونه تصادفی بهترین روش برای اثبات رابطه علّی است، در عمل این کار همواره امکان‌پذیر نیست. به‌طور مشخص در این مثال، به لحاظ اخلاقی و قانونی ما نمی‌توانیم افراد را وادار به سیگار کشیدن یا از آن منع کنیم. برای نزدیک به چهل سال صنعت سیگارسازی ادعا می‌کرد کشیدن سیگار با ابتلا به سرطان ریه تنها همبستگی دارد. البته مطالعات گسترده در این زمینه تائید کرد که مصرف سیگار در بلندمدت از عوامل اصلی ابتلا به سرطان ریه است.

قرار دادن تلفن همراه در جیب شلوار موجب کاهش قدرت جنسی مردان می‌شود

مثال جالب دیگر مربوط به یک مطالعه پزشکی در مجارستان است که بر روی ۲۲۱ مردی که تلفن همراه با خود حمل می‌کردند، در سال ۲۰۰۳ انجام شد. مطالعه ادعا می‌کرد مردانی که تلفن همراهشان را در جیب شلوار خود حمل ‌می‌کنند به‌جای آن‌که آن را در جیب جلوی پیراهن و یا کیفشان بگذارند، ۳۰ درصد تعداد اسپرم کمتری نسبت به متوسط تعداد اسپرم جمعیت مردان – که در دهه ۱۹۷۰ اندازه‌گیری شده بود – دارند. بازتاب این مطالعه بلافاصله فضایی را علیه تولیدکنندگان تلفن‌های همراه ایجاد کرد که تولیدات آنان را باعث کاهش باروری در مردان معرفی می‌کرد. برخی سازمان‌های حمایت از مصرف‌کننده خواستار نصب برچسب‌های هشداردهنده بر روی تلفن‌های همراه شدند.

اما مشکل آنجا بود که این مطالعه تنها بر مبنای همبستگی انجام شده بود و هیچ رابطه علّی دقیقی را روشن نمی‌کرد. منتقدان این‌طور عنوان می‌کردند که بسیاری از مردان سیگاری تلفن همراه خود را به‌جای جیب جلویی پیراهن در جیب شلوار خود می‌گذارند. آنان معمولاً پاکت سیگار خود را در جیب پیراهن خود می‌گذارند تا به سیگارها آسیبی وارد نشود؛ بنابراین با احتمال بیشتری تلفن همراه خود را در جیب شلوار خود قرار می‌دهند. سال‌هاست که مشخص ‌شده است سیگار کشیدن تعداد اسپرم‌ها را در مردان کاهش می‌دهد. به‌علاوه اثر عوامل دیگر مانند استرس در نظر گرفته نشده بود. استرس نیز باعث کاهش تعداد اسپرم در مردان می‌شود. شاید کسانی که مجبور هستند دائماً تلفن همراه را با خود حمل کنند، دارای مشاغل استرس‌آوری هستند که لازم است در طول ۲۴ ساعت در دسترس باشند.

درنهایت این‌که مبنای مقایسه، تعداد اسپرم مردان در دهه ۱۹۷۰ بوده است. این امکان وجود دارد به شکل کلی تعداد اسپرم مردان از آن موقع تاکنون به دلایل دیگری مانند افزایش آلودگی‌های شیمیایی کاهش ‌یافته باشد و ربطی به اثر تلفن همراه نداشته باشد. چنان‌که ممکن است تعداد اسپرم تمساح‌های پوزه‌کوتاه در سیستان و بلوچستان نسبت به دهه هفتاد میلادی ۳۰ درصد کم شده باشد ولی کسی فکر نمی‌کند به خاطر استفاده از تلفن همراه بوده باشد!

توجه کنید هدف من از این مثال رد یا تائید اثرات تلفن همراه بر بدن انسان نیست، بلکه روش نتیجه‌گیری بر مبنای داده‌ها مورد نقد است.

مصرف بستنی موجب افزایش بهره هوشی می‌شود!

در آوریل سال ۲۰۱۳، مجله اکونومیست (Economist) در مقاله‌ای ادعا کرد مصرف بستنی موجب افزایش بهره هوشی (IQ) می‌شود. گرچه برخی آن را دروغ اول آوریل اکونومیست می‌دانند، مقاله با لحنی جدی مانند سایر مقالات آن مجله نوشته شده و همچنان (مهرماه سال ۱۳۹۶) روی وب‌سایت آن در دسترس است. اشاره به این مقاله می‌تواند مفید و آموزنده باشد. در آن مقاله رابطه بین مصرف سرانه بستنی و نمره میانگین آزمون PISA در کشورهای عضو OECD (Economic Co-operation and Development) به تصویر کشیده شده است (شکل-۱). اکونومیست این‌گونه جمع‌بندی می‌کند که اگرچه ممکن است عجیب باشد ولی مصرف بستنی اثر مثبتی روی سطح هوش دانش آموزان می‌گذارد؛ بنابراین دولت می‌تواند با دادن یارانه در کشورهایی که مصرف بستنی پایین است، میزان عملکرد تحصیلی دانش آموزان را بالاتر ببرد. آیا این استدلال درست است؟

شکل-۱

باید نسبت به این استدلال بسیار مشکوک بود. اول آنکه نویسنده نمره متوسط آزمون PISA که توانایی خواندن افراد را می‌سنجد به هوش ربط داده است. هیچ ارتباط مستقیمی بین این دو وجود ندارد. دوم، همبستگی با رابطه علّی تفاوت دارد. هیچ دلیلی روشنی وجود ندارد که این رابطه علّی را توجیه کند. این همبستگی می‌تواند به دلایل دیگری به وجود آمده باشد. برای مثال اگر به نمودار شکل-۱ دقت کنید، مصرف سرانه بستنی در کشورهایی که ثروتمندتر هستند بیشتر است. معمولاً سیستم آموزشی در کشورهای ثروتمندتر به علت سرمایه‌گذاری بیشتر باکیفیت‌تر است. نتیجه آن‌که دانش آموزان در این کشورها توانایی خواندن بالاتری دارند. درواقع متغیر سومی عامل اصلی حرکت هم‌زمان هر دو متغیر بوده است.

تلویزیون نبینید تا بیشتر عمر کنید!

گروهی از محققان استرالیایی در سال ۲۰۱۱ گزارشی منتشر کردند که عنوان می‌کرد بر مبنای مشاهدات آنان به‌طور متوسط کسانی که شش ساعت تلویزیون در روز نگاه می‌کنند پنج سال زودتر از کسانی که اصلاً تلویزیون نگاه نمی‌کنند، می‌میرند. با در نظر گرفتن عادات مردم استرالیا در دیدن تلویزیون، آنان این‌طور نتیجه گرفته بودند که با ندیدن تلویزیون به‌طور متوسط دو سال به عمر انتظاری (Life Expectancy) افراد اضافه می‌شود.

مشکل اصلی در این گونه مطالعات مشاهده‌ای، سوگیری خودانتخابی (Self-Selection Bias) است. سوگیری خودانتخابی زمانی رخ می‌دهد که افراد خود تصمیم می‌گیرند داخل گروهی باشند یا نباشند. در این مثال شاید کسانی که تصمیم گرفتند بیشتر تلویزیون نگاه کنند، ازنظر بدنی کمتر فعال هستند، یا مبتلا به افسردگی شده‌اند و یا در شرایط جسمی خوبی نیستند و نمی‌توانند مانند افراد سالم به فعالیت‌های پرتحرک بپردازند. درواقع ممکن است عامل پنهان دیگری هم‌زمان موجب افزایش دیدن تلویزیون و کاهش طول عمر می‌شود.

پنجره‌های شکسته و میزان جرم و جنایت

یکی از دغدغه‌های سیاست‌گذاران عمومی همواره این بوده است که چگونه منابع مالی را مصرف کنند تا پدیده‌های ناخوشایندی را که در جامعه وجود دارد، از بین ببرند. یک نمونه شهر نیویورک (New York) در دهه ۱۹۸۰ است که به شهر خطرناکی تبدیل شده و نرخ انواع جرم و جنایت به بالاترین سطح خود رسیده بود. تحلیل گران متوجه شدند که بین جرم‌های کوچک نظیر دیوارنویسی، فرار از پرداخت بلیت مترو و مانند آن در مناطق مختلف شهری و نرخ جنایت در آنجا همبستگی وجود دارد.

تئوری پنجره شکسته (Broken Windows Theory) این‌گونه استدلال می‌کند که در نواحی شهری افراد به محیط اطراف خود نگاه می‌کنند تا بفهمند هنجار‌های اجتماعی در آنجا چگونه است. یک محیط نامرتب که زباله‌های زیادی در آن ریخته شده، دیوارنوشته‌ها همه‌جا را پرکرده و پنجره‌های ساختمان‌ها شکسته است این پیام را منتقل می‌کند که محیط تحت کنترل نیست و در صورت ارتکاب جرم در آن محل، ریسک کشف آن پایین است.

طرفداران نظریه پنجره شکسته چنین عنوان می‌کنند که همان‌طور که بهداشت و پیشگیری بر درمان مقدم است، سیاست‌گذاران جامعه و نیروهای پلیس نباید صرفاً‌ به دنبال جرم‌ها ‌و آسیب‌های فردی باشند که شاکی مشخص دارد. جامعه باید بکوشد تا هر موردی را از جنس پنجره‌های شکسته نداشته باشد.

بر همین مبنا شهردار وقت نیویورک بودجه زیادی را به کمپین آراسته‌سازی محیط شهری و مقابله با دیوارنوشته‌ها اختصاص داد. همچنین سیاست‌های بسیار سخت‌گیرانه‌ای در برابر ارتکاب جرم‌های کوچک مانند فرار در پرداخت بلیت اتخاذ شد. در دهه ۱۹۹۰ نرخ جنایت در نیویورک کاهش چشمگیری پیدا کرد. شکل-۲ تعداد بازداشت‌ها به علت جرم‌های کوچک و تعداد جرائم خشونت‌آمیز را نشان می‌دهد. بر مبنای این نتایج بود که تئوری پنجره شکسته موردتوجه زیادی قرار گرفت.

شکل-۲

اما جالب است بدانید کاهش بی‌سابقه جرم و جنایت در دهه ۱۹۹۰ میلادی نه‌تنها در نیویورک بلکه در کل آمریکا رخ داد. در مقاله “تئوری پنجره‌ شکسته: همبستگی یا رابطه علّی؟” به این پرداختم که اگرچه اجرای سیاست‌های پلیس در جلوگیری از جرائم کوچک هم‌زمان با کاهش جرائم خشونت‌آمیز بود، یک رابطه علت و معلولی بین این دو وجود نداشت. درواقع علت اصلی کاهش جرائم به تصویب قانون آزادی سقط‌جنین در بیست سال قبل و تغییرات جمعیتی ناشی از آن برمی‌گردد!

پیام این بحث برای مدیران چیست؟

تأکید اصلی بحث من در مقاله این بود که مدیران باید توجه کنند لزوماً رخ دادن هم‌زمان دو پدیده، بدان معنی نیست که یکی دلیل دیگری است. فرض کنید اخیراً در شرکت خود یک مدیر فروش با مدرک ام.بی.ای استخدام کرده‌اید. سه ماه پس از استخدام او فروش شرکت ۳۰۰ درصد رشد می‌کند. آیا این نتیجه فعالیت او بوده است؟ این امکان وجود دارد؛ اما می‌توان به توضیحات دیگری فکر کرد؟ آیا این افزایش فروش می‌توانسته نتیجه افزایش تقاضای فصلی بوده باشد؟ احتمال دارد تقاضای کلی برای آن محصول در بازار صعودی شده است؟ آیا ممکن است به علت خارج شدن یکی از رقیبان، تقاضا برای محصولات شرکت شما افزایش یافته باشد؟ به چه دلایل دیگری می‌توان فکر کرد؟ چه شواهدی برای رد یا اثبات این دلایل وجود دارند؟

بهترین روش برای شناخت رابطه علّی، آزمایش کنترل‌شده با نمونه تصادفی است. البته در دنیای واقعی نمی‌توان همواره این روش را بکار برد. من در مقاله دیگری چارچوب عملیاتی را شرح می‌دهم که به شما کمک می‌کند بفهمید در چه زمانی می‌توانید بر مبنای همبستگی بین دو متغیر اقدام کنید.

به استدلال‌های زیر توجه کنید:

داده‌ها نشان می‌دهد بین درآمد و ازدواج رابطه همبستگی مثبت وجود دارد. پس اگر ازدواج کنید درآمد شما بیشتر می‌شود.

داده‌ها نشان می‌دهد که کودکانی که بازی‌های کامپیوتری می‌کنند رفتارهای خشونت‌آمیز بیشتری از خود نشان می‌دهند. بازی‌های کامپیوتری موجب افزایش بروز پرخاشگری و رفتارهای خشونت‌آمیز در کودکان می‌شود.

مطالعات اقتصادی نشان می‌دهد وقتی میزان بدهی یک کشور به ۹۰ درصد تولید ناخالص داخلی (GDP) آن می‌رسد، رشد اقتصادی کند می‌شود. نتیجه آن‌که بدهی زیاد موجب کاهش رشد اقتصادی است.

به نظر شما آیا در این استدلال‌ها خطایی وجود دارد؟

منابع:

Economist (2013). “Ice Cream and IQ”, https://www.economist.com/blogs/graphicdetail/2016/04/daily-chart

Fisher, R. (1958), “Cigarettes, Cancer, and Statistics”, The Centennial Review of Arts & Science, 2, 151–۱۶۶

Harcourt, B. E., & Ludwig, J. (2006). “Broken Windows: New Evidence from New York City and a Five-City Social Experiment”, The University of Chicago Law Review, 271-320

Pearl, J., Glymour, M., Jewell, N. P. (2016). “Causal Inference in Statistics”, Wiley & Sons Ltd

Smith, G. (2014). “Standard Deviations: Flawed Assumptions, Tortured Data, and Other Ways to Lie with Statistics”, Overlook Duckworth, Peter Mayer Publishers, Inc. New York

Wheeler, K. (2017). “Correlation and Causation”, https://web.cn.edu/kwheeler/logic_causation.html

Wilson, J. Q, & Kelling, G. L. (1982), “Broken Windows: The Police and Neighborhood Safety”, The Atlantic

دسته‌ها
Buiness Analysis Data Science process mining

Process mining – Introduction 2

  • Case ID
  • Activity Name
  • Time Stamp

Play out: A possible scenario

Play in: simple process allowing for 4 traces

Replay

Process mining:

  1. Discovery
  2. Conformance
  3. Enhancement

Machine learning:

  1. Supervised learning: response variable that labels each instance (we labeled each data and the machine will learn from that)
    1. Classification: classify to predict (i.e. decision tree)
    2. Regression: final function that fits data
  2. Unsupervised learning: unlabeled. (i.e. clustering like K-means, pattern discovery)

Example: smoker, drinker, weight: supervised learning

Smoker, drinker: predictor variable

Weight: response variable

دسته‌ها
Buiness Analysis Data Science process mining

Process mining – Introduction 1

Process mining is the combination of Data mining and Business process management. It works with log files. Every log file must have:

  1. Case ID (order ID)
  2. Activity (purchased, Request, rejected, …)
  3. Time stamp

Process mining Internet of events
Big data Internet of contents (google, Wikipedia)
Social media Internet of people
Cloud Internet of things
Mobility Internet of places

 Big data issue:

  • Volume (data size)
  • Velocity (speed of change)
  • Variety (different forms of sources)
  • Veracity (uncertainty of data)

Data science questions:

  • What happened
  • Why did it happen
  • What will happen
  • What is the best that can happen?

Process mining questions:

  • What is the process that people really follow?
  • What are the bottlenecks in the process?
  • Where do people deviate from the expected?

دسته‌ها
Buiness Analysis Data Science Programming Python علمی

Pandas V.S SQL

If you knew SQL before and want to migrate to Python, you can use this article.

۱) Simple select

—-

SELECT total_bill, tip, smoker, time
FROM tips
LIMIT ۵;

—–

tips[[‘total_bill’‘tip’‘smoker’‘time’]].head(۵)

—————

—————

۲) where 

——

SELECT *
FROM tips
WHERE time = ‘Dinner’
LIMIT ۵;

———

tips[tips[‘time’== ‘Dinner’].head(۵)

————

۳) Multiple conditions

— tips of more than $5.00 at Dinner meals

SELECT *
FROM tips
WHERE time = ‘Dinner’ AND tip > ۵.۰۰;

—–

tips[(tips[‘time’== ‘Dinner’& (tips[‘tip’> ۵.۰۰)]

SELECT *
FROM frame
WHERE col2 IS NULL;

frame[frame[‘col2’].isna()]

————————–

۴) Group By 

SELECT sex, count(*)
FROM tips
GROUP BY sex;

———

tips.groupby(‘sex’).size()

sex

Female 87

Male 157

dtype: int64

Notice that in the pandas code we used size() and not count(). This is because count() applies the function to each column, returning the number of not null records within each.

tips.groupby(‘sex’).count()

        total_bill tip smoker day time size
sex
Female        ۸۷   ۸۷   ۸۷     ۸۷   ۸۷   ۸۷
Male         ۱۵۷   ۱۵۷  ۱۵۷   ۱۵۷  ۱۵۷  ۱۵۷

Alternatively, we could have applied the count() method to an individual column:

tips.groupby(‘sex’)[‘total_bill’].count()

Sex

Female 87

Male 157

Name: total_bill, dtype: int64

————–

SELECT dayAVG(tip), COUNT(*)
FROM tips
GROUP BY day;

—-

tips.groupby(‘day’).agg({‘tip’: np.mean, ‘day’: np.size})

——–

SELECT smoker, dayCOUNT(*), AVG(tip)
FROM tips
GROUP BY smoker, day;

—-

tips.groupby([‘smoker’‘day’]).agg({‘tip’: [np.size, np.mean]})

INNER JOIN

In [22]: df1 = pd.DataFrame({‘key’: [‘A’‘B’‘C’‘D’],
….: ‘value’: np.random.randn(۴)})

….:

In [23]: df2 = pd.DataFrame({‘key’: [‘B’‘D’‘D’‘E’],
….: ‘value’: np.random.randn(۴)})

SELECT *
FROM df1
INNER JOIN df2
ON df1.key = df2.key;

pd.merge(df1, df2, on=‘key’)

merge() also offers parameters for cases when you’d like to join one DataFrame’s column with another DataFrame’s index.

indexed_df2 = df2.set_index(‘key’)

pd.merge(df1, indexed_df2, left_on=‘key’, right_index=True)

LEFT OUTER JOIN

SELECT *
FROM df1
LEFT OUTER JOIN df2
ON df1.key = df2.key;

pd.merge(df1, df2, on=‘key’, how=‘left’)

RIGHT JOIN

SELECT *
FROM df1
RIGHT OUTER JOIN df2
ON df1.key = df2.key;

pd.merge(df1, df2, on=‘key’, how=‘right’)

FULL JOIN

SELECT *
FROM df1
FULL OUTER JOIN df2
ON df1.key = df2.key;

pd.merge(df1, df2, on=‘key’, how=‘outer’)

UNION

SELECT city, rank
FROM df1
UNION ALL
SELECT city, rank
FROM df2;

pd.concat([df1, df2])

SQL’s UNION is similar to UNION ALL, however UNION will remove duplicate rows.

SELECT city, rank
FROM df1
UNION
SELECT city, rank
FROM df2;

pd.concat([df1, df2]).drop_duplicates()

Top N rows with offset

SELECT * FROM tips
ORDER BY tip DESC
LIMIT ۱۰ OFFSET ۵;

tips.nlargest(۱۰ + ۵, columns=‘tip’).tail(۱۰)

Top N rows per group

— Oracle’s ROW_NUMBER() analytic function

SELECT * FROM (
SELECT
t.*,
ROW_NUMBER() OVER(PARTITION BY day ORDER BY total_bill DESCAS rn
FROM tips t
)
WHERE rn < ۳
ORDER BY day, rn;

(tips.assign(rn=tips.sort_values([‘total_bill’], ascending=False).groupby([‘day’]).cumcount() + ۱) .query(‘rn < 3’).sort_values([‘day’‘rn’]))

UPDATE

UPDATE tips
SET tip = tip*۲
WHERE tip < ۲;

tips.loc[tips[‘tip’< ۲‘tip’*= ۲

DELETE

DELETE FROM tips
WHERE tip > ۹;

tips = tips.loc[tips[‘tip’<= ۹]

دسته‌ها
Buiness Analysis Marketing علمی محمد حسین ابراهیم زاده

Excel or any spreadsheet next order date or any related column

In excel or any spreadsheet if you want to have:
• customer next order date
• customer next purchase or order number
• to calculate customer purchase period
• customer order frequency
• …

You have to have the customer number and order date. Also having invoice numbers would be helpful because sometimes orders will break into different invoice numbers. So if we have: customer number in C and invoice numbers in B and order date in D
Just do this:
order by date, order by customer number
then your next order date would be:
=IF ( AND (C2=C1,B2<>B1),D2,””)

دسته‌ها
Marketing استراتژی علمی کارافرینی محمد حسین ابراهیم زاده

سوگیری‌های رفتاری در تصمیم‌گیری

از اینجا

مطالعات زیادی در حوزه روان‌شناسی تصمیم‌گیری و اقتصاد رفتاری صورت گرفته است که نشان می‌دهد انسان‌ها در همه موارد لزوماً تصمیمات منطقی نمی‌گیرند و تحت تأثیر سوگیری‌های تصمیم‌گیری (Biases) هستند. شناخت این سوگیری‌ها به مدیران کسب‌وکارها می‌تواند کمک کند تا اثرات آن‌ را بشناسند و به آن‌ها قدرت بیشتری می‌دهد تا بر آن غلبه کنند. در این مقاله به چهار خطای مهم در تصمیم‌گیری می‌پردازم.

اعتمادبه‌نفس بیش‌ازحد (Overconfidence)

به‌طور ساده این سوگیری رفتاری به این معنی است که افراد بیش ازآنچه واقعاً می‌دانند، فکر می‌کنند که می‌دانند. این سوگیری در حوزه کسب‌وکار می‌تواند به شکل‌های مختلفی خود را نشان دهد. یک حالت آن است که افراد فکر می‌کنند اطلاعاتی که در اختیار دارند بیش‌ازاندازه دقیق است. این خطا تحت عنوان دقت بیش‌ازاندازه (Overprecision) شناخته می‌شود. برای مثال در استفاده از میانگین برای پیش‌بینی تقاضا، به واریانس آن توجه نمی‌شود؛ فرد تصور می‌کند که میزان تقاضای احتمالی نوسان زیادی ندارد و بسیار به آنچه برآورد کرده نزدیک است.

همین امر ممکن است موجب شود یک مدیر در جستجو برای استخدام یک کارشناس تلاش زیادی نکند، چراکه فرض می‌کند سطح مهارت و کیفیت افراد موجود در بازار کار تفاوت چندانی باهم ندارند. در انبارداری، فرد ممکن است سطح ذخیره احتیاطی را بسیار کمتر ازآنچه که نیاز است برآورد کند، چراکه واریانس تقاضا و یا واریانس دوره تأخیر تا دریافت سفارش (Lead Time) را بسیار کمتر برآورد می‌کند.

حالت دیگر اعتمادبه‌نفس بیش‌ازحد، مربوط به برآورد بیش‌ازاندازه (Overestimation) است. این سوگیری موجب می‌شود که افراد توانایی‌های خود را به شکل غیرواقعی، مثبت ببینند. برای مثال حدود ۹۳ درصد از رانندگان آمریکایی معتقدند که از متوسط بهترند (منطقاً این عدد باید حول‌وحوش ۵۰ درصد باشد). این سوگیری در کسب‌وکار می‌تواند باعث شود تا فرد تقاضا برای یک محصول جدید را بسیار  بالاتر برآورد کند و یا مدت‌زمان اتمام یک پروژه را بسیار کوتاه‌تر تخمین بزند.

خطای لنگرگیری (Anchoring)

مطالعات تجربی بسیاری نشان می‌دهد که تصمیمات ما تحت تأثیر شرایط محیطی و فاکتورهای موقعیتی است. به‌طور مشخص تصمیمات افراد ممکن است بیش‌ازاندازه تحت تأثیر مشاهدات و تجربیات گذشته که به تصمیم مربوط نیستند، قرار گیرد. در یک آزمایش به دو گروه از شرکت‌کنندگان پنج ثانیه وقت داده شد تا هشت عدد را درهم ضرب کنند. برای یک گروه ترتیب اعداد به شکل ۱×۲×۳×۴×۵×۶×۷×۸ و برای گروه دیگر ترتیب اعداد به شکل ۸×۷×۶×۵×۴×۳×۲×۱ بود. چون افراد زمان بسیار کمی برای محاسبه داشتند تنها به چند عدد اول توجه می‌کردند. میانگین برآورد در گروهی که برایشان توالی اعداد از یک شروع می‌شد، بسیار پایین‌تر از گروهی بود که برایشان توالی اعداد از هشت شروع می‌شد. درواقع چند عدد اول در نقش لنگر ذهنی عمل کرده است.

اثر لنگرگیری ذهنی در چانه‌زنی برای توافق روی قیمت در مذاکرات تجاری به‌خوبی نشان داده ‌شده است. مطالعات نشان می‌دهد در مذاکرات تجاری قیمت توافقی نهایی حول آن قیمتی تعیین می‌شود که اول پیشنهاد شده است و ادامه مذاکره حول بالا و پایین کردن آن قیمت می‌چرخد.

به‌عنوان یک مثال دیگر، به دو جمله زیر در بیان میزان تخفیف فروش توجه کنید:

” چهار عدد صابون تنها ۲ دلار”

“هر صابون تنها ۰٫۵ دلار”

اگرچه دو جمله بالا بیانگر یک‌چیز هستند، مطالعات نشان داده است استفاده ازجمله اول تا ۴۰ درصد فروش را افزایش می‌دهد. درواقع عدد چهار در نقش لنگر ذهنی عمل می‌کند و فرد به‌طور ناخودآگاه به سمت خرید بیشتر سوق داده می‌شود.

زیان گریزی (Loss Aversion) و دیدگاه نسبت به ریسک

تحقیقات نشان می‌دهد ذهن ما نسبت به زیان و منفعت نامتقارن عمل می‌کند. زیان گریزی به این معنی است که مقدار مطلق زیان در ذهن ما از مقدار مطلق منفعت بیشتر است. برای مثال مدیری را در نظر بگیرید که برای فروش سال آتی هدف‌گذاری می‌کند. از دیدگاه عقلانی اگر او هدف را محقق نکند و میزان فروش کمتر شود با حالتی که به همان مقدار، فروش بیشتر از میزان هدف‌گذاری شده باشد، خطای رخ‌داده در هدف‌گذاری یکسان است. اما در حالت اول خطای هدف‌گذاری در ذهن افراد خیلی پررنگ‌تر از حالت دوم است. اگر از دست دادن هدف در ذهن مدیر بسیار پررنگ‌تر از بردن هدف باشد، منجر به این می‌شود او اهداف بسیار پایین‌تری تعیین کند.

به‌عنوان مثال دیگر، تصمیم برای حالتی که مدیران می‌خواهند تولید یک محصول را رها کنند و از بازار خارج شوند، ممکن است دردآورتر از حالتی باشد که بخواهند وارد یک بازار شوند. این مسئله می‌تواند منجر شود که یک سازمان منابع زیادی را صرف نگه‌داشتن محصولات فعلی که ممکن است دیگر سودآور هم نباشند، کند.

مورد دیگر به دیدگاه ما به ریسک برمی‌گردد. انسان‌ها معمولاً در حالتی که قرار است چیزی را به دست آورند ریسک‌گریز هستند. در مقابل اگر قرار باشند زیان کنند، ریسک‌پذیرتر می‌شوند. در یک مطالعه نشان داده شد در تصمیم بین این‌که ۵۰ دلار را به‌طور قطع انتخاب کنند و یا وارد یک بازی شانسی شوند که در آن با احتمال ۵۰ درصد می‌توانند ۱۰۰ دلار به دست آورند و با احتمال ۵۰ درصد هیچ عایدی به دست نیاورند، تعداد زیادی حالت اول را انتخاب کردند. در مقابل افراد در برابر تصمیم بین ۵۰ دلار ضرر حتمی و ۱۰۰ دلار ضرر ۵۰-۵۰، بیشتر حالت دوم را انتخاب کردند.

ازاین‌رو ممکن است که مدیران در تصمیم‌گیری‌هایشان وقتی پای ضرر در میان باشد بیش‌ازاندازه ریسک را قبول کنند و در حالتی که پای منفعت در میان باشد کمتر ریسک کنند. این مسئله توضیح می‌دهد که چرا ممکن است تعهد مدیران به پروژه‌هایی که در آن در حال ضرر کردن هستند، افزایش یابد. درواقع مدیرانی در اثر یک تصمیم اولیه ضرر کرده‌اند، حالا ریسک‌پذیری بالایی پیدا می‌کنند و به سرمایه‌گذاری منابع خود ادامه می‌دهند تا شرایط را به حالت اولیه برگردانند و یا به سود دست یابند.

خطای چارچوب (Framing)

نحوه طرح کردن یک مسئله می‌تواند تصمیمات افراد برای حل کردن مسئله را جهت دهد. در یک آزمایش کلاسیک از افراد خواسته شد بین دو واکسن جهت درمان یک بیماری نادر که ممکن است ۶۰۰ نفر را بکشد، یکی را انتخاب کنند:

الف: ۲۰۰ نفر را به‌طورقطع نجات می‌دهد.

ب: با احتمال یک‌سوم همه ۶۰۰ نفر نجات پیدا می‌کنند و با احتمال دوسوم هیچ‌کس زنده نخواهد ماند.

در این مطالعه ۷۲ درصد شرکت‌کنندگان گزینه الف را که ریسک کمتری دارد انتخاب کردند. توجه کنید که این گزینه‌ها بر اساس منفعت بیان‌شده‌اند. بنابراین افراد ریسک‌گریز گزینه الف را که با قطعیت جان عده‌ای را نجات می‌دهد به گزینه ب ترجیح می‌دهند اگرچه ارزش انتظاری هر دو گزینه برابر است (ارزش انتظاری برابر عایدی ضربدر احتمال وقوع آن می‌باشد).

در مورد همان مسئله به افراد گروه دیگری این دو گزینه پیشنهاد شد:

ج: ۴۰۰ نفر به‌طورقطع خواهند مرد.

د: با احتمال یک‌سوم همه نجات پیدا می‌کنند و با احتمال دوسوم ۶۰۰ نفر خواهند مرد.

در این حالت ۷۸ درصد شرکت‌کنندگان گزینه د را که ریسکی‌تر است، انتخاب کردند.

مشاهده می‌کنید که هر دو حالت بیان یک موضوع اما به روش‌های متفاوتی بوده و پاسخ شرکت‌کنندگان کاملاً تغییر کرده است. در تصمیمات دنیای واقعی هم ساختاربندی مسئله می‌تواند نحوه مواجهه مدیران با مسئله را تغییر دهد. فرض کنید مدیران ارشد اجرایی یک شرکت که درباره خرید شرکت دیگری در حال تصمیم‌گیری هستند، ممکن است در ذهن خود سؤال را به گونه‌های متفاوتی طرح ­کنند: “چرا ما باید این شرکت را بخریم؟” یا “برای این خرید، چه مقدار پول حاضریم بپردازیم؟” ممکن است چارچوب‌بندی سؤال اول منجر به تمرکز بر مزایای این خرید شود، درحالی‌که چارچوب‌بندی سؤال دوم می‌تواند منجر به اتخاذ تصمیمی کاملاً متفاوت شود.

در سازمان‌ها، یک رویکرد به مسائل ایمنی در کار می‌تواند بر این پایه باشد که ” آیا می‌توان ثابت کرد شرایط محیط کار ناایمن است؟” در مقابل رویکرد دیگر که سؤال می‌کند ”آیا می‌توان ثابت کرد شرایط محیط کار کاملاً ایمن است؟” در عمل این دو رویکرد نتایج متفاوتی به همراه دارد.

نتایج این مطالعات به ما یادآوری می‌کند که انسان در معرض سوگیری‌های تصمیم‌گیری است. نمی‌توان به‌طور کل از این خطاها در امان بود ولی  آگاهی از وجود این سوگیری‌ها به مدیران کمک می‌کند تا کمتر در معرض آن‌ها قرار گیرند. هر چه بتوان فرآیند تصمیم‌گیری را به شکل صریح‌تر درآورد و از روش‌های داده‌محور بهره گرفت که دارای گام‌های مشخصی هستند می‌توان کیفیت تصمیمات را افزایش داد.

منابع:

Bendoly, E., Croson, R., Goncalves, P., & Schultz, K. (2010). “Bodies of knowledge for research in behavioral operations”, Production and Operations Management, 19(4), 434-452

Rogers, P., Carse, R., and Senturia, T. (2013). “Decision Insights: Why We Behave—and Decide—the Way We Do”, Bain & Company, Inc

Tversky, A., Kahneman, D., & Moser, P. (1982). “Judgment under uncertainty: Heuristics and Biases”, Cambridge University Press

دسته‌ها
Buiness Analysis علمی محمد حسین ابراهیم زاده

سوگیری خودانتخابی چیست؟

از اینجا

معمولاً اگر شما یک وب‌سایت داشته باشید، گهگاه مشکلاتی برایتان رخ می‌دهد که نیاز دارید برای رفع آن به بخش خدمات مشتریان شرکت میزبان وب مراجعه کنید. من برای وب‌سایتم از خدمات میزبانی شرکتی استفاده می‌کنم که به‌صورت آنلاین می‌توانم با یک کارشناس فنی گفتگو کنم. پس از پایان گفتگو پنجره‌ای باز می‌شود و از من می‌خواهد در صورت تمایل به پرسش‌هایی برای سنجش میزان رضایت از خدمات دریافت شده پاسخ دهم. امروزه شرکت‌های زیادی از چنین سیستم‌هایی برای پایش رضایت مشتریان استفاده می‌کنند.

می‌دانیم که همه مشتریان در پایان گفتگو با کارشناس فنی، به سؤالات سنجش رضایت پاسخ نمی‌دهند. آیا ممکن است این موضوع که افراد خود انتخاب می‌کنند به این پرسش‌ها پاسخ دهند، باعث شود نمونه آماری تنها بیانگر نظر بخشی از مشتریان باشد؟ در این صورت تا چه حد داده‌های چنین سیستم‌هایی برای شرکت مذکور مفید هستند؟ تا چه حد شرکت می‌تواند بر اساس تحلیل این داده‌ها از میزان رضایت مشتریانش آگاه شود؟

با فراگیرشدن استفاده از اینترنت، انجام تحقیقات بازار نسبت به گذشته ارزان‌تر و آسان‌تر شده است. امروزه بسیاری از شرکت‌های ایرانی به نظرسنجی‌های آنلاین روی آوردند تا دید بهتری از مشتریان به دست آورند. اما باید توجه کرد بسیاری از این نوع نظرسنجی‌ها در معرض سوگیری خودانتخابی (Self-Selection Bias) قرار دارند. در ادامه من با بیان مثال‌های مختلف این سوگیری را توضیح می‌دهم و در انتها درباره نحوه برخورد با آن توضیحاتی ارائه می‌کنم.

سوگیری خودانتخابی چیست؟

به این مثال توجه کنید. اداره گردشگری یک استان اعلام کرده بر اساس مطالعه‌ای که انجام داده است، اغلب گردشگرانی که در دو سال گذشته بیش از یک‌بار به‌قصد تفریح به آن استان سفر کرده‌اند، آن استان را دلپذیر و فوق‌العاده ارزیابی کردند. بنابراین اداره گردشگری آن استان چنین تبلیغ می‌کند که آنجا یکی از بهترین مقاصد گردشگری است. آیا این نتیجه‌گیری درست است؟

معمولاً در چنین مطالعاتی برای آنکه ارزیابی کنند جایی مقصد گردشگری خوبی است یا نه، از ابزار نظرسنجی استفاده می‌کنند. احتمالاً در چنین نظرسنجی سؤالات زیر پرسیده می‌شود:

در دو سال گذشته چند سفر کاری به استان داشتید؟

در دو سال گذشته چند سفر تفریحی (غیر کاری) به استان داشتید؟

آیا فکر می‌کنید این استان مقصد دلپذیر و فوق‌العاده‌ای برای اقامت است؟

بیاید درباره پاسخ‌دهندگان به چنین نظرسنجی کمی بیشتر فکر کنیم. فرض کنید کسانی که در دو سال گذشته تنها برای سفر کاری به آن استان رفتند، فکر نمی‌کنند آنجا جای دلپذیر و فوق‌العاده‌ای است. در این صورت تنها وقتی مجبور به سفر به آن استان بودند، آنجا نمی‌رفتند. این دسته از افراد در نتیجه‌گیریِ نظرسنجی لحاظ نشده‌اند.

فرض کنید کسانی که در دو سال گذشته تنها یک‌بار برای سفر تفریحی به آن استان رفتند، فکر نمی‌کنند آنجا جای دلپذیر و فوق‌العاده‌ای است. احتمالاً به همین دلیل است که دیگر به آنجا سر نزدند. این گروه هم در نتیجه‌گیریِ نظرسنجی لحاظ نشده‌اند.

فرض کنید بیشتر کسانی که در دو سال گذشته بیش از یک‌بار برای سفر تفریحی به آن استان رفتند، فکر می‌کنند آنجا جای دلپذیر و فوق‌العاده‌ای است. بالاخره جوابی که دنبالش می‌گشتیم پیدا شد. این همان جوابی است که اداره گردشگری می‌تواند از آن برای تبلیغ استفاده کند و واقعیت هم دارد، ولی تمام واقعیت نیست.

بنابراین سوگیری خودانتخابی زمانی رخ می‌دهد که ما گروه‌های مختلف افراد را که تصمیمات مختلفی گرفتند، با یکدیگر مقایسه کنیم بدون آنکه توجه کنیم “چرا” این تصمیمات را گرفتند.

نظرسنجی‌های رضایت مشتریان و سوگیری خودانتخابی

نظرسنجی‌های رضایت مشتری (Customer Satisfaction Surveys) ابزارهای مفیدی برای شناسایی نقاط قوت و ضعف خدمات و محصولاتی است که یک سازمان ارائه می‌دهد. ولی سوگیری خودانتخابی در بیشتر نظرسنجی‌های رضایت مشتریان وجود دارد که می‌توان استنتاج بر اساس آنان را تحت شعاع قرار دهد. علت اصلی در اینجاست که این نظرسنجی‌ها معمولاً به‌طور کاملاً تصادفی در بین مشتریان پخش نمی‌شوند و کسانی که تصمیم می‌گیرند به پرسش‌های آن پاسخ دهند، ممکن است به‌طور سامانمند از کسانی که تصمیم می‌گیرند به آن پاسخ ندهند، متفاوت باشند.

برای نمونه یک شرکت هواپیمایی مسافربری تبلیغ می‌کند که ۸۴ درصد مسافران کاری (Business Travelers) که به‌طور منظم بین تهران و مشهد پرواز می‌کنند این خط هواپیمایی را ترجیح می‌دهند. اگر بدانیم تنها ۸ درصد کل مسافران که بین تهران و مشهد پرواز می‌کنند از این خطوط هوایی استفاده می‌کنند، چطور این تناقض را حل کنیم؟

پاسخ این است که بیشتر این نظرسنجی‌ها در بین مشتریان خود شرکت‌ها انجام می‌شود. در این نمونه احتمالاً نظرسنجی از بین کسانی که سوار یکی از هواپیماهای این خط بودند، صورت گرفته است. با احتمال زیاد این افراد این خط هواپیمایی را ترجیح می‌دادند که آن را انتخاب کردند. درواقع نکته شگفت‌انگیز این نیست که چرا ۸۴ درصد آنان همین خط هوایی را ترجیح می‌دهند، جالب‌تر آن است که چرا ۱۶ درصد خطوط هوایی دیگر را ترجیح می‌دهند. ولی هیچ شرکتی اعلام نمی‌کند که ۱۶ درصد کسانی که از خدمات من استفاده می‌کنند، خطوط هوایی دیگر را ترجیح می‌دهند.

نظرسنجی‌های سیاسی و سوگیری خودانتخابی

پیروزی دونالد ترامپ (Donald J. Trump) در انتخابات سال ۲۰۱۶ ریاست جمهوری آمریکا برخلاف پیش‌بینی‌های مبتنی بر نتایج بسیاری از نظرسنجی‌ها، بار دیگر توجه‌ها را به لزوم دقت در اجرا و تحلیل نظرسنجی‌ها جلب کرد. یکی از عوامل توضیح‌دهنده خطا در نتایج آن نظرسنجی‌ها، سوگیری خودانتخابی است.

بسیاری از روش‌های آماری از یک فرض بنیادی شروع می‌شوند که ممکن است نادیده گرفته شود: فرض تصادفی بودن نمونه آماری. وقتی شما می‌خواهید بفهمید در جامعه هدف (در این مثال همه افراد واجد شرایط که می‌خواهند در روز انتخابات رأی دهند) به کدام کاندید رأی می‌دهند عملاً نمی‌توانید از همه افراد جامعه سؤال کنید. این کار فقط یک‌بار آن‌هم در انتخابات واقعی ممکن است. برای این منظور باید یک سری از افراد را که کاملاً “تصادفی” انتخاب شده‌اند و “نماینده‌ای از جامعه هدف” هستند، به‌عنوان نمونه آماری انتخاب کنید و نتایج این نمونه را به جامعه هدف تعمیم دهید. تئوری‌های آماری این تضمین را می‌دهند درصورتی‌که چنین نمونه‌ای انتخاب کرده باشید، با احتمال خوبی می‌توانید ویژگی‌های جامعه هدف را تخمین بزنید.

حال اگر نمونه نسبت به قسمتی از جامعه هدف سوگیری داشته باشد و به‌نوعی نمایانگر تمام جامعه هدف نباشد، نتایج با خطا همراه است. درباره نظرسنجی‌های انتخاباتی، این‌که عملاً نظرسنجی حاصل پاسخ افرادی باشد که حاضر باشند در نظرسنجی شرکت کنند، تمام توضیحات ابتدایی را گوش کنند و پاسخ سؤالات را دهند، ممکن است نمونه را به سمت خاصی سوق دهد. این خطا همواره مشکل‌ساز نیست. برای مثال در آمریکا، میزان پاسخگویی آفریقایی-آمریکایی تبارها در نظرسنجی‌ها پایین است. محقق با دانستن این‌که چند درصد آفریقایی-آمریکایی تبارها کل جمعیت را تشکیل می‌دهند، می‌تواند بر اساس همان نمونه محدود، خطای آماری را اصلاح کند.

اما مشکل زمانی پیش ‌می‌آید که محقق نداند افراد ممکن است بر اساس چه ویژگی به نظرسنجی پاسخ ندهند و برخی از افراد به شکل سامانمند از شرکت در نظرسنجی امتناع کنند. در انتخابات اخیر بسیاری از طرفداران ترامپ بر این باور بودند که رسانه‌ها و مؤسسات افکارسنجی، نظرسنجی‌ها را دست‌کاری می‌کنند و این نگرش احتمالاً باعث شده است طرفداران وی از شرکت در نظرسنجی‌ها خودداری کنند و نتایج عملاً متمایل به طرفداران هیلاری کلینتون (Hillary Clinton) شود که خود ظن آن‌ها را تقویت می‌کرده است.

در این مثال در عمل، قسمتی از نمونه خودش انتخاب کرده که جزء آن نباشد.

نکته مهم این است که افزایش حجم نمونه خطای ناشی از سوگیری خودانتخابی را کاهش نمی‌دهد.

مطالعات مشاهده‌ای و سوگیری خودانتخابی

علاوه بر نظرسنجی‌ها، سوگیری خودانتخابی مطالعات مشاهده‌ای (Observational Studies) را هم می‌تواند تحت تأثیر قرار دهد. برای مثال، گروهی از محققان استرالیایی در سال ۲۰۱۱ گزارشی منتشر کردند که عنوان می‌کرد بر مبنای مشاهدات آنان به‌طور متوسط کسانی که شش ساعت تلویزیون در روز نگاه می‌کنند پنج سال زودتر از کسانی که اصلاً تلویزیون نگاه نمی‌کنند، می‌میرند. با در نظر گرفتن عادات مردم استرالیا در دیدن تلویزیون، آنان این‌طور نتیجه گرفته بودند که با ندیدن تلویزیون به‌طور متوسط دو سال به عمر انتظاری (Life Expectancy) افراد اضافه می‌شود.

در اینجا هم سوگیری خودانتخابی موجب می‌شود که افراد خود تصمیم بگیرند داخل گروهی باشند یا نباشند. در این مثال شاید کسانی که تصمیم گرفتند بیشتر تلویزیون نگاه کنند، ازنظر بدنی کمتر فعال هستند، یا مبتلا به افسردگی شده‌اند و یا در شرایط جسمی خوبی نیستند و نمی‌توانند مانند افراد سالم به فعالیت‌های پرتحرک بپردازند. درواقع ممکن است عامل پنهان دیگری هم‌زمان موجب افزایش دیدن تلویزیون و کاهش طول عمر می‌شود.

روش درست‌تر برای انجام چنین مطالعه‌ای بهره‌گیری از رویکرد آزمایش کنترل‌شده تصادفی است. در حالت ایدئال برای نتیجه‌گیری دقیق باید افراد را به‌صورت تصادفی به دو گروه تقسیم کنیم. گروه اول از دیدن تلویزیون ممنوع می‌شدند و گروه دوم مجبور می‌شدند که هرروز شش ساعت تلویزیون ببینند. در پایان دوره آزمایش، اثر تلویزیون دیدن را بر سلامت افراد دو گروه ارزیابی کنیم. البته واضح است که انجام چنین آزمایشی اخلاقی نیست و باید دنبال روش‌های دیگری بود تا خطای خودانتخابی را در چنین مطالعاتی کاهش داد.

چگونه سوگیری خودانتخابی را کاهش دهیم؟

همان‌طور که اشاره کردم حالت ایدئال برای از بین بردن سوگیری خودانتخابی بهره‌گیری از رویکرد آزمایش کنترل‌شده تصادفی است. اما اگر به هر دلیلی نتوان از این رویکرد استفاده کرد، روش‌های آماری مختلفی مانند رگرسیون چندمتغیره (Multiple Regression)، طراحی ناپیوسته رگرسیون (Regression Discontinuity Design) و همتایابی نمره تمایل (Propensity Score Matching) برای کاهش سوگیری خودانتخابی توسعه یافته‌اند. در اینجا من برای آنکه خواننده دید کلی نسبت به رویکردهای آماری برای حل این مسئله پیدا کند، روش همتایابی نمره تمایل را با مثالی ساده توضیح می‌دهم.

آشنایی شهودی با روش همتایابی نمره تمایل

فرض کنید وزارت بهداشت یک استان تصمیم گرفته است در چند روستا خانه بهداشت تأسیس کند. پس از گذشت یک سال وزارت بهداشت می‌خواهد ارزیابی کند تأسیس خانه بهداشت چه تأثیری بر ارتقاء سلامت روستائیان گذاشته است. برای این منظور نرخ مرگ‌ومیر را در روستاهایی که دارای خانه بهداشت هستند (گروه آزمایش Treatment Group) با آن‌ها که فاقد آن هستند (گروه کنترل Control Group)، مقایسه می‌کند. نتایج این طرح در شکل-۱ آمده است.

شکل-۱

یک روش ساده برای سنجش اثربخشی وجود خانه بهداشت این است که میانگین نرخ مرگ‌ومیر دو گروه را باهم مقایسه کنیم:

mean_{{treatment}} = 1/4\times(10+15+22+19) = 16.5
mean_{{control}} = 1/5\times(25+19+4+8+6) = 12.4

نتایج بالا نشان می‌دهد که میانگین نرخ مرگ‌ومیر در روستاهای فاقد خانه بهداشت ۱۲٫۴ در هر هزار نفر و در روستاهای دارای خانه بهداشت ۱۶٫۵ است. این در ظاهر یعنی در یک سال گذشته روستاهایی که دارای خانه بهداشت بودند، نرخ مرگ‌ومیر بالاتری داشتند. آیا خطایی در تحلیل وجود دارد؟

اگر خانه‌های بهداشت به‌صورت تصادفی در بعضی روستاها ساخته می‌شد و در برخی دیگر ساخته نمی‌شد، آن‌وقت این مقایسه درست بود ولی در واقعیت چنین نیست. به‌احتمال‌زیاد سیاست‌گذار بر مبنایی این تصمیم را گرفته که در کجا خانه بهداشت بسازد. اگر روستاهایی که در آن‌ها خانه بهداشت ساخته‌شده، در گذشته نرخ مرگ‌ومیر بالایی داشته‌اند، مقایسه این دو گروه باهم کار صحیحی نیست. درواقع نرخ مرگ‌ومیر بالا در آن روستاها عامل انتخاب این روستاها برای ساخت خانه بهداشت بوده است. در این صورت این روستاها را باید با همتایان خود مقایسه کرد. این رویکرد مبنای روش همتایابی نمره تمایل است.

اگر فرض کنیم هیچ داده‌ای از نرخ مرگ‌ومیر روستاها قبل از اجرای این برنامه نداشته باشیم، باید از شاخص‌های دیگری استفاده کنیم تا بفهمیم پیشینه این روستاها چقدر به هم شبیه است و تنها آن‌هایی را که به یکدیگر مشابه‌اند، مقایسه کنیم.

در شکل-۲ می‌بینید من دو متغیر دیگر را هم درباره این روستاها اضافه کردم؛ یکی درصد ساکنین زیر خط فقر و دیگری سرانه پزشک در آن روستا. این دو متغیر به من کمک می‌کند تا به برآوردی از پیشینه این روستاها برسم. با احتمال زیاد روستاهایی که ساکنان بیشتری زیر خط فقر و سرانه پزشک پایین‌تری دارند، پیش از اجرای این طرح دارای نرخ مرگ‌ومیر بالاتری بودند.

شکل-۲

در روش همتایابی نمره تمایل، با استفاده از رگرسیون لجستیک (Logistic Regression) برای هر مشاهده نمره‌ای بین صفر تا یک را بر اساس سایر متغیرهایی که ممکن است فرآیند انتخاب را تحت تأثیر قرار دهند (در این مثال درصد ساکنین زیر خط فقر و سرانه پزشک) محاسبه می‌کنیم. نمره تمایل نشانگر این است مشاهدات بر اساس آن متغیرها تا چه حد به هم شبیه هستند. من نمره تمایل را برای همه روستاها محاسبه کردم و در شکل-۳ نشان دادم.

شکل-۳

برای مثال می‌بینید روستای ردیف اول که دارای خانه بهداشت است، با روستای ردیف ۶ که فاقد خانه بهداشت است، به لحاظ پیشینه شباهت زیادی دارد. روستاهای ۲، ۳ و ۴ نیز مشابه روستای ۵ هستند. به‌این‌ترتیب روستاهای ۷، ۸ و ۹ از گروه کنترل خارج می‌شوند. اگر به این روستاها دقت کنید از منظر اقتصادی و سرانه پزشک در وضع مناسبی هستند. حالا می‌توانم روستاهای گروه آزمایش را با گروه کنترلی جدید که شامل روستاهای همتای گروه آزمایش هستند، مقایسه کنم.

mean_{{treatment}} = 1/4\times(10+15+22+19) = 16.5
mean_{{control}} = 1/4\times(19+25+25+25) = 23.5

در این حالت می‌بینیم ساختن خانه بهداشت اثر مثبتی روی کاهش نرخ مرگ‌ومیر گذاشته است.

در مثال مربوط به سنجش رضایت که در ابتدای مقاله اشاره کردم، روش همتایابی نمره تمایل می‌تواند اثر سوگیری خودانتخابی را تصحیح کند. در چنین نظرسنجی‌هایی باید نمره تمایل را برای مشتریانی که به نظرسنجی پاسخ دادند و آن‌هایی که پاسخ ندادند محاسبه کرد. معمولاً در سیستم‌های مدیریت ارتباط مشتریان (CRM) داده‌های خوبی از وضعیت جمعیت‌شناختی و رفتار خرید مشتریان جمع‌آوری می‌شود. این داده‌ها می‌تواند به‌عنوان مبنایی برای سنجش مشابهت پیشینه مشتریان استفاده شود تا میزان رضایت مشتریانی را که به نظرسنجی پاسخ ندادند بر اساس مشتریان با پیشینه مشابه که به نظرسنجی پاسخ دادند، تخمین زد.

اگر به موضوعات مطرح‌شده در این مقاله علاقه‌مند بودید، خواندن مقالات زیر را به شما توصیه می‌کنم.

چگونه بازماندگان شما را فریب می‌دهند؟

چرا مدیران باید تفاوت بین همبستگی و رابطه علّی را بدانند؟

چگونه رابطه علّی را تشخیص دهیم؟

منابع:

Bethlehem, J. (2010). “Selection Bias in Web Surveys”, International Statistical Review, 78(2), 161-188

Keeble, C., Law, G. R., Barber, S., & Baxter, P. D. (2015). “Choosing a Method to Reduce Selection Bias: A Tool for Researchers”, Open Journal of Epidemiology, 5(3), 155-162

Smith, G. (2014). “Standard Deviations: Flawed Assumptions, Tortured Data, and Other Ways to Lie with Statistics”, Overlook Duckworth, Peter Mayer Publishers, Inc. New York

Thavaneswaran, A., & Lix, L. (2008). “Propensity Score Matching in Observational Studies”, Manitoba Center for 

دسته‌ها
Buiness Analysis علمی محمد حسین ابراهیم زاده

قانون ده دقیقه

I made a new rule for my online searches. If my search fails in ten minutes, then I need to change my search.

یه قانون جدید گذاشتم برای جستجوهای آنلاینم. اگر جستجوی من بعد از ده دقیقه به نتیجه مطلوب نرسید، پس باید شیوه جستجوم رو تغییر بدم.

دسته‌ها
علمی محمد حسین ابراهیم زاده

Unleash the value of PROCESS MINING

ABOUT

The purpose of this article is to introduce the reader to process mining, an innovative analytical approach to learn about any process in an objective and exhaustive manner. It covers of course the key concepts and definitions, as well as the benefits, technical requirements, and success criteria, which hopefully will give you the inspiration to apply such techniques to your own professional reality.

Let’s jump and learn about this fascinating innovative solution for complex processes exploration!


CONTENTS

  • What is process mining?
  • Benefits
  • How does it work?
  • How does process mining heavily improve process discovery ?
  • A word on required data
  • Success criteria
  • Conclusion

WHAT IS PROCESS MINING?

Most organizations create business processes which are sometimes difficult to control and comprehend. Understanding these processes are however an absolute prerequisite prior to taking on any improvement initiative.

Process mining is a discipline supported by a powerful analytical technique which makes it easy and fast to get a complete and objective picture of your processes, and as a consequence to control and continuously improve them. This is made possible by analyzing vast quantities of data available in IT systems. Mainly which activities are performed, when, and by whom.

In that sense, process mining sits at the intersection of Business Process Management (BPM) and Data Mining.

Process mining is a highly valuable solution for insights generation: did you ever ask yourself what really occurred in a particular process, what deviations from the initial designed flow have been observed, where are the bottlenecks, how can the process be optimized? If so, then you should definitively consider process mining as part of your team’s toolkit.

As process mining tools are very intuitive to use and highly visual, I encourage you to have a look at the video below, before deep diving into more details, as an illustration of the power of process mining, applied to a banking process. This video has been created by Fluxicon.

Process mining applied to the banking industry (ILLUSTRATIVE)

BENEFITS

Using process mining provides several benefits to business owners and organizations. We list hereunder the most significant ones:

  • Understanding how a process is actually performed.

Most of the time, business owners know very well their processes from a theoretical perspective: what is supposed to happen, when, who is supposed to do what, under which condition.

However, they usually do not have a way to investigate what is really happening throughout the process lifecycle. Traditional reporting, Business Intelligence (BI), statistical tools have difficulties in revealing both the big and the very detailed picture. Such a back and forth navigation from the big picture and the detail is actually what is the most efficient way to comprehend the real life situation. Process mining solutions such as Disco focuses on making it easy to digest and exploit.

  • Improving the process flow by knowing the actual flows, frequencies, and delays in the process.

IT system logs track great volumes of useful information, making it feasible to compute paths and lead times to switch from one step in the process to another. One can leverage this valuable information to detect bottlenecks, highlight sub efficiencies, reveal most frequent paths, etc.

  • Cost savings by improving the productivity of employees.

Speed up investigation time, and free up time of your analysts to improve processes rather than to analyze the as-is. Reduce overall process time by focusing on the pain points.

  • Harmonizing processes in different regions by understanding how people work in different ways to see what the best practices are and to align processes.
  • Improving the quality and increasing the efficiency of auditing.

Conduct audits in an efficient manner, leveraging data science and avoiding opinion-based discussion (data is agnostic!).

  • Verifying that implemented process changes have had the expected effect by comparing the old process to the new process.

Want to observe the impact of any change in the process? Conduct pre/post analysis, and quantify your impact and added value to the new process!


HOW DOES IT WORK?

One of the great advantage of process mining is that it analyzes any process in an agnostic way. This is made possible thanks to data, namely the footprint of any action being performed in a IT system and captured in its log.

To understand how this works, let’s consider a process made of 5 activities A, B, C, D, E, and analyze how 3 past items going through this process can help learn more about it.

In the animation below, you can observe that some cases go through different activities, or through the same activities but in different order. Some others loop over the same activity.

Process mining consists in analyzing all possible patterns based on historical data and in creating a highly visual process map for investigations.


HOW DOES PROCESS MINING HEAVILY IMPROVE PROCESS DISCOVERY EXERCISES?

The value of process mining is twofold: generating valuable insights to improve current processes, and speeding up the insight generation time, thus improving team’s productivity. Let’s compare and highlight these benefits:

Without process mining

The traditional way of process discovery is carried out manually through workshops and interviews.

۱٫ Time consuming:for the people who do the interviews and process mapping. If they could do their work faster, they could do more projects and therefore deliver more value for their organization.

۲٫ Bind resources: it binds people (interviewees) from productive work into discussions about how things are currently done just to understand the ‘as-is’ process.

۳٫ Subjective results: based on what people think about how the processes are, not necessarily based on how the processes really are.

۴٫ Risk of political deadlock: there may be different opinions that cannot be resolved (political deadlock). In situations, where the participating people cannot agree on a unified view of the ‘As-is’ process and the problems with the process, the risk is high that the project fails and no process improvement is carried out at all.

۵٫ Incomplete picture: you get only a sample view, not the complete picture. By asking people to spell out the process, the manual picture will never be complete.

۶٫ Measurement is costly: manual tracking and measurement is costly, biased, and also provides only sample data. This is about the practice of measuring process steps with a stopwatch to collect objective evidence: (1) Doing this manual work is very time-consuming, (2) People who are observed behave differently than normally, and (3) Only a limited sample can be obtained (e.g., tracing 30 cases over a few weeks).

۷٫ Difficult to replicate: because the cost of process diagnosis and information collection is so high, it cannot be easily repeated.

With process mining

The starting point for any process improvement project is the so-called ‘As-is’ process analysis, in which the current state and all the deficiencies of the process are mapped out and improvement opportunities are identified. Process mining significantly lowers the cost of understanding the current process by limiting people interviews and extracting the necessary information out of the existing data from the IT systems.

With process mining, the previously mentioned pain points are resolved:

۱٫ Time-efficient: The analyst spends less time on interviews and workshops. Instead, the ‘As-is’ process is automatically reconstructed from the IT data in the organization.

۲٫ Frees resources: workshop sessions can be much more productive, because the real ‘As-is’ process can be already taken as a starting point.

۳٫ Objective results: The data provides a factual basis for the diagnosis and improvement decisions.

۴٫ Freedom from political deadlock: There is no room for opinions as far as the process reality is concerned.

۵٫ Complete picture: All the exceptions are brought into the picture along with the normal process. For example, all process variations and actual delays from the past year can be analyzed to get a complete picture.

۶٫ Measurement is less costly: The actual durations and delays between process steps can be measured for thousands of transactions.


A WORD ON REQUIRED DATA

As for all data driven technologies, data preparation plays an important role in order to be able to fully benefit from process mining.

In this section, I briefly introduce the reader to the data requirements which consist of creating an event log that can be fed into a process mining tool.

Prerequisites

What are the key required components to any process analysis? Actually only 3 main pieces of information are required:

  • Activities (process step): the several steps that compose the process.
  • Case ID: the unique identifier of any item going through the process.
  • Timestamp (for performance evaluation): flag of when each item arrived and left any activity.

Optional

For more advanced analysis, I strongly encourage you to complement these prerequisites with additional (optional) information, such as resourcecountrydepartment etc. being involved.

Leveraging such additional data will enable far more advanced and detailed investigations (territory specificities, products being treated differently depending on their category etc.)


SUCCESS CRITERIA

Interested in starting a process mining initiative? Before you start, remind that process mining is a discipline (not just a tool) that requires skills people need to learn (e.g. how to detect data quality issues, how to interpret the results, etc.) and that process mining is just a starting point for the discussion with the domain experts (so the purpose is not to automatically generate definitive answers and stop talking to people, but to start talking to them on a different level).

Make sure success criteria are identified from the beginning.

  1. Focus on the business value: define the business value in terms of effectiveness (customer experience and revenue), efficiency (costs) and risk (reliability). Determine into which process aspects you want to gain insights. To which business driver does this insight contribute? Better customer experience, cost reduction, risk mitigation?
  2. Start small, think big: connect the business driver to a specific business domain. Choose a process where the beginning and the end are clearly defined. Each manager of such a process will benefit from insights that help to reduce costs or increase the effectiveness. And while you think about the possible use cases and application possibilities, also make sure to communicate what process mining is not. By indicating clear boundaries, you can manage expectations on what it is.
  3. Work hypothesis-driven and in short cycles: divide the main business driver into sub hypotheses that you can confirm or disprove with a process mining analysis. For example: There is a gut feeling that a particular service process takes too long. How long does the process really take? How much does it deviate from the expectations? Where are the bottlenecks that cause the delays in this process? In addition, you can then indicate where exactly the delays are in the process. Take your business stakeholders from insight to insight. Stimulate them to ask questions. Explore, analyze and innovate. Time-box the intermediate results and the project. Eight weeks for the first project is usually a good aim.
  4. Facts don’t lie: process mining allows you to analyze processes based on facts instead of subjective opinions. Speak openly and transparently about the data that you use and about the facts that come out of this analysis. This can be confrontational and for some people even unwelcome. Put a change management team together that has the competency to handle resistance. Process mining can be the perfect assistance in this truth finding. Always use experts from the business process domain and the IT-domain for a sanity check of the data and the analysis. Use process mining as a constructive starting point to ask the right questions and avoid too quick judgments.

CONCLUSION

I’ve discovered process mining a few years ago, following the online course from process mining’s guru Wil van der Aalst, and this was really eye-opening to me. The benefits of it are numerous, and should definitively part of any data scientist’s toolkit!

I’m happy to receive feedback of any kind so please feel free to comment and share your perspective (opinion, use case, etc.) on this capability.

Struggling with your processes? No need to get your hands dirty anymore! Take full benefit of process mining!

Resource

دسته‌ها
ERP Marketing علمی

توزیع و فروش

توزیع کنندگان و نمایندگی ها در یک کانال عرضه شرکت می کنند ، توزیع کننده معمولاً عمده فروشی است که به فروشندگان و دلالان می فروشد و معمولاً خرده فروشانی است که مستقیماً به عموم مردم می فروشند. اصطلاحات توزیع کننده توزیع کننده کالا در توزیع ماشین آلات و کالاهای مکانیکی متداول است – از این رو در خودرو ، کامیون ، تجهیزات مزرعه و ساخت و ساز ، کالاهای حیاط و باغی (کالاهای سبز) ، لوازم (کالاهای سفید) ، الکترونیک و همچنین در فروش تجهیزات صنعتی این ساختار اساسی انواع مختلفی دارد.

توزیع کنندگان و نمایندگی ها در واقع کالاهایی را که می فروشند خریداری می کنند – توزیع کننده از تولید کننده ، فروشنده از توزیع کننده. توزیع کنندگان موجودی قطعات را حفظ می کنند و نمایندگی ها عملکردهای خدماتی را به مصرف کنندگان نهایی ارائه می دهند (“نمایندگی های سرویس دهی”). روابط بین تولید کنندگان ، توزیع کنندگان و نمایندگی ها به طور معمول از نظر قراردادی است. توزیع کنندگان و فروشندگان به نوبه خود در برنامه های تشویقی که توسط تولید کنندگان ارائه می شود شرکت می کنند – مانند برنامه های تبلیغاتی یارانه ای ، پاداش ها و تخفیف های ویژه. توزیع کنندگان و فروشندگان حق دارند از علائم تجاری و آرم های سازنده استفاده کنند اما نه به عنوان نوع خود.

روابط توزیع و فروشندگی با تولید کنندگان از ویژگی های بسیاری با حق رای دادن برخوردار است. در واقع ، قوانین ایالتی حاکم بر حق رای دادن ممکن است بندهایی داشته باشد که به طور مستقیم به توزیع کنندگان و نمایندگی ها مربوط می شود. اما مفهوم حق رای دادن اساساً متفاوت از مدل توزیع کننده کالا است. توزیع کنندگان و نمایندگی های سنتی هرگز به دلیل امتیاز فروش کالاهای تولید کننده مبلغی را به تولیدکننده نمی پردازند ، اما ممکن است با خرید پستی از حداقل مقدار کالاها به طور پیمانکاری خواسته شود. توزیع کنندگان و فروشندگان ممکن است نسبت به تولیدکننده نسبتاً قوی یا نسبتاً ضعیف باشند ، اما در همه موارد آنها چیزی را در جدول قرار می دهند ، یعنی بازاری مستقر که از قبل توسعه یافته است. حمل و نقل و توزیع کنندگان قدرتمند برای حمل کالاهای تولیدکننده های رقیب امری عادی نیست ، اگرچه در اکثر موارد یکی از مارک های مسلط است و دیگری در خدمت مشتری کوچکتر.

شرکت کنندگان
سازنده
یک سیستم توزیع دو لایه (توزیع کننده ، فروشنده) ممکن است کانال ترجیحی باشد که توسط سازنده یک یا کل خط از کالاهای خود استفاده می شود. استفاده از توزیع کنندگان ، مزیت خریدار را با خریداران عمده ، توزیع کنندگان می بخشد ، که در عوض ، به نوبه خود ، مراقبت از فروش محصول را با استفاده از نمایندگی ها به مصرف کننده نهایی انجام می دهند. در هر نوع تجارت عمده تجهیزات ، سرمایه قابل توجهی در حمل و نگهداری کالاها از جمله موجودی قطعات انجام می شود. توزیع کنندگان با خرید کالا به حساب خود و آزاد کردن سرمایه در گردش تولیدکننده برای دور بعدی در چرخه تولید ، بار را به اشتراک می گذارند. با وجود این ، تولیدکننده در چنین کانال با برنامه های بازاریابی ، برنامه های تشویقی برای توزیع کنندگان و نمایندگی ها ، تخفیف برای مصرف کننده و همچنین با ارائه برنامه های آموزش فنی برای توزیع کنندگان و نمایندگی های فروش ، در سطح خرده فروشی شرکت می کند.

توزیع کننده
توزیع کننده نمایندگی فروش مستقل است که قرارداد فروش محصولات تولید کننده را دارد. توزیع کننده نمی تواند خودش را به عنوان تولید کننده معرفی کند اما ممکن است نام تجاری تولید کننده را در علائم و وضعیت فروش نشان دهد. بسته به قدرت نسبی تولید کننده ، توزیع کننده ممکن است محدود به فروش تنها یک مارک یک محصول باشد. در عمل توزیع کنندگان قوی آزادی بیشتری خواهند داشت. توزیع کننده معمولاً قلمرو اختصاصی دارد که ممکن است بخشی از یک مترو باشد یا بسته به محصول ، ممکن است یک منطقه بزرگ شامل بیش از یک کشور باشد. توزیع کنندگان قیمت های عمده فروشی را برای محصول پرداخت می کنند و سپس در نمایندگی هایی که قیمت فروشندگان را پرداخت می کنند توزیع می کنند.

انواع مختلفی از این الگوی کلی وجود دارد. یکی از این توزیع کنندگان قرارداد که محصولی را از یک تولید کننده خریداری می کند ، آنرا با سایر محصولات تثبیت می کند و به این ترتیب ارزش افزوده می شود و محصول را دوباره می فروشد. یک توزیع کننده قرارداد با عمده فروشی تفاوت دارد زیرا عمده فروش فقط کالایی را به همراه سایر محصولات تولید کنندگان مختلف خریداری می کند و در صورت تغییر هر چه بیشتر محصول را فروش می کند.

به عنوان یک نهاد مستقل ، عملیات توزیع کننده تحت کنترل مدیریتی مستقیم یک تولید کننده نیست. تولیدکنندگان با ارائه روشهای متداول برای نمایش ، مدیریت موجودی ، تولید تبلیغات ملی و نمادگرایی و ارائه انگیزه در توزیع کننده تأثیر می گذارند. برخی از این امور داخلی ممکن است با قرارداد عمومی اداره شود که توزیع کنندگان و تولیدکنندگان در آن فعالیت می کنند.

فروشنده
نمایندگی گاهی اوقات توزیع کننده خرده فروشی نامیده می شود. این مشابه توزیع است ، به جز اینکه یک فروشنده معمولاً فقط به عموم مردم می فروشد. بر خلاف انواع دیگر فرانشیزها ، از جمله برخی توزیع کنندگان ، یک فروشنده به ندرت یک خط محصول واحد را حمل می کند. حتی در صنعت اتومبیل ، یک فروشنده عمده کالاهای رقیب و غالباً را در همان سایت حمل می کند ، اما اینها با قرار گرفتن در ساختمان خود ، از یکدیگر متمایز می شوند.

نمایندگی در واقع با فعالیت به عنوان نمایندگی برای یک محصول مارک دار ، اما در مرحله دوم در کل بازاریابی تولید کننده – از پشتیبانی تبلیغات ملی ، دریافت آموزش و استفاده از برنامه های تشویقی شرکت می کند. نمایندگی ها با شرکت در گروه های دلال ، بعنوان مکانیزم بازخورد برای تولیدکننده برای انتقال بینش به دست آمده از طریق خرید و فروش مستقیم با مشتری ، عمل می کنند.

تضمین یک نمایندگی فروش / توزیع
برای تعیین اینکه در کدام فرصت تجاری یا حق رای برای سرمایه گذاری استفاده می شود ، انجام تحقیقات دقیق بسیار مهم است. در حالی که مزیت سرمایه گذاری در یک فرصت تجاری یا حق رای دادن این است که می تواند یک “عملیات کلید در دست” باشد ، برنامه ریزی و تحقیق درباره سرمایه گذاری حتی به طور کامل تر از تلاش های کارآفرینی سنتی بسیار مهم است.

با ارزیابی مهارتها و اهداف خود برای تجارت شروع کنید. این موارد را در هنگام مرور فرصت های حق رای دادن در ذهن داشته باشید. با یک مطالعه کامل از بخشنامه پیشنهادهای حق رای دادن (UFOC) یا بیانیه افشای مشاغل شروع کنید. اگر مشاغل حق رای دادن یکی از این موارد را ندارد ، بپرسید که چرا و در مورد قابلیت اطمینان کسب و کار نگران باشید. از سوابق مالی شرکت و همچنین جزئیات کتبی درباره آنچه که دقیقاً برای قیمت خرید از جمله آموزش و پشتیبانی ارائه می شود ، دریافت کنید. دریابید که توزیع کنندگان دیگر در چه مواردی وجود دارند و در صورت امکان با آنها در مورد موفقیت حق رای دادن ، کیفیت محصول / خدمات و پشتیبانی از حق رای دادن صحبت کنید. پتانسیل محصول / خدمات را با خانواده و دوستان خود آزمایش کنید. از خود بپرسید ، “آیا می توانم این محصول / خدمات را خریداری کنم؟”

یکی دیگر از عوامل تأمین امنیت تجارت دلال و توزیع کننده ، سرمایه گذاری اولیه بزرگ است. به طور معمول دو نوع هزینه مربوط به حق رای دادن و فرصت های شغلی وجود دارد: هزینه اولیه راه اندازی یا قیمت خرید و هزینه های جاری یا هزینه های محصول. قیمت خرید ممکن است به این بستگی داشته باشد که آیا صاحب کار کوچک در یک عملیات “کلید در دست” مانند نمایندگی فروش خودرو یا حق رای دادن کمتری سرمایه گذاری کند. حق رای دادن به آینده نباید از مذاکره در مورد قیمت خرید و شرایط فرصت تجاری ترسید.

قلمرو حق رای دادن می تواند انحصاری یا غیر انحصاری باشد. هر نوع از قلمروها جوانب مثبت و منفی دارند ، اما مطمئن باشید که از وضعیت تجارت آینده خود آگاه هستید و مشخص کنید که آیا می توانید در این محیط کار کنید.

لازم به ذکر است که هر دو توافقنامه توزیع و نمایندگی تمایل دارند مدت کوتاه تر از توافق نامه حق رای دادن سنتی داشته باشند. توافقات توزیع و نمایندگی اغلب با توافق متقابل سالانه تجدید می شود. یک قرارداد حق رای دادن سنتی معمولاً حداقل پنج سال را شامل می شود.

مزایا و هزینه های فروشندگان و توزیع کنندگان کالا
در نحوه کار توزیع و توزیع کالا اختلافاتی وجود دارد. توزیع کالا معمولاً بیشتر از نمایندگی هزینه دارد و به مهارت رهبری و دانش بهتر از مهارتهای اساسی در تجارت نیاز دارد. این منطقه به احتمال زیاد دارای قلمرو بزرگتر از نمایندگی خواهد بود و حتی ممکن است تا بیش از یک مکان گسترش یابد. نمایندگی تمایل به محلی بودن دارد و به سرمایه اولیه کمتری نیاز دارد. یک فروشنده می تواند تلاش های خود را بر روی مدیریت و موفقیت یک مکان متمرکز کند. فروشنده نزدیک با توزیع کننده همکاری می کند بنابراین به او می پردازد که این رابطه را نیز پرورش دهد. در تحلیل نهایی ، توزیع کالا می تواند سودآورتر باشد. اما به مهارت های مختلف و سرمایه گذاری بالاتر احتیاج دارد.

مهمترین مزیت مشارکت در چنین کانال دو لایه ای از ارزش برند محصولات حمل شده و حمایت از مارک های تولید کننده است. با این وجود رابطه متقابل است. مارک های خوب پشتیبانی تمایل به قیمت بالاتری دارند. فشار موجودی در سطح بالا بیشتر خواهد بود و انطباق با برنامه های تولید کننده اعمال می شود. به نوبه خود ، توزیع خوب کارآیی ، انتخاب نمایندگی های عالی را انجام می دهد که به نوبه خود ، با فرماندهی مکانهای قوی و ارائه خدمات مناسب به مصرف کنندگان ، به میزان قابل توجهی در تصویر برند کمک می کنند.

روابط تولیدکننده و توزیع کننده و فروشنده دارای منازعات داخلی نیز است – حل و فصل صحیح آن برای عملیات طولانی مدت سودآور است. درگیری ها اغلب اشکال متضاد دارند: تولید کنندگان ممکن است بخواهند محصول بیشتری را به کانال سوق دهند تا کانال واقعاً بخواهد. در زمان های دیگر ، به ویژه هنگامی که یک محصول واقعاً خاموش شود ، کانال نمی تواند محصول کافی را برای پاسخگویی به تقاضا بدست آورد. شرکت کنندگان موثر در این کانال توجه خوبی به طرفین می کنند. تولیدکنندگان پایین کانال رشد می کنند. توزیع کنندگان هم فروشندگان خود را تحت فشار قرار داده و هم از آنها محافظت می کنند. فروشندگان برای انبار کردن نیازهای تولیدکننده با اندکی انبار کردن بیشتر ، “تمایل به خرج می دهند” و در صورت کوتاه بودن محصول با اولین بار برای محموله ها ، سود خواهند برد.

چالش های خرید و فروش و توزیع معاملات
یکی از چالش های اخیر برای فروشندگان و توزیع کنندگان ، تغییر در رابطه با تولید کننده اصلی یا حق رای دادن است. به عنوان مثال ، طبق گفته رابرت اولریش در نمایندگی مدرن تایر ، جنرال موتورز در اوایل دهه ۱۹۹۰ می خواست ۱۰ درصد از نمایندگی های خود را به عنوان کارخانه تعلق بگیرد. جنرال موتورز به دنبال حفظ نام تجاری خود در نمایندگی های خود بود که بسیاری از آنها فروش بیش از یک خط خودرو را در زیر سقف خود آغاز کرده اند. نمایندگی های مستقل موجود نگران این بودند که نمایندگی های کارخانه تحت درمان ترجیحی در مناطق دریافت کنند

BIBLIOGRAPHY

  • Brack, Ken. “A Direct Hit on Distribution.” Industrial Distribution. March 1999.
  • Caffey, Andrew A. “Different Worlds: How to Choose Between a Franchise and a Business Opportunity.” Entrepreneur. ۱۹ June 2000.
  • Caffey, Andrew A. “Eight Steps to Choosing the Perfect Business Opportunity.” Business Start-Ups. September 1998.
  • Entrepreneur Magazine: Starting a Home-Based Business. John Wiley, 1999.
  • Estratiades, Anastasius. “Ten Key Questions to Consider Before Your Client Goes Global.” Journal of Accountancy. February 1997.
  • Gibbs, Andy. “How to Sell Your Product.” Entrepreneur. ۴ September 2000.
  • Peterson, Dean D. “In the Beginning.” Doors and Hardware. August 2000.
  • Pressman, Arthur L., and Craig R. Tractenberg. “An Introduction to Franchise Law.” The Legal Intelligencer. ۳۱ May 2000.
  • Price, Courtney, and Kathleen Allen. Tips and Traps for Entrepreneurs. McGraw Hill, 1998.
  • Ulrich, Robert J. “Alignments Can Help Dealerships.” Modern Tire Dealer. June 1992

منبع