داده کاوی
داده کاوی
ریشه اصطلاح داده کاوی به کاوش در معادن طلا و زغال سنگ مربوط می شود. توربان همکاران (۲۰۰۷) داده کاوی را به عنوان فرایندی معرفی می کنند که در آن از ابزارهای مختلفی برای استخراج و شناسایی اطلاعات مفید از پایگاه داده جهت دستیابی مکرر به دانش استفاده می شود.داده کاوی با ارائه ابزارهایی به شرکت ها کمک می نماید که الگوها و روندهای مربوط به داده های مشتریان را استخراج نموده و مدیریت ارتباط با مشتری را بهبود بخشند.(چنگ و چن، ۲۰۰۹) داده کاوی، عبارت از اقتباس یا استخراج دانش از مجموعه دادهها است. به بیان دیگر، دادهکاوی فرایندی است که با استفاده از تکنیکهای هوشمند، دانش را از مجموعه ای از داده ها استخراج میکند. دانش استخراج شده در قالب مدل ها، الگو ها یا قواعد ارائه می شود. این الگوها، مدلها و قواعد اشکال مختلفی از برای ارائه دانش استخراج شده هستند. این دانش می تواند مالک تصمیم گیری های آتی، عملکردهای بعدی و یا تغییرات لازم در سیستم قرار گیرند.(تقوی فرد، ۱۳۹۱)
انگای(۲۰۰۹) با جمع بندی مقالات متعدد پیرامون مدل های داده کاوی در مدیریت ارتباط با مشتری، این مدل ها را به هفت گروه اصلی تقسیم بندی، مینمایند. این مدلها عبارتند از : وابستگی، طبقه بندی، خوشه بندی، پیشبینی، رگرسیون، کشف توالی و نمایه سازی. همچنین آنها بیان می کنند که برای پشتیبانی بهتر از تصمیم گیری ها در سیستم های مدیریت ارتباط با مشتری، اغلب لازم است تا سازمان ها، ترکیبی از این مدل ها و تکنیک ها را بکار گیرند.
یکی از روش های اکتشاف دانش که عموماً در داده کاوی به کار می رود روش طبقه بندی و استفاده از الگوریتم های درخت تصمیم می باشد درخت های تصمیم میتوانند قواعد قابل فهمی را تولید کنند و حتی در یک درخت بزرگ یا پیچیده هم، یک مسیر را به راحتی میتوان طی کرد و این باعث میشود که تفسیر دستهبندیها یا پیشبینیها نسبتاً آسان باشد. الگوریتم های مختلفی جهت ساخت درخت های تصمیم معرفی شده است، که از روش های معروف آن می توان به روش های AID، Search، CHAID، CART، OC، ID، QUEST و SAS algorithms اشاره کرد. وجود الفاظ زبانی در منطق فازی و قابل تفسیر بودن آنها توسط بشر یکی از مهمترین مزایای سیستم های فازی است.(میکوت، ۲۰۰۴) از آنجایی که قابل تفسیر بودن نتایج برای یک سیستم یادگیری یک مزیت به شمار می آید، بکارگیری منطق فازی در فرایند استنتاج و پردازش سیستمهای دادهکاوی از این نظر نقطه قوتی برای آن محسوب میشود. (زیمرمان، ۱۹۹۹)
درختهای تصمیم، تصمیمات نمادینی را به نمونهها منتسب میکنند. با این وجود، اگر چه روشهای گوناگونی برای ساخت درخت های تصمیم ارائه شده اند، و اگر چه بکارگیری این روش ها در قلمروهای نمادین با موفقیت های بسیار خوبی همراه بوده است، ولیکن درخت های تصمیم نمادین، برخی مواقع از بازدهی مناسبی برخوردار نخواهند بود به عنوان مثال هنگامی که یک تصمیم عددی مورد نیاز می باشد، یا هنگامی که تصمیم گیری عددی می تواند پردازش های بعدی را بهبود بخشد (جانیکو، ۱۹۹۸)؛ و یا وجود آشفتگیهایی در مجموعه آموزشی از قبیل اغتشاش یا فقدان ارزش خصیصهها در توصیف نمونه ها (اولارو، ۲۰۰۳)؛ و یا هنگامی که نیاز به کلاس بندی فازی باشد. (چیانگ، ۲۰۰۲)
دسته بندی فازی نوعی دسته بندی است که در آن به جای استفاده از مقادیر عددی (واقعی) از مقادیر فازی استفاده میشود. (چن، ۲۰۰۲) منطق فازی با به کاربردن مجموعههایی که قابلیت همپوشانی دارند، کارایی سیستم دسته بندی و سیستم های تصمیم یار را بهبود بخشیده است. (گهرک، ۱۹۹۸) همچنین با فراهم کردن دقت بیشتر دسته بندی و فرآیند تصمیم گیری توانسته است تفسیر پذیری نتایج را بهبود بخشد.(وبر،۱۹۹۲)
یکی از روش های دسته بندی فازی، به کارگیری روش ایجاد درخت تصمیم فازی است. یک درخت تصمیم فازی دارای ساختاری مشابه با درخت تصمیم عادی است با این تفاوت که داده هایی که با آن سروکار دارد، فازی هستند. البته مجموعه قواعد دسته بندی فازی می تواند توسط فرد خبره تعریف شود و یا با به کارگیری روش های مختلف یادگیری ماشین از یک مجموعه از اشیاء استخراج گردد.
خوشه بندی
خوشه بندی عملی است که موجب تقسیم بندی جمعیتی ناهمگن به تعدادی خوشه همگن می شود. (نگایی، ایکسو و چااو، ۲۰۰۹) هنگامی که یک فرایند خوشه بندی آغاز میشود تعداد، شکل و ویژگیهای خوشه ها مشخص نیست و از آنجا که هیچ دانش قبلی از خوشه ها وجود ندارد، فن خوشه بندی یک تکنیک بدون ناظر نامیده می شود. از این فن معمولاً برای ساختن بخش ها و خوشه هایی استفاده می شود که برای تحلیل های بعدی مورد استفاده قرار می گیرند، نظیر بخش بندی مشتریان به بخش های متجانس که هر بخش دارای ویژگی های منحصر به خود است و بر اساس این ویژگی ها برنامه های بازاریابی و یا وفاداری برای هر بخش تبیین می شود.
دسته بندی
دسته بندی از مدل های پیش بینی در داده کاوی است و به زبان ساده به معنای اختصاص یک شیء داده به یکی از چند دسته یا کلاس از پیش تعریف شده است.(تاین، استاینباچ و کومار، ۲۰۰۵) دسته بندی فرایندی است برای یافتن مدل یا تابعی که دسته های مجزایی را با هدف پیش بینی دسته شیئی که برچسب دسته یا کلاس آن مشخص نیست، تعریف کند(هان و کامبر، ۲۰۰۶). دسته بندی از روش های با ناظر در داده کاوی است. این بدان معناست که هدف از انجام دسته بندی کاملاً مشخص است و متغیر یا متغیرهایی وجود دارند که ارزش آنها از روی ارزش سایر ویژگی ها و داده ها قابل پیش بینی است. تن و همکارانش مدل های پیش بینی را به دو گروه اصلی دسته بندی و رگرسیون تقسیم بندی می کنند: دسته بندی برای پیش بینی متغیرهای هدف گسسته به کار می رود، درحالی که کاربرد رگرسیون برای پیش بینی متغیرهای هدف پیوسته است.( تاین، استاینباچ و کومار، ۲۰۰۵) هدف اصلی هر دو روش، کاهش خطا بین مقدار پیش بینی شده و مقدار واقعی متغیر هدف است.
درخت تصمیم
درخت های تصمیم از مدل های دسته بندی هستند. هر درخت تصمیم از تعدادی گره و یال تشکیل شده است.(تان، ۲۰۰۵) درخت های تصمیم بر اساس داده های گذشته ساخته می شوند و هرگاه داده جدیدی با تمام ویژگی هایش (تمام ویژگی ها به جز دسته مربوطه اش) وارد شود، گره های داخلی بر روی ویژگی های ورودی آزمون انجام داده و نتیجه آزمون بر روی یال ها می رود و گره های برگ نیز دسته پیش بینی شده برای داده جدید را ارائه خواهند کرد( هان و کامبر، ۲۰۰۶) در ساخته شدن درخت و تشکیل هر گره الگوریتم درخت تصمیم به دنبال انتخاب بهترین ویژگی برای شکستن درخت به دو یا چند زیر درخت است.
ارزش دوره مشتری
ارزش دوره عمر مشتری با عناوینی نظیر ارزش مشتری، ارزش دوره عمر، حقوق مشتری و سودآوری مشتری در مطالعات متعدد مورد بررسی قرار گرفته است(هوانگ و همکاران، ۲۰۰۴). به طور کلی، می توان گفت ارزش دوره عمر مشتری، ارزشی است که مشتری در طول دوره عمرش برای سازمان ایجاد می کند. این مفهوم، علاوه بر ارزش فعلی مشتریان، به ارزش بالقوه و آتی آنها برای شرکت نیز اشاره دارد و هدف اصلی از محاسبه آن، ایجاد یک برداشت وزنی از مشتریان به منظور تخصیص بهینه منابع به آنها می باشد(رزمی و قنبری، ۱۳۸۸). وجود تعاریف مختلف از ارزش دوره عمر مشتری، بیانگر دیدگاه ها و روش های متفاوتی است که نسبت به این موضوع وجود دارد. متداول ترین روش های مطرح شده جهت تعیین ارزش دوره عمر مشتری عبارتند از: روش ارزش فعلی خالص، روش سهم کیف پول، روش زنجیره مارکوف، روش ارزش گذشته مشتری، روش بازگشت سرمایه و روش آر.اف.ام.(مدل آ.راف.ام.). در میان روش های ذکر شده، مدل آر.اف.ام. یکی از روشهای متداول و پرکاربردی است (۲۰۰۴،Buttle) که در تعیین ارزش مشتری، سه معیار (شاخص) را در نظر می گیرد، لذا دیدگاهی چند بعدی در این راستا ارائه می نماید، در صورتی که بسیاری از روش های دیگر دیدگاهی تک بعدی داشته و معمولاً از یک معیار (شاخص) جهت تعیین ارزش دوره عمر مشتری استفاده می کنند. از طرفی، در مدل آر.اف.ام.، فقط نگرش های مالی مطرح نمی باشند و گرایش اصلی روش در تحلیل ویژگی های مشتریان به سمت مسائل غیرمالی است(رزمی و قنبری، ۱۳۸۸)، در صورتی که بسیاری از روش های دیگر، بیشتر از جنبه مالی بر این مسأله تمرکز دارند.
مدل آر اف ام(RFM)
مدل آر.اف.ام. اولین بار توسط هوگس(۱۹۹۴) معرفی گردید. وی برای تحلیل آر.اف.ام. از رفتار گذشته مشتری که به آسانی قابل پیگیری و دسترسی است،استفاده نمود. این مدل از سه بعد مربوط به داده های مبادلاتی مشتریان، برای تحلیل رفتار آنها استفاده مینماید.شاخصهای این مدل به صورت زیر تعریف میشوند: (چنگ و چن، ۲۰۰۹)
۱) تازگی مبادله: این شاخص اشاره دارد بر فاصله زمانی بین آخرین خرید صورت گرفته توسط مشتری تا پایان دوره خاص (پایان محدوده زمانی مورد بررسی). کمتر بودن این فاصله نشانگر بالا بودن ارزش این شاخص در مدل می باشد.
۲) تعداد تکرار مبادله: این شاخص بیانگر تعداد مبادلاتی است که یک مشتری در یک دوره زمانی خاص انجام داده است. بیشتر بودن تعداد مبادلات، نشانگر بالا بودن ارزش این شاخص در مدل می باشد.
۳) ارزش پولی مبادله : این شاخص نشان دهنده مقدار پولی است که یک مشتری در یک دوره زمانی خاص جهت مبادلات، صرف نموده است. بیشتر بودن مقدار پول صرف شده، بیانگر بالا بودن ارزش این شاخص در مدل میباشد.
در مدل آر.اف.ام.، ارزش دوره عمر هر مشتری از مجموع ارزش های حاصل از شاخص های آر.اف.ام. بدست می آید، لذا در این مدل، فرض بر این است که مشتریان دارای ارزش بالای هر یک از شاخص های مدل، بهترین مشتریان هستند، البته تا زمانی که در آینده همانند گذشته رفتار نمایند. (کینینگام ۲۰۰۶) نظرات مختلفی پیرامون اهمیت شاخص های مدل آر.اف.ام. وجود دارند.(بین، ۲۰۰۸) هوگس (۱۹۹۴) بیان میکند که این سه شاخص اهمیت یکسانی دارند، بنابراین وزن هر سه آنها مشخص و یکسان است. از سویی دیگر، استون (۱۹۹۵) بر این عقیده است که به واسطه ویژگی های متفاوت در هر صنعت، سه شاخص اهمیت متفاوتی خواهند داشت. وی در تحقیق خود، وزن های شاخص های آر.اف.ام. را به صورت قضاوت ذهنی تعیین نمود. بعدها، لیو و شیه(۲۰۰۵) از فرایند تحلیل سلسله مراتبی برای تصمیم گیری بهتر جهت تعیین وزن های نسبی شاخص های آر.اف.ام. در ارزیابی ارزش دوره عمر مشتری بهره گرفتند.