جزئیات  
عنوان چرخه حیات تجزیه و تحلیل داده (6)
نوع منبع مقاله
گروه تجزیه و تحلیل
تاریخ انتشار 1396/6/17
خلاصه به باور اغلب کارشناسان ، داده دارای پتانسیل لازم برای ایجاد مزیت رقابتی در سازمان ها می باشد ، مشروط به این که بتوان با تجزیه و تحلیل و استفاده مناسب از آن در فرآیندهای کسب و کار بالغ ، زمینه بالفعل شدن آن را فراهم کرد . داده هر سازمان می تواند منتج به ایجاد بینش و متعاقب آن تصمیمات و اقداماتی گردد که سایر سازمان ها قادر به انجام آن نمی باشند . داده بطور معمول مزایای مستقیم و یا کمتری را به خود اختصاص می دهد ، اما تجزیه و تحلیل مبتنی بر داده درست و به روز است که می تواند به ابزار رقابتی قدرتمندی برای سازمان ها تبدیل شود . در هنگامه ای که بسیاری از پایگاه های سنتی تمایز رقابتی تا حد زیادی از بین رفته است و یا حضورشان کم رنگ شده است ، استفاده حداکثری از داده های منحصربفرد و اختصاصی هر سازمان با هدف ایجاد بینش می تواند به یک منبع قدرتمند تمایز رقابتی تبدیل شود . این مهم حاصل نمی گردد مگر با تجزیه و تحلیل داده و تبعیت از یک چرخه حیات معتبر .

 توان تصمیم گیری یکی از خصایص برجسته انسان است و زمانی که این پتانسیل در فضای کسب و کار با داده صحیح و به روز ، یادگیری ماشین و سایر فناوری های هوش مصنوعی آمیخته و بالفعل گردد ، می توان شاهد نتایج و دستاوردهای ارزشمندی در محیط های کسب و کار بود . با ورود کامپیوتر به دنیای کسب و کار ، امکان ذخیره ، پردازش  و تحلیل داده ها با سرعت و دقت بیش تری فراهم گردید . با بررسی تجارب حاصل از چندین دهه بکارگیری کامپیوتر در محیط های کسب و کار ، شاهد طلوع و غروب بسیاری از اصطلاحات در دنیای کسب و کار بوده ایم که هر یک به دنبال ابداع روش هایی برای چگونگی استخراج ارزش مدیریتی و تصمیم گیری از داده های کامپیوتری بوده اند . در دهه 1970، سیستم های DSS ( برگرفته شده از Decision Support Systems ) که دقیقا منعکس کننده اهمیت یک رویکرد تصمیم محور در تحلیل داده ها بود ، یک اصطلاح مطلوب بود . در اوایل دهه 80 میلادی ، سیستم های EIS ( برگرفته شده از Executive Information Systems) که  استفاده از سیستم های تجزیه و تحلیل داده را برای مدیران ارشد هدف گذاری کرده بود ،  در کانون توجه قرار گرفت . در ادامه و در همان دهه ، نگاه ها به سمت سیستم های OLAP ( برگرفته شده از OnLine Analytical Processing) متمرکز گردید . سیستم هایی که با رویکردی فنی و پیچیده به دنبال ارایه تحلیل های آنلاین از داده ها بودند . در دهه 90 میلادی ، شاهد افزایش هوش تجاری (BI) به عنوان یک توصیفگر بودیم.
علی رغم عدم ارایه یک تعریف واضح و شفاف به همراه محدوده عملیاتی ، هر یک از اصطلاحات فوق دارای فضائل  و ابهامات مختص به خود می باشند . در اواسط دهه اول قرن بیستم شاهد ورود یک اصطلاح جدید به دنیای کسب و کار و این مرتبه با نام analytics بودیم (حداقل برای بسیاری از شکل های آماری و ریاضی تحلیل داده ها ) .هیچ واژه ای پس از معرفی به دنیای کسب و کار ، معنای ثابت خود را حفظ نخواهد کرد و در طول زمان معانی جدیدی را به وجود می آورد . اگر واژه فوق یک اصطلاح متداول باشد ، اکثر تولید کنندگان این ادعا را خواهند داشت که محصولات و یا سرویس های آنها حداقل بخشی از آن واژه است . این وضعیت در خصوص واژه analytics به خوبی صدق می کند و از آن در موارد مختلفی نظیر  Predictive analytics ، Data mining ، Business analytics ، Web analytics و Big-data analytic  استفاده می گردد .
اگر بپذیریم که به واژه analytics ضمن حفظ معنی واقعی خود در طول زمان بارمعنایی جدیدی نیز اضافه شده  باشد ، احتمالا نیاز به تعاریف بیش تری از تجزیه و تحلیل  با توجه به زمینه بکارگیری ، ماهیت و محدوده عملکرد داریم . مثلا ، می توان برای شکل های مختلف گزارش گیری نظیر گزارشات استاندارد ، ad-hoc ، پرس و جوها ، کارت های امتیاردهی متوازن (BSC ) از واژه تجزیه و تحلیل Descriptive استفاده کرد . این نوع تجزیه و تحلیل ، بیانگر رویدادهایی می باشند که در گذشته اتفاق افتاده اند و می توان از آن جهت طبقه بندی مشتریان و سایر موجودیت های کسب و کار درون گروه هایی که دارای بعدهای مشابه هستند نیز استفاده کرد .
در شکل 1 ، سه نوع متداول تجزیه و تحلیل نشان داده شده است .

سه نوع متداول تجزیه و تحلیل
  شکل 1 : سه نوع متداول تجزیه و تحلیل
 
آگاهی و درک این که چه چیزی در گذشته برای یک سازمان اتفاق افتاده است در جایگاه خود مفید و ارزشمند است ، ولی با تمرکز بر نتایج گذشته و عدم یافتن پاسخ مناسب برای چرایی نتایج به دست آمده ، یک سازمان حتی در تحلیل وضعیت موجود خود دچار مشکل خواهد شد چه برسد بخواهد یک نگاه واقع بینانه به آینده بنگاه کسب و کار خود داشته باشد. اعداد و نتایج حاصل از تجزیه و تحلیل توصیفی چیزی در مورد آینده و این که چرا این نتایج به دست آمده است ، نخواهد گفت و برای پاسخ به اینگونه پرسش ها به نوع جدیدی از تجزیه و تحلیل که به آن تجزیه و تحلیل  Predictive   گفته می شود،  نیاز است . در روش فوق ، از مدل های گذشته برای پیش بینی آینده استفاده می شود . در این نوع تجزیه و تحلیل با استفاده از متغیرهای چندگانه ، سعی می گردد که یک متغیر وابسته خاص پیش بینی گردد . مثلا با استفاده از شاخص های میزان بارندگی و درجه حرارت در یک فصل بخصوص سعی می گردد ، قیمت محصول و یا محصولات کشاورزی خاصی پیش بینی گردد . از مدل های تجزیه و تحلیل پیشگویانه برای پیش بینی رفتار مشتریان بر اساس سوابق خرید و برخی متغیرهای جمعیت شناسی نیز استفاده می گردد . لازم است به این نکته مهم توجه گردد که تجزیه و تحلیل پیشگویانه اساس خود را بر روی مدل سازی آماری می گذارد و از لحاظ فنی این نوع تجزیه و تحلیل همچنان درگیر تشریح اتفاقات در مقابل پیش بینی است ( چه اتفاقی در یک سازمان رخ می دهد ؟ ) . شما نمی توانید مدلی را برای آینده ایجاد کنید مگر این که با مدلی شروع کنید که به خوبی با داده گذشته ایجاد شده باشد . با وجود یک مدل ، می توان برآوردهای مختلفی از تاثیرگذاری متغیرهای مستقل بر روی پیش بینی متغیر وابسته به آن را انجام داد .
تجزیه و تحلیل Prescriptive ، کمتر شناخته شده است و به این دلیل به آن تجزیه و تحلیل تجویزی می گویند که به شما می گوید چه کاری می بایست انجام داد تا به نتایج مورد نظر دست یافت . تست تصادفی که در آن یک گروه آزمایشی با یک گروه کنترل و از طریق انتساب تصادفی موضوعات به هر گروه مقایسه می گردد، یک روش قدرتمند برای ایجاد علت است. اگر پس از مقایسه دو گروه این موضوع به دلایل آماری مشخص گردید که یک گروه بهتر است ، می بایست مواردی را که در گروه تست مشخص شده اند ، انجام داد .  بهینه سازی یکی دیگر از اشکال تجزیه و تحلیل تجویزی است . در روش فوق و به کمک یک مدل آماری سطح بهینه متغیرهای کلیدی با لحاظ کردن بیش ترین مقدار یک متغیر خروجی بخصوص مشخص می گردد . در صورتی که یک بنگاه اقتصادی بخواهد سودآوری خود را به حداکثر مقدار خود برساند ، به عنوان نمونه ، بهینه سازی قیمت به شما خواهد گفت که قیمت یا شارژ بهینه برای محصولات و سرویس ها چه میزان می بایست تعیین گردد .
هر یک از سه نوع تجزیه و تحلیل اشاره شده ، ارزشمند می باشند ولی در اکثر سازمان ها تجزیه و تحلیل توصیفی متداول تر است . ابزارهای گزارش گیری در ابعاد گسترده ای موجود و استفاده از آنها نیز آسان می باشد . مدیران و نهادهای نظارتی و حاکمیتی خارجی اغلب این نوع گزارشات را درخواست می نمایند بنابراین بدیهی است که استفاده از این نوع تجزیه و تحلیل متداول تر باشد .
صرفنظر از این که از چه مدل تجزیه و تحلیل داده استفاده می شود ، استفاده از یک چرخه حیات معتبر برای تجزیه و تحلیل داده الزامی است . هدف مجموعه مقالات  " چرخه حیات تجزیه و تحلیل داده  " ، آشنایی با یکی از چرخه های حیات معتبر به منظور تجزیه و تحلیل داده با تمرکز بر روی کلان داده ها و یا داده های عظیم است . در بخش اول  ضمن آشنایی با کلیات این چرخه به این موضوع اشاره گردید که چرخه حیات فوق از شش مرحله مهم و استراتژیک تشکیل شده است که در ذیل هر مرحله مجموعه ای از فعالیت ها تعریف می شود . در بخش دوم با تمرکز بر روی اولین مرحله چرخه حیات که از آن با نام اکتشاف داده یاد می شود ، با مجموعه فعالیت های آن آشنا شدیم . در بخش سوم با تمرکز بر روی دومین مرحله چرخه حیات تجزیه و تحلیل داده که از آن با نام آماده سازی داده نام برده می شود با مجموعه فعالیت های آن آشنا شدیم. در بخش چهارم  به سراغ مرحله سوم چرخه حیات تجزیه و تحلیل داده رفتیم و با مجموعه فعالیت های لازم جهت برنامه ریزی مدل آشنا شدیم . در بخش پنجم با تمرکز بر روی چرخه حیات تجزیه و تحلیل داده با چهارمین مرحله آن که ایجاد مدل است ، آشنا شدیم  .  در این بخش به سراغ مرحله پنجم چرخه حیات تجزیه و تحلیل داده خواهیم رفت و با ضرورت و شیوه های برقراری ارتباط نتایج با ذینفعان آشنا خواهیم شد .


مراحل مختلف چرخه حیات تجزیه و تحلیل داده
شکل 2 : مراحل مختلف چرخه حیات تجزیه و تحلیل داده

مرحله پنجم : برقراری ارتباط با ذینفعان و انتقال نتایج 
پس از اجرای مدل ، تیم داده می بایست دستاوردهای مدل سازی را با معیارهای مشخص شده برای موفقیت یا ناکامی مقایسه کند . تیم داده می بایست یافته ها و دستاوردها را برای اعضاء مختلف تیم و ذینفعان تشریح نماید . با توجه به این که ارایه دستاوردها و نتایج اغلب درون سازمان منتشر می شود ، می بایست نتایج با دقت و بطور مناسب برای مخاطبان مختلف تشریح گردد تا هر یک در روند اجرای مدل و دستاوردهای حاصل از آن قرار گیرند.
در این مرحله تیم داده می بایست مشخص کند که آیا در نیل به اهداف خود موفق بوده است و یا نتوانسته است به اهداف تعریف شده دست یابد . در موارد متعددی افراد نمی خواهند بپذیرند که در رسیدن به اهداف موفق نبوده اند و به نوعی به شکست اعتراف نمایند . در خصوص تجزیه و تحلیل داده ،  شکست  معنی ندارد و نمی بایست با آن  به عنوان یک شکست واقعی برخورد گردد . در واقع ، شکست به منزله ناکافی بودن داده برای پذیرش و یا رد یک فرضیه تلقی می گردد . تیم داده می بایست با دقت و استناد به داده های کافی  مشخص نماید که آیا فرضیه های لیست شده در مرحله 1 ( فاز اکتشاف ) تایید و یا رد می شوند . در برخی موارد ، ممکن است  تیم داده صرفا یک تحلیل سطحی را انجام داده باشد که  برای رد و یا پذیرش یک فرضیه به اندازه کافی قابل استناد و قوی نباشد .  در موارد دیگر ، ممکن است تیم داده تحلیل های قوی را انجام داده باشد و به دنبال روشی برای ارایه نتایج است ولی در عمل ، نتایج  و دستاوردها ارتباط چندانی با اهداف تعیین شده ندارند . مهم است که بتوان با ایجاد یک تعادل  بین آن چه که حاصل شده است و آن چه که به دنبالش بوده ایم یک توازن منطقی برقرار کرد .
در زمان انجام ارزیابی فوق ، می بایست مشخص گردد که آیا نتایج از لحاظ آماری معنی دار و معتبر می باشند . اگر نتایج معتبر هستند ، جنبه های پنهان نتایج که در زمان برقراری ارتباط می تواند موثر واقع شوند می بایست به درستی و به دقت شناسایی گردند . در صورتی که نتایج معتبر نباشند ، می بایست بر روی مواردی متمرکز گردید که می توان با تغییر و تصحیح آنها به سمت متعبرسازی مدل حرکت کرد . در این مرحله و با ارزیابی نتایج می بایست وضعیت داده ها و این که کدامیک شگفتی ساز و یا در مسیر اثبات و یا رد فرضیه های ایجاد شده در مرحله 1 می باشند ، شناسایی گردند ( جایگاه داده ها در رد و یا پذیرش فرضیه ها ) . مقایسه نتایج واقعی با ایده هایی که در ابتدا تهیه شده اند می تواند به تولید ایده ها و بینش هایی جدیدی منجر شود که در آغاز به آنها فکر نشده است ( اگر تیم داده زمان لازم برای تدوین فرضیه های اولیه در آغاز فرآیند را نداشته باشد) .
در این مقطع زمانی ، تیم داده می بایست مشخص کرده باشد که کدام مدل و یا مدل ها پاسخگوی چالش های تحلیلی می باشند . بهترین روش ، ثبت تمامی یافته ها و انتخاب سه مورد مهم تر از آنها  است که می توان با ذینفعان به اشتراک گذاشت . علاوه بر این ، تیم داده می بایست پیامدهای این یافته ها و اندازه گیری ارزشی را که برای کسب و کار به دنبال دارند ، در دستور کار خود  قرار دهد . با توجه به نتایج مدل ، تیم داده ممکن است نیاز به صرف زمان بیش تری برای اندازه گیری تاثیرپذیری کسب و کار از نتایج را داشته باشد تا بتواند با دست پر نتایج و تاثیر آنها بر کسب و کار را برای ذینفعان ارایه نماید . 
در انتهای این مرحله  ( چرخه  اکتشاف  تا اجرای مدل  ) ،  تیم داده مدل را اجراء کرده است  و به درس آموخته های  ارزشمندی در خصوص دیتاست ها  ، موانع پیش روی پروژه ، نقاط بهبود برای تکمیل و یا بهینه سازی آتی پروژه دست یافته است . همچنین لازم است ، توصیه ها و پیشنهادات لازم برای فعالیت آتی و یا بهبود فرآیندهای جاری صورت پذیرد و مسئولیت هر یک از اعضاء تیم و یا ذینفعان جهت انجام وظایف به درستی مشخص گردد . به عنوان نمونه ، اگر تیم داده مدلی جهت پیش بینی نرخ ریزش مشتریان ایجاد کرده باشد ، تیم بازاریابی می بایست با نحوه استفاده از مدل آشنا شوند و مهندسین تولید کاری را که انجام شده است ، عملیاتی نمایند .علاوه بر این ، لازم است در این مرحله بر روی مزایای مدل و تاثیر آن بر کسب و کار  تاکید مضاعف گردد تا بتوان در عمل و کوتاهترین زمان ممکن از دستاوردهای مدل در محیط عملیاتی به طور مستقیم استفاده نمود .
در این مرحله لازم است یافته های کلیدی و بینش های عمده  ماحصل تجزیه و تحلیل مستند گردند . آن چیزی که در این مرحله عرضه خواهد شد بسیار ملموس و تاثیرگذار است ، بنابراین لازم است با دقت نتایج مدل ، متدلوژی و ارزش کسب و کار یافته ها را با ذینفعان کلیدی به اشتراک گذاشت و بستر مناسب برای ثبت و پاسخگویی به بازخورد آنها را نیز فراهم کرد  .
 
خلاصه
در این بخش با تمرکز بر روی مرحله پنجم  چرخه حیات تجزیه و تحلیل که هدف اصلی آن برقراری ارتباط با ذینفعان و انتقال یافته ها و نتایج حاصل از اجرای مدل است ، آشنا شدیم . مرحله پنجم یکی از مراحل مهم در چرخه حیات تجزیه و تحلیل داده است چراکه  نتایج مدل ، متدلوژی و ارزش کسب و کار یافته ها با ذینفعان کلیدی به اشتراک گذاشته می شود .  تا در صورت پذیرش ، زمینه لازم جهت عملیاتی کردن مدل فراهم گردد . در بخش بعدی  به سراغ مرحله نهایی  چرخه حیات تجزیه و تحلیل داده خواهیم رفت و با نحوه عملیاتی سازی آن آشنا خواهیم شد .


منابع  :
EMC Education Services. Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data. Wiley, 2015
Bart Baesens,Analytics in a Big Data World: The Essential Guide to Data Science and its Applications. Wiley, 2014
Rachel Alt-Simmons,Agile by Design: An Implementation Guide to Analytic Lifecycle Management,Wiley, 2014
Thomas H. Davenport ,Enterprise Analytics: Optimize Performance, Process, and Decisions Through Big Data (FT Press Operations Management),Pearson FT Press; 1 edition ,2012