عنوان مدیریت داده های Master (بخش سوم)
نوع منبع مقاله
گروه داده Master و Reference
تاریخ انتشار ۲۵ / ۱۲ / ۱۳۹۶
خلاصه یکی از ویژگی های مهم عصر حاضر، تولید سریع حجم بسیار بالایی از داده های مختلف در دنیای فیزیکی و دنیای دیجیتال است که از آن به نام سیلاب داده نام برده می شود . تاثیر این سیلاب بر کسب و کارها بسیار محسوس و ملموس می باشد . تعدادی برنده بازی خواهند بود و تعدادی دیگر بازنده . تنها با مدیریت جامع ، فراگیر و هدفمند این سیلاب داده است که می توان از آن در جهت ایجاد ارزش برای کسب و کار استفاده کرد و به اکسیر ماندگاری دست یافت. شناسایی و مدیریت داده های حیاتی برای هر کسب و کاری الزامی است، چراکه این نوع داده ها بین واحدهای مختلف کسب و کار ، فرآیندها و سیستم ها به اشتراک گذاشته می شود . با مدیریت داده های master ، می توان در جهت ایجاد و تقویت یک هسته هوشمند داده و شناخت دقیق و به روز موجودیت های اساسی کسب و کار بگونه ای حرکت کرد که داده را به یک دارایی و همچنین یک مزیت رقابتی برای کسب و کار خود تبدل کرد .

داده دارای یک نقش تعیین کننده و حیاتی در جهان امروز است و توانسته است به طور مستقیم و یا غیرمستقیم بر روی اکثر کسب  و کارها تاثیر بگذارد . شکل گیری کسب و کارهای نوظهور داده محور ، ضرورت تحول در کسب  و کارهای موجود و حرکت به سمت ایجاد  سازمان های داده محور از جمله آثار مثبت داده بر فضای کسب و کارها در هزاره سوم است . بدیهی است سازمان هایی که نتوانند اکوسیستم لازم  جهت مدیریت داده را به درستی ایجاد  نمایند ، عملا  کسب و  کار خود را با چشمانی بسته در فضای به شدت رقابتی امروز ، مدیریت می نمایند . مدیریتی که  در نهایت باعث از بین رفتن کسب و کار ها خواهد شد . هر گونه تحول در کسب و کارها  مستلزم توجه خاص به داده و مدیریت آن است چراکه داده در کانون هر گونه تصمیم گیری قرار دارد  و مهمترین ماموریت آن ، تامین خوراک با کیفیت بالا به منظور تصمیم گیری است تا بتوان با استناد به آن در زمان لازم اقدامات مناسب  را انجام داد و در فصل برداشت فرصت ها ، حداکثر محصول را برداشت کرد .
در شکل 1 ، تاثیر داده در چرخه تصمیم گیری موسوم به OODA ( برگرفته شده از Observe, Orient ,Decide , Act  )  نشان داده شده است . داده جدید بر اثر وقوع رویدادهای مختلف ایجاد می گردد ( منابع تولید داده و منابع داده سازی )  و تنها با حاکمیت و مدیریت مناسب داده است که می توان آن را به عنوان ماده خام اولیه و با کیفیت به چرخه OODA وارد کرد تا پس از عبور از هر مرحله و انجام فرآیندهای تعریف شده ، به عنوان یک منبع ارزشمند هوشمند در چرخه OODA  ایفای وظیفه نماید و فونداسیون لازم برای تصمیم گیری داده محور و هوشمندی در یک سازمان را فراهم نماید .

     چرخه تصمیم گیری OODA
شکل 1 : چرخه تصمیم گیری OODA

در بخش اول  ، نگاهی داشتیم  به  گذشته  و این که ما در سازمان های خود چگونه با داده های master  برخورد کرده ایم و در عمل با چه شیوه ای به نیاز اشتراک داده بین واحدهای مختلف ، فرآیندها و سیستم ها پاسخ داده ایم . در بخش دوم به مدیریت داده های master از منظر چارچوب DMBOK اشاره کردیم و این که سازمان ها به چه دلایلی تمایل دارند این چنین برنامه هایی را اجراء نمایند و به چه نتایج و دستاوردهایی دست خواهند یافت . همچنین به این موضوع مهم اشاره گردید که از محصول نهایی مدیریت داده های master  می توان در سه حالت متفاوت عملیاتی ، تعاملی و تحلیلی  استفاده بعمل آورد . در این بخش  به سراغ نوع های مختلف داده در یک سازمان خواهیم رفت و به جایگاه داده های master  و تفاوت آن با سایر داده ها و همچنین ، معماری های مختلف پیاده سازی و استقرار یک برنامه مدیریت داده های master  اشاره خواهیم کرد . 

انواع  داده
تقسیم بندی داده ، به گروه بندی داده بر اساس خصایص و یا ویژگی ها متداول اطلاق می گردد . این کار باعث می شود تا ضمن شناخت مناسب نسبت به ماهیت هر گروه داده و نقش آفرینی هر یک در کسب و کار ، بتوان آنها را به درستی شناسایی و مدیریت کرد . شناخت روابط بین گروه های داده و وابستگی بین آنها می تواند در انجام سایر تلاش های مدیریت داده نظیر مدیریت کیفیت داده مفید واقع شود . به عنوان مثال ، در صورتی که پروژه ای را با هدف بهبود کیفیت داده های master  تعریف کرده باشیم و متوجه این موضوع شویم که یکی از دلایل اصلی مسایل کیفیت داده به داده های مرجعی مربوط می شود که از آنها در داده های master  استفاده  شده است ، آگاهانه و بدون اتلاف منابع محدود پروژه قادر خواهیم بود به طور مناسب و منطقی با مسایل موجود برخورد نمائیم .
با توجه به موارد فوق، می توان داده ها را در چهار گروه مختلف تقسیم بندی کرد :
  • داده master  : توصیف افراد ، مکان ها و چیزهایی که به نوعی در یک کسب و کار دارای نقش اساسی  می باشند . مثلا  افراد ( مشتریان ، کارکنان ، شرکای تجاری ، تامین کنندگان و ... ) ، مکان ها ( نظیر ادارات ، انبارها ، مراکز فروش و ... ) و چیزها ( نظیر اکانت ها ، محصولات ، دارایی ها و ... ) . با توجه به این که  از این نوع داده ها در  چندین فرآیند  کسب و کار و سیستم های فناوری اطلاعات متعددی استفاده می گردد ، استانداردسازی قالب داده های master  و همسان سازی مقادیر برای یکپارچه سازی سیستم ها بسیار حیاتی است.
  • داده مرجع : مجموعه ای از مقادیر و یا الگوهای طبقه بندی می باشند که از آنها توسط سیستم ها ، برنامه ها ، بانک های اطلاعاتی ، فرآیندها و گزارشات استفاده می شود . از داده های مرجع در تراکنش ها و همچنین رکوردهای داده های master  نیز استفاده می گردد . لیست مقادیر مجاز ، لیست کدها ، کدهای وضعیت ، اسامی مخفف شهرها و  استان ها ، فیلدهای جمعیت شناسی ، نوع محصولات ، جنسیت ، سرفصل حساب ها ، سلسله مراتب محصول ، نمونه هایی از داده های مرجع می باشند . استاندارد سازی داده های مرجع برای یکپارچه سازی و تعامل سیستم ها با یکدیگر و به اشتراگ گذاری اطلاعات و گرازشگری بسیار حیاتی است.
  • داده تراکنشی : این نوع داده ها توصیف گر یک رویداد و یا تراکنش داخلی و یا خارجی می باشند که به موازات انجام فعالیت های کسب و کار در سازمان ایجاد می گردند . سفارش فروش ، صدور فاکتور فروش ، سفارشات خرید ، پرداخت های کارت اعتباری ، حمل محصول ، نمونه هایی از رویدادهایی می باشند که در نهایت به تولید داده تراکنشی و یا رکوردهای تراکنشی منجر خواهد شد . در رکوردهای تراکنشی از داده های master  و مرجع نیز استفاده می گردد .
  • متادیتا : بطور خلاصه و خیلی کلی متادیتا ، داده هایی می باشند که توصیف گر اطلاعاتی در خصوص داده می باشند . با توصیف داده به کمک داده ، امکان بازیابی آسان تر داده ، تفسیر و استفاده بهتر اطلاعات فراهم می گردد . متادیتا دارای انواع مختلفی است . متادیتای فنی و متادیتای کسب و کار دو نمونه متداول در این زمینه می باشند . از متادیتای فنی برای تشریح فناوری و ساختارهای داده استفاده می گردد . اسامی فیلدها ، طول ، نوع ، اصل و نسب داده ، لی اوت جداول بانک اطلاعاتی نمونه هایی از متادیتای فنی می باشند . از متادیتای کسب و کار به منظور توصیف جنبه های غیرفنی داده استفاده می گردد . تعریف فیلدها ، اسامی گزارشات و عناوین در گزارشات نمونه هایی در این زمینه می باشند .
در شکل 2 ، انواع گروه های داده به همراه روابط بین آنها  نشان داده شده است (  آشنایی بیش تر با انواع داده  ) .

    انواع گروه های داده
شکل 2 : انواع گروه های داده
معماری مدیریت داده های  master
برای طراحی  ، پیاده سازی و در نهایت استقرار و عملیاتی کردن یک برنامه مدیریت داده های master  از سه نوع معماری متداول استفاده می گردد:
  •  Repository  :
    • ذخیره تمامی داده master در یک بانک اطلاعاتی ( شامل تمامی attributes مورد نیاز برای تمامی برنامه هایی که از داده master استفاده می کنند .
    • اصلاح برنامه هایی که از داده master استفاده می کنند ، آنها را ایجاد می کنند و یا نگهداری می نمایند تا از داده master در هاب استفاده نمایند ( در مقابل استفاده از بانک های اطلاعاتی خود )
    • هاب داده master به عنوان SOE ( برگرفته شده از system of entry)  و یا SOR (برگرفته شده ازsystem of record  )
    • اگر یک برنامه CRM داریم می بایست جهت استفاده از جدول مشتریان در مقابل جدول مشتریان خود ، اصلاح شود ( یا دستیابی مستقیم به هاب یا توسط داده های ذخیره شده در هاب که بر اساس سیاست هایی به سیستم منبع ارسال شده است
    •  عدم بروز مشکل نگهداری چندین نسخه از رکورد مشابه مشتری در چندین برنامه همسان شده ، عدم درج رکوردهای تکراری
    • اصلاح تمامی برنامه های موجود جهت استفاده از داده master جدید ( خصوصا در مواردی که برنامه های موجود امکان import داده را ندارند ) ، حجم و پیچیدگی بالای مدل داده ، زمان و هزینه بالا برای پیاده سازی ، انتقال و بارگذاری تمامی بانک های اطلاعاتی موجود درون هاب و حدف موارد تکراری در فرآیندها ، نحوه برخورد با سوابق داده ( به دلیل تغییر کلیدهای جدید ) 
  •  Registry :
    •  هر سیستم منبع ، کنترل داده خود را دارد و همچنان SOE می باشد.
    •  رکوردهای داده master در هاب mdm ذخیره نمی گردد
    •  تمامی رکوردهای داده سیستم های منبع در ریجستری داده master نگاشت می شوند ( SOR ، یا سیستم مجازی داده master )
    • نگاشت داده ها ، ارتباط بین کلیدها در سیستم های منبع را نشان می دهد ( یک سطر در یک جدول برای هر موجودیت داده master و ستون هایی برای کلیدها در سیستم های کاربردی )
    • مثال : اگر دارای رکوردهایی برای یک مشتری خاص در CRM ، بانک اطلاعاتی خدمات مشتریان و سیستم ثبت سفارش باشیم ، هاب MDM شامل یک نگاشت از کلیدهای این سه رکورد به یک کلید مشترک است .
    • عدم ضرورت تغییر در سیستم های منبع ، زمان و هزینه کم پیاده سازی
    • هر query در مقابل داده mdm یک نوع query توزیع شده بین تمامی موجودیت ها برای داده مورد نظر است،اضافه کردن یک برنامه به هاب mdm به معنی اضافه کردن ستون هایی به جدول key-matching است که یک مساله بزرگ است،در یافتن رکوردهای تکراری کمک می کند ولی در تمیزکردن آنها کمکی نخواهد کرد(اگر شخصی دارای چندین رکورد با شماره تلفن های مختلفی باشد،روشی برای تعیین اینکه از کدام استفاده شود،وجود ندارد )
  • Hybrid :
    • شامل ویژگی های مدل های Repository و Registry است.
    •  رکوردهای داده master را در بانک های اطلاعاتی برنامه نگهداری می نماید و کلیدها را در هاب mdm ( نظیر مدل Registry )
    • مهمترین attributes هر یک از موجودیت های master را در هاب mdm تکرار می نماید .
    • تعدادی زیادی از درخواست های mdm می تواند مستقیما و توسط بانک اطلاعاتی هاب پاسخ داده شود و صرفا درخواست هایی که نیاز به ویژگی های غیرمتداولی دارند ، به بانک های اطلاعاتی ارجاع می گردند .
    • نگهداری یک نسخه معتبر از داده های master و عدم نیاز به تغییر و یا اصلاح برنامه های منبع
    • پیچیدگی فرآیند همسان سازی ، تناقض در بهنگام سازی ، تاخیردر تکرار رکوردها
در شکل 3 ، انواع معماری مدیریت داده های master  نشان داده شده است .

     انواع  معماری داده های master
شکل 3: انواع  معماری داده های master 

خلاصه
یکی از ویژگی های مهم  عصر حاضر، تولید سریع حجم  بسیار بالایی از داده های مختلف در دنیای فیزیکی و دنیای دیجیتال است که از آن به نام سیلاب داده نام برده می شود . تاثیر این سیلاب بر کسب و کارها بسیار محسوس و ملموس می باشد . تعدادی برنده بازی خواهند بود و تعدادی دیگر بازنده . تنها با مدیریت جامع ، فراگیر و هدفمند این سیلاب داده است که می توان از آن در جهت ایجاد ارزش برای کسب و کار استفاده کرد و به اکسیر ماندگاری دست یافت . فراموش نکنیم که  امروزه تولید داده توسط یک بنگاه کسب  و کار وجه تمایز آن با سایر کسب و کارها نمی باشد بلکه کاری که با داده ها انجام می دهد می تواند آن را از سایر کسب و کارها متمایز نماید . قطعا تعریف و عملیاتی کردن یک برنامه جامع مدیریت داده با هدف تبدیل داده به یکی از دارایی های مهم و ارزشمند ، یکی از اقدامات اساسی برای حرکت به سمت یک کسب و کار داده محور است . شناسایی و مدیریت داده های حیاتی برای هر کسب و کاری الزامی است و می بایست در اولویت بالا قرار بگیرد . چراکه این نوع داده ها بین واحدهای مختلف کسب و کار ، فرآیندها و سیستم ها به اشتراک گذاشته می شود و هر گونه تلاش مثبت و هدفمند در ارتباط با این نوع داده ها ،  می تواند دستاوردها و مزایای متنوعی را به دنبال داشته باشد .  داده های master  از جمله این نوع داده ها می باشند که مدیریت آنها برای هر کسب و کاری جنبه حیاتی دارد .
در طی سه بخش به بررسی جایگاه این نوع داده ها در کسب و کارها اشاره گردید و به این پرسش پاسخ داده شد که چرا کسب و کارها می بایست در مسیر مدیریت داده های master  حرکت کنند و چه دستاورد و یا نتایجی را برای آنها به دنبال خواهد داشت .  شناخت انواع داده در یک کسب کار و میزان وابستگی آنها به یکدیگر می تواند در موفقیت برنامه ها و پروژه ها درحوزه های مختلف داده بسیار تاثیرگذار باشد . در صورتی که یک سازمان تصمیم به اجرای یک برنامه مدیریت داده های master  داشته باشد می تواند از سه معماری متداول   Repository ،   Registry  و یا Hybrid  استفاده کند . هر یک از معماری های فوق دارای مزایا و محدودیت های مختص به خود می باشند .
استفاده موثر از داده در چرخه تصمیم گیری  ، یکی از ویژگی های مهم بنگاه های اقتصادی هزاره سوم است . بنگاه هایی که سیستم تصمیم گیری آنها نه بر اساس نظر و یا تجربه شخصی ، که  بر اساس  یک هسته هوشمند داده شکل پیدا می کند که به خوبی هم از بعد حاکمیتی و هم از بعد مدیریتی ، مدیریت می گردد . با مدیریت داده های master  ، در جهت تقویت این هسته هوشمند و شناخت دقیق و به روز موجودیت های اساسی کسب  و کار حرکت خواهیم کرد .

منابع  :  

Dama International , DAMA-DMBOK: Data Management Body of Knowledge (2nd Edition),Technics Publications; Second edition, Technics Publications , July 5 2017
CMMI Institute , Data Management Maturity (DMM) Model Version 1.0 ,CMMI Institute , 2014