در
بخش اول ضمن ارایه تعاریفی در خصوص مدیریت داده ، به جایگاه مدیریت متادیتا به عنوان یکی از پیش نیازهای مهم اجرای موفقیت آمیز برنامه های پیشرفته داده نظیر تجزیه و تحلیل ، مدیریت داده مرجع و
master اشاره گردید. در
بخش دوم ضمن ارایه تعاریف مختلف متادیتا با ضرورت انجام آن در یک سازمان آشنا شدیم . همچنین به این موضوع اشاره گردید که اگر قرار است در عصر اقتصاد دیجیتال یک سازمان داده محور باشیم ، نوآوری داده محور را در دستور کار قرار دهیم و تصمیم گیری داده محور را در سازمان خود نهادینه نمائیم ، در گام نخست می بایست به سمت ایجاد یک سازمان متادیتا محور حرکت کنیم چراکه به کمک متادیتا ضمن امکان توصیف داده ، می توان به پرسش هایی فراوانی در خصوص داده پاسخ داد .
شکل 1 : متادیتا و پاسخ به پرسش های فراوان در رابطه با داده
در این بخش به سراغ انواع متادیتا خواهیم رفتم و با ویژگی هر یک آشنا خواهیم شد .
انواع متادیتا
متادیتا اغلب به سه گروه عمده تقسیم می گردد :
کسب و کار ،
فنی و
عملیاتی . هر یک از گروه های فوق توصیف گر بخش خاصی از داده می باشد. در تقسیم بندی فوق تاکید بر چگونگی استفاده از متادیتا نمی باشد و در مقابل بر مکانی که متادیتا از آنجا سرچشمه می گیرد تاکید شده است . به عنوان نمونه کاربران کسب و کار در صورت ضرورت می توانند از متادیتای فنی و یا عملیاتی نیز استفاده نمایند و یا کاربران فنی علاوه بر استفاده از متادیتای فنی از متادیتای کسب و کار نیز استفاده نمایند. در شکل 2 ، انواع متادیتا نشان داده شده است.
شکل 2 : انواع متادیتا
همانگونه که اشاره گردید ، شناخت متادیتا یک نقش حیاتی در مدیریت داده دارد . این موضوع در کتابخانه ای بزرگ با صدها یا هزاران کتاب و یا مجله و بدون کارت کاتالوگ نیز صدق می کند . بدون وجود یک کارت کاتالوگ ، متقاضیان کتاب حتی نمی دانند چگونه برای یک کتاب بخصوص و یا حتی برای یک عنوان بخصوص جستجو نمایند . کارت کاتالوگ نه تنها اطلاعات ضروری را ارایه می نماید ( کدام کتاب ها در کتابخانه وجود دارند و در چه قفسه هایی قرار دارند ) بلکه کاربران را قادر می سازد تا کتاب ها را با استفاده از نقاط شروع مختلف ( موضوع ، مولف / نویسنده و یا عنوان ) پیدا نمایند . بدون کارت ، یافتن یک کتاب بخصوص اگر غیرممکن نباشد بسیار مشکل است . یک سازمان بدون متادیتا نظیر یک کتابحانه بدون کارت کاتالوگ است . در یک کتابحانه و یا علم اطلاعات متادیتا با استفاده از مجموعه ای متفاوت از گروه ها تشریح می گردد :
متادیتا توصیفی ضمن تشریح یک منبع امکان شناسایی و بازیابی را فراهم می نماید ( نظیر عنوان ، مولف ، موضوع ) ،
متادیتا ساختاری : روابط درون و بین منابع و بخش های مختلف اجزاء آن را تشریح می کند ( نظیر تعداد صفحات ، تعداد فصل ها ) و
متادیتا مدیریتی جهت مدیریت منبع در طول چرخه حیات خود استفاده می شود ( نظیر شماره های نسخه ها ، تاریخ آرشیو ). در شکل 3 ، انواع متادیتا در یک کتابخانه نشان داده شده است .
شکل 3 : انواع متادیتا دریک کتابخانه
متادیتا کسب و کار
در این نوع متادیتا ، تمرکز بر روی محتوا ، شرایط داده و شامل جزئیات مرتبط با حاکمیت داده می باشد . متادیتای کسب و کار شامل اسامی و تعاریف غیرفنی مفاهیم ، موجودیت ها ، خصلت ها ، نوع های داده خصلت ها ، محدوده ، الگوریتم ها ، قواعد کسب و کار و ... می باشد . به عنوان نمونه می توان به موارد ذیل اشاره کرد :
- تعاریف و توصیفات دیتاست ها ، جداول ، ستون ها
- قواعد کسب و کار ، قواعد تبدیل ، محاسبات
- مدل های داده
- قواعد کیفیت داده و نتایج سنجش
- برنامه زمانبندی داده ها
- پرونده داده و اصل و نسب داده
- استانداردهای داده
- اطلاعات تماس ذینفعان ( مالکین داده ، متولیان داده )
- سطح امنیت / محرمانگی داده
- مسائل شناخته شده با داده
متادیتا فنی
متادیتای فنی اطلاعاتی در خصوص جزئیات فنی داده ، سیستم هایی که داده ها در آنها ذخیره شده اند و فرآیندهایی که باعث جابجایی داده درون سیستم ها و بین سیستم ها می شود را ارایه می نماید . به عنوان نمونه می توان به موارد ذیل اشاره کرد :
- اسامی جداول و ستون های بانک اطلاعاتی فیزیکی
- ویژگی های ستون
- ویژگی های شی بانک اطلاعاتی
- مجوزهای دستیابی
- قواعد CRUD داده ( ایجاد ، جایگزینی ، بهنگام سازی و حذف )
- مدل های داده فیزیکی شامل اسامی جداول داده ، کلیدها و ایندکس ها
- مستند کردن ارتباط بین مدل های داده و دارایی های فیزیکی
- جزئیات ETL
- مستدات نگاشت مبداء به مقصد
- مستندات اصل و نصب و داده شامل تاثیر تغییر اطلاعات در سیستم های بالادستی و پایین دستی
- قواعد backup و recovery
- مجوزهای دستیابی داده ، گروه ها و نقش ها
متادیتا عملیاتی
متادیتای عملیاتی جزئیات پردازش و دستیابی به داده را تشریح می نماید . به عنوان نمونه می توان به موارد ذیل اشاره کرد :
- لاگ های اجرای برنامه ها یا Jobs
- سوابق استخراج و نتایج مربوطه
- نتایج سنجش های ممیزی
- لاگ های خطاء
- گزارشات و الگوهای دستیابی پرس و جو ، فرکانس و زمان اجراء
- طرح نگهداری و اجرای پچ و نسخه ها و سطح پچینگ فعلی
- الزامات سطح توافق و تامین
- آرشیو کردن داده و قواعد نگهداری ، آرشیوهای مرتبط
- معیارهای دورانداختن داده
- قواعد اشتراک داده و توافقات
- نقش ها ، مسئولیت های فنی و تماس ها
خلاصه
متادیتا و مدیریت صحیح آن ( صرفنظر از نوع آن ) یکی از مهمترین اقدامات ضروری برای مدیریت داده در طول چرخه حیات داده می باشد . با توجه به این که متادیتا خود نوع خاصی از داده است ، بدیهی است که تابع یک چرخه حیات نیز باشد . تمامی راه حل های مدیریت متادیتا شامل لایه های معماری متناسب با هر یک از مراحل چرخه حیات می باشند. ایجاد و یافتن منابع متادیتا ، ذخیره سازی متادیتا در یک و یا چندین مخزن ، یکپارچه سازی متادیتا ، عرضه متادیتا ، استفاده از متادیتا ، مدیریت و کنترل متادیتا از جمله مهمترین مراحل در چرخه حیات متادیتا می باشند . از رویکردهای مختلفی می توان جهت یافتن منابع متادیتا ، ذخیره سازی ، نگهداری و در دسترس قرار دادن متادیتا برای مصرف کنندگان استفاده کرد . بخاطر داشته باشیم که موفقیت در اجرای سایر برنامه های داده به مدیریت موثر متادیتا بستگی دارد . به عنوان نمونه ، مدیریت متادیتا یکی از مهمترین اولویت های اجرایی یک برنامه حاکمیت داده می باشد .
منابع :
Dama International , DAMA-DMBOK: Data Management Body of Knowledge (2nd Edition),Technics Publications; Second edition, Technics Publications , July 5 2017
CMMI Institute , Data Management Maturity (DMM) Model Version 1.0 ,CMMI Institute , 2014