جزئیات  
عنوان انواع داده
نوع منبع مقاله
گروه استراتژی داده
تاریخ انتشار 1394/5/17
خلاصه اولین گام  به  سمت  مدیریت صحیح داده ، شناسایی ماهیت و  یا جنس  انواع داده در یک سازمان و تهدیدات مرتبط با هر یک است تا بتوان از این طریق به ضرورت ایجاد ساختارهای مدیریتی لازم جهت صیانت و مدیریت هر یک  اقدام  کرد. قطعا عدم  آشنایی با نوع های مختلف  داده و جایگاه آنها در فرآیندهای کسب و کار یک  سازمان، باعث شکل گیری ناقص حلقه های مدیریت داده می گردد و نمی توان انتظار موفقیت در این مسیر را داشت . مسیری که  با فرض درست بودن مقصد  آن ، ممکن  است در طول مسیر با تابلوهایی مواجه شویم که صرفا کاریکاتوری از آن چیزی هستند که می باید باشند. Master Data ،Transactional Data ،Meta Data ، Reference Data گروه های مختلف داده در یک سازمان می باشند که موفقیت بسیاری از پروژه های فناوری اطلاعات با سرنوشت و نحوه مدیریت آنها گره خورده است.

 ما در دوران جالبی زندگی می کنیم.دورانی که شاهد تحولات شگرف در حوزه های مختلف فناوری اطلاعات و بکارگیری دستاوردهای آن در متن زندگی شخصی و فضای کسب و کار هستیم . یکی از این حوزه های جذاب و تاثیرگذار ، داده است که امروزه به کانون توجه اکثر سازمان های پیش رو در جهان تبدیل شده است و مدیران آنها همواره این سوال را از خود می پرسند که آیا سازمان ما در مسیر درست مدیریت و بکارگیری داده قرار دارد؟ مدیریت صحیح داده در یک سازمان دارای چالش های مختص به خود است که می بایست با درک مناسب از داده و بکارگیری نیروی های متخصص برجسته که امروزه از آنها به عنوان دانشمندان داده یاد می شود ، قدم در راهی گذاشت که حضور موفقیت آمیز در عرصه کسب و کار را تضمین نماید . دلیل تمرکز بر روی داده ، نقش انکار ناپذیر آن در تولید اطلاعات و بینش عمیقی است که هر بنگاه کسب و کار به منظور ادامه حیات خود در یک محیط رقابتی شدید به آن نیاز دارد .
اطلاعات و داشتن دید صحیح و  همه جانبه به یک سازمان کمک می کند تا بتواند منابع را با سودآوری بیشتری تخصیص دهد ، سطح  رضایتمندی مشتریان خود را  افزایش دهد ، از روش های به روز برای کسب رضایت آنها استفاده کند،  هزینه ها را کاهش دهد ، انرژی و منابع موجود  در سازمان  را به درستی استفاده نماید و در نهایت کالاها و خدماتی را ارایه  نماید که مورد نیاز واقعی مصرف کنندگان باشد و از لحاظ قیمت نیز دارای توان رقابتی باشند . با تجزیه و تحلیل پیشرفته داده به سمت یک سازمان باهوش تر حرکت می کنیم . سازمانی که معماری تصمیم گیری آن بر پایه تحلیل اطلاعات صحیح و به روز استوار است .

ریسک داده    
به موازات ارتقاء جایگاه داده و تبدیل آن به یکی از سرمایه های حیاتی در سازمان ها ، استفاده  از آن می تواند خطرات و تهدیدات متعددی را از سطوح استراتژیک گرفته تا عملیاتی متوجه سازمان ها نماید.  قطعا سازمانی که توان مدیریت مهمترین  سرمایه های خود را  ندارد ، نمی تواند ادعای حضور مستمر و موفقیت آمیز در عرصه کسب و کار را داشته باشد .حاکمیت داده برای تشخیص و شناسایی اولیه پتانسیل های بروز ریسک ، پیشگیری از تهدیدات و حصول اطمینان از استمرار کسب و کار حیاتی است. رکوردهای صحیح داده و بکارگیری زیرساخت های لازم حمایتی کمک می کند تا هم بتوان به نیازهای قاونی به درستی پاسخ داد  و  هم عمر طولانی و  با عزت یک بنگاه کسب و کار را تضمین کرد . سازمان هایی که توان مدیریت ریسک های مرتبط با داده را ندارند خود را در معرض معضلات قانونی و غیرقانونی متعددی قرار می دهند . مسائلی که می تواند از ناراحتی و یا ایجاد نارضایتی شروع شود تا مسائلی که می تواند بطرز قابل توجهی به یک سازمان آسیب برساند . به عنوان نمونه ،  کیفیت پایین داده یکی از مشکلات مهم اغلب سازمان ها  است که می تواند منشاء بروز مسائل  متعددی برای یک سازمان گردد. شکل 1 ، دلایل کیفیت پایین داده در یک سازمان را نشان می دهد.

  علل و منبع بروز مشکل کیفیت داده    
شکل 1 : علل و منبع بروز مشکل کیفیت داده

بنابراین می توان کیفیت پایین داده را به عنوان یک ریسک مهم در سازمان محسوب کرد که درصورت عدم پاسخگویی صحیح به آن تمامی لایه  های استراتژیک تا عملیاتی  متاثر از آن خواهند شد . 
متاسفانه مدیریت ریسک اطلاعات اغلب ضعیف است چراکه سازمان ها به آن اولویت کمتری داده و با ابعاد مختلف آن به خوبی  آشنا نیستند . اولین مرحله در مدیریت و صیانت از هر سرمایه، شناسایی و بکارگیری سیستم های حمایتی در ارتباط با آن سرمایه بخصوص است .اگر داده را به عنوان یکی از مهمترین سرمایه های یک سازمان درنظر بگیریم، که قطعا اینچنین است ، در اولین گام شناخت مناسب انواع آن در سازمان به همراه ماهیت عملکردی هر یک  بسیار حائز اهمیت است .چراکه  صرفا  با  آشنایی عمیق و  همه جانبه ماهیت داده است که می توان از آن به عنوان یک سرمایه سازمانی به درستی حفاظت کرد و  زیرساخت های مورد نیاز حهت مدیریت آن را در سازمان ایجاد کرد . 

انواع داده      
انواع داده به گروه بندی داده با خصایص مشترک اطلاق می گردد . آشنایی با این گروه ها برای مدیریت داده بسیار  مهم است  چراکه رفتار آنها  متاثر از نوع خصایص آنها می باشد.به عنوان نمونه، پروژه ای که بر روی بهبود وضعیت کیفیت Master Data متمرکز است ممکن است متوجه این واقعیت شود که یکی از دلایل اصلی مسائل مرتبط با کیفیت ریشه در مسائلی دارد که از  Reference Data  به ارث رسیده است .  بدیهی  است در چنین مواردی می بایست در آغاز بر روی بهبود کیفیت Reference Data متمرکز گزدید. از زاویه دید حاکمیت داده ، مسئولیت ایجاد و بهنگام سازی داده می تواند از یک گروه به گروه دیگر متفاوت باشد.
سیسم های مدرن اطلاعاتی از چهار نوع داده  Master Data ،  Transactional Data ، Meta Data  و   Reference Data  استفاده می کنند . اجازه دهید جهت آشنایی بیشتر با جایگاه واقعی انواع داده یک نمونه مثال کاربردی را دنبال نماییم . فرض کنید یک شرکت نمونه محصولاتی را به مشتریان خود عرضه می نماید .رکورد مشتری و یا محصول را  می توان به عنوان Master Data  در نظر گرفت.  Master Data  افراد ، مکان و  مواردی را شامل می شود که درگیر کسب و کار یک سازمان می شوند.  در واقع  Master Data  ، به منزله  اسامی هستند که ما بر روی آنها عملیاتی انجام می دهیم . شکل 2 ، انواع داده اشاره شده  به همراه نحوه تعامل با یکدیگر  را نشان می دهد .

    انواع داده   
شکل 2 : انواع داده

با توجه به شکل 2 ،  موارد زیر قابل توجه است :
  •  برای ثبت  تراکنش  فروش از برخی فیلدهای اطلاعاتی  رکوردهای Master Data  مشتری  و  محصول استفاده شده است .
  • در تراکنش فروش از  Reference Data نوع مشتری  استفاده شده است .
  • از متا دیتا که به مفهوم داده ئی  در رابطه با داده است ، استفاده شده است . برچسب متادیتا ، خصوصیات سایر داده را تشریح ، بازیابی ، تفسیر و استفاده از اطلاعات را آسان تر می کند .متادیتا  برای پیشگیری از عدم درک مناسب در پروژه هایی نظیر مسائل کیفیت داده حائز اهمیت  است .
پس از آشنایی اولیه با چهار نوع  مهم  داده در یک سازمان ، در ادامه با ویژگی هر یک بیشتر آشنا می شویم .
  •  Master Data  ، افراد ، مکان ها و چیزهایی را تشریح می کند که در کسب و کار یک سازمان درگیر هستند.  افراد ( نظیر مشتریان ، کارکنان ، فروشندگان ، تامین کنندگان ) ، مکان ها ( ادارات ،موقعیت ها ، مناطق فروش) ،چیزها ( اکانت ها ، محصولات ، سرمایه ها ، مجموعه مستندات ) نمونه هایی در این زمینه می باشند . با توجه به این که داده  توسط چندین فرآیند کسب وکار و سیستم های فناوری اطلاعات استفاده می گردد، استانداردسازی قالب های Master Data و یکسان سازی مقادیر برای موفقیت یکپارچه سازی حیاتی است .  Master Data در رکوردهای Master  گروه بندی  می شود که ممکن است شامل Reference Data مرتبط  نیز باشد . مثلا کد استان که درون یک رکورد آدرس مشتری قرار می گیرد .
  • Reference Data ، شامل مجموعه ای از مقادیر و یا توصیف های طبقه بندی شده ای است  که توسط سیستم ها، برنامه ها ، فرآیندها و گزارشات به آنها رجوع می شود .همچنین از این نوع داده توسط رکوردهای Master و  یا تراکنشی نیز استفاده می شود. لیستی از مقادیر معتبر ، لیست کدها ، کدهای وضعیت ، فلگ ها ، انواع محصولات ، لیست حساب ها  و سلسله مراتب محصولات  نمونه هایی در این زمینه می باشند. استاندارد سازی Reference Data  ، کلید یکپارچه سازی داده است . 
  • Transactional Data  ، داده های تراکنشی  مرتبط  با یک رویداد داخلی ، خارجی و یا تراکنشی که یک سازمان برای انجام فعالیت های کسب و کار خود انجام می دهد . سفارش خرید ، سفارش فروش ، صدور صورتحساب ، صدور فاکتور و مواردی از این نوع را در گروه  رکوردهای تراکنشی قرار می دهند . در رکوردهای تراکنشی از   Meta Data  و  Reference Data  استفاده می شود .
  • Meta Data ، به معنای واقعی کلمه داده ئی است در رابطه با داده  دیگر . برچسب های متادیتا امکان بازیابی ، تفسیر و استفاده از داده مورد نظر را راحت تر می نمایند . متادیتا را می توان به سه نوع متداول تقسیم کرد :
    • متا دیتای فنی : متادیتا استفاده شده به منظور تشریح فناوری و ساختار داده است. اسامی فیلدها ، طول ، نوع ، لی اوت جدول بانک اطلاعاتی نمونه هایی در این زمینه می باشند.
    • متادیتای کسب و کار : جنبه های غیرفنی داده و استفاده از آنها را تشریح می کنند .تعاریف فیلدها ، اسامی گزارشات ، عناوین گزارشات و صفحات وب ، اسامی صفحات برنامه  ، آمار کیفیت داده نمونه هایی در این زمینه می باشند .
    • متادیتای  ممیزی : نمونه خاصی از متا دیتا است که معمولا در یک رکورد ذخیره می گردد و رویدادهای مرتبط با داده ( چه فردی داده را ایجاد کرده است ، چه شخصی آن را حذف و یا تغییر داده است و... ) را در خود ذخیره می نماید . از این نوع متادیتا اغلب به منظور کنترل مسائل امنیتی استفاده می شود .
    با این که متادیتای ممیزی معمولا در یک رکورد ذخیره می گردد ، متادیتای فنی و  کسب و کار معمولا جدای ازداده ئی که آنها تشریح می نمایند ، ذخیره می گردند . ا
  • سایر ، دو نوع دیگر داده وجود دارد که به نوعی تاثیرگذار درطراحی و استفاده از سیستم می باشند :
    • Historical Data ، شامل حقایق مشهودی در یک مقطع زمانی خاص است که نباید  تغییر داده شوند مگر این که خطایی وجود داشته باشد.  وجود این نوع داده برای مسایل امنیتی ،کنترلی و  گزارشات  بسیار حائز اهمیت است .
    • داده موقت ، در حافظه  و  به منظور  افزایش سرعت پردازش نگهداری می شوند و صرفا کاربرد فنی دارد .

ممکن است برخی سازمان ها گروه بندی  داده را به شکل دیگری نیز انجام دهند .  مثلا برخی سازمان ها Meta Data  و Reference Data  را با یکدیگر ترکیب و آن را MRD می نامند . مهم نیست که چگونه داده طبقه بندی می شود ، مهم این است که  آیا زیرساخت های لازم برای حمایت از  آنها در یک سازمان ایجاد شده است ؟

ارتباط بین انواع داده 

شکل 3، ارتباط بین انواع داده را نشان می دهد . همانگونه که در شکل فوق نشان داده شده است برای ایجاد یک رکورد  تراکنشی به  رکورد  Master  و برای ایجاد یک  رکورد Master  به یک رکورد  Reference  نیاز است .از متادیتا به منظور شناخت تمامی گروه های داده استفاده می شود . در صورتی که داده از نوع Historical  باشد ، در بسیاری از موارد  نگهداری رکوردهای داده  Reference  نیز لازم باشد . ممیزان داده به کمک   متادیتای ممیزی قادر به تحلیل عملیات انجام شده بر روی داه  Historical   می باشند .

   ارتباط بین انواع داده   
شکل 3 : ارتباط بین انواع داده


مراقبت از داده Reference بر روی کیفیت داده  Master  و داده تراکنشی تاثیر دارد . Reference Data ، کلید تعامل  سیستم ها با یکدیگر است  و هر اندازه که مدیریت و استاندارد سازی آنها بهتر باشد ، قدرت به اشتراک گذاشتن داده درون  سازمان  و  خارج از سازمان بهتر می شود . وجود اشکالات و یا خطای مشهود در Reference Data  دارای تاثیری چندین برابر بر روی سیستم های پایین دست است.کیفیت Master Data برروی داده تراکنشی تاثیر می گذارد و کیفیت متا دیتا بر روی تمامی گروه ها تاثیر خواهد گذاشت .
  
خلاصه
 سیسم های مدرن اطلاعاتی از چهار نوع داده  Master Data ، Transactional Data ، Meta Data و Reference Data  استفاده می کنند . آشنایی با  ماهیت و  خصایص هر گروه به سازمان ها کمک می کند تا بتوانند مدیریت آنها را  به درستی  انجام  دهند. اجرای موفقیت آمیز پروژه هایی نظیر MDM  ( برگرفته شده از Master Data Management  )  و یا   RDM  ( برگرفته شده از  Reference Data Management  )   و     Meta Data Managemet   بدون آگاهی از ماهیت گروه داده ، ارتباط گروه های داده با یکدیگر و  جایگاه آنها در مدیریت کلان داده در یک سازمان  میسر نمی گردد. داده هر سازمان منحصربفرد است  و  هیچ سازمانی  تمایل به استفاده از یک لیست داده مشابه ندارد. در صورتی که بتوان داده را بطور مستمر و درست  مدیریت کرد ، می توان آن را به یک مزیت رقابتی برای سازمان تبدیل کرد.