如何识别主数据
今天聊聊有关主数据的话题。
近期参加了好几家公司有关主数据治理的会议,发现大家对主数据有各种各样的理解误区。
1、主数据是什么
主数据是指那些跨业务、跨流程、跨系统、跨主题使用的,反映业务实体状态属性的基础信息。
上面这一句话,满满都是关键词:“跨业务”、“跨流程”、“跨系统”、“跨主题”、“反映业务实体状态属性”、“基础信息”。
大家要关注最后的定语:基础信息。
主数据一般都是基础信息,基础信息的特点就是基本保持不变,所以,经常变化的数据一定不是基础信息,更不是主数据。
2、主数据的特点
主数据具有高价值性、高共享性和相对稳定性。
高价值性是指主数据是很多业务处理都无法避开的基础数据。
比如:物料是主数据,而入库和出库就无法避开物料主数据,想象一下,一张入库单,没有物料信息,那就只剩下数量,这张单据毫无意义。
高共享性是指主数据是跨业务、跨流程、跨系统、跨主题高度共享的。如果数据只在自身的业务系统中使用,没有任何其他系统需要共享,那一定不是主数据。
相对稳定性是和业务数据相比较,主数据相对稳定,变化频率较低。
比如:我们熟悉的人员、供应商、客户等主数据,很少会改名称,当然有更名的可能,但概率较低。
3、主数据的识别
我们与企业交流过程中发现,基本上所有的企业对主数据的识别都采用了归纳法,即:发现了数据在不同系统重复录入的问题,识别了需要统一数据的需求,然后觉得某数据可以认定为主数据,但该数据为什么就是主数据,大家一般都说不清楚,都是凭感觉、凭经验而定。
其实,主数据的识别有标准的方法论。
(1)梳理流程,识别主数据
每一家认真开展信息化建设的企业通常都进行过标准化的流程梳理。
标准的企业流程体系一般是分层级的,通过对每一层的流程进行梳理,可以识别企业开展业务需要具备的能力(1-3级流程),这些能力映射到信息系统中,可以称之为“业务组件”。
注:对业务组件感兴趣的朋友可以抽空学习一下IBM的组件化业务模型CBM。
(4-5级)流程有输入和输出,这些输入和输出一般是表单,对这些表单进行归纳分析,可以生成“业务主题”,这些“业务主题”映射到信息系统中,可以称之为“数据主题”或“数据对象”。
将“业务组件”和“数据主题”放到一张矩阵表中,就可以知道哪些“数据”是跨业务的,这些跨业务的数据满足了主数据的高价值、高共享的特性。
在矩阵表中进一步分析这些数据的创建、读取、更改和删除等操作(CRUD),就可以找出那些“有创建、常读取、少修改、无删除”的数据,把这些数据整理出来,进一步筛选出定义核心业务的数据,那么这些数据大概率就是主数据。
以上的识别主数据的方法属于自上而下的规划,一般在企业开展数字化转型规划时就需要对业务中存在的主数据进行全面识别,以备后续的主数据系统建设使用。
(2)梳理系统,识别主数据
如果企业没有对主数据进行自上而下的规划,那么当企业已经建设了很多IT系统时,肯定会出现对主数据识别的需求。这时,可以自下向上,通过对现有系统中的数据进行分析,以识别主数据。
各个已投入使用的业务系统中都有很多数据,企业需要将这些“数据”梳理出来(查看页面、查看数据库表结构),将这些数据与“系统名称”放在一张矩阵表中进行分析,通过矩阵分析,就能很方便地知道,哪些数据是跨系统使用的。
这些跨系统使用的数据满足了主数据的高价值、高共享的特性。
如果在这张矩阵表中对这些数据的创建、读取、更改和删除等操作(CRUD)进一步分析,就可以找出那些“有创建、常读取、少修改、无删除”的数据。
对这些数据“使用周期的长短”、“是否为业务数据”进行识别,如果满足“非业务数据”,而且“使用周期较长”,那么这些数据就是主数据。