数据治理的技术体系有些啥
为了数字化转型的成功,企业需要高质量的数据,而数据质量的提升离不开数据治理。
数据治理是一个庞大的概念,是管理体系、技术体系、质量体系及安全体系的结合。
数据治理的技术体系是实施治理的基础,没有技术体系,数据治理无从谈起。
那么数据治理的技术体系包括哪些内容呢?我自己梳理了一下,仅代表个人观点。
数据分类方法
比如数据分为:主数据、业务数据、指标数据、基础数据等;
主数据又分为:组织、人员、产品、物料、供应商、客户等;
物料主数据又分为:塑料、五金、电子、标准件、化工品等
数据分层指南
企业要决定对数据的分层管理是系统还是按业务进行分层。
举例:按业务领域,将数据分为如下5层管理结构
一级业务域、二级业务域、业务对象、对象组件、数据项
业务术语管理
防止业务术语同名不同义而造成的误解和效率损失
数据编码规范
数据编码是数据管理的重要基础,每个数据唯一的编码,是识别数据的依据

数据模型设计规范
明确企业内部的数据模型规范,包括如何从概念模型、逻辑模型演进到物理模型,通过数据模型,可以更加清晰地梳理业务需求、指导技术开发。
数据源认证规范
明确数据在企业内的唯一发布源头,形成一个数据、一个源头、多方引用的管理方式。
数据资产目录
根据数据分类方法、数据分层指南、数据编码规范及数据源认证规范等相关技术文件,通过数据盘点,制定企业的数据资产目录。
有了数据资产目录,企业才可能“按录索数”,找到自己需要的数据

数据标准模型
根据数据资产目录,按数据分类方法,对每一类数据明确定义数据标准的组成项,及其公共填报要求。

数据标准体系
根据数据标准模型,对每一个数据制定相应的数据标准,并在数据管理过程中按标准严格执行。
数据质量维度
确定数据质量维度,以便对数据质量状况进行统计分析。
数据质量维度包括:准确性、有效性、唯一性、一致性、完整性等。
数据质量规则
依据数据标准及数据质量维度,对每一个数据制定其相应的数据质量规则。
比如人员主数据,我们就需要建立一系列数据质量规则:
1、人员的编号是必填项,不得为空;
2、人员的编号必须是唯一的,不得重复;
3、人员的编号必须符合相关的人员编号管理规范的要求;
4、人员的姓名是必填项,不得为空;
5、人员的中文名必须是中文的,不能有英文、数字和其他字符;
6、人员的出生日期与年龄是正相关的,是在一定区间范围内的,比如说必须大于18岁、小于80岁,如果系统里出现了某位在职员工超过了200岁,那肯定是不合理的;
7、人员的身份证号码应该是18位的,最后一位允许为X,如果身份证号码只有10位,那数据肯定不对;
8、人员的中国手机号码应该是11位的,而且必须以1开头,如果出现了18位的以8开头的号码,那肯定是哪里出问题。
