一分钟简单了解数据湖的特点
上一次我用一个比喻来帮大家理解了什么是数据湖。基于这个比喻,我们可以发现数据湖的几个基本特点:
第一个特点是数据湖里存储的是企业的原始数据,是与业务系统中的数据“一模一样”的完整拷贝;
第二个特点立足于第一个特点,数据湖存储原始数据,所以,无需事先对数据进行结构化处理。这使得数据湖必然可以存储多种多样的数据格式,包括结构化数据和半结构化数据,也包括了例如视频、图片这些非结构化数据;
第三个特点是数据湖需要提供数据全生命周期的管理能力,包括数据的接入、存储、处理、分析和应用。
总之,数据湖就是一个数据存储和管理的系统,它存储各种类型的数据,并对这些数据进行管理。