你了解数据仓库吗?它有哪些特征?
今天我们要讨论的是数据仓库,你了解数据仓库吗?它有哪些特征呢?小编简单整理了一下,大家可以看看。数据仓库是面向主题的(Subject-Oriented)、集成的(Integrated)、不易丢失的(Non-volatile)以及时变的(Time-Variant)数据集合,它用来支持管理决策。
总的来说,数据仓库具有以下几个特征:
1.面向主题
数据仓库是面向主题的,它通过一个单独的主题域将多个业务系统的数据加载在一起,以便对单个主题进行分析(例如:用户、订单、商品等等),操作型数据库是为支持各种业务而建立的。
2.集成性
不同来源的数据库中的数据由数据仓库进行汇总,而数据仓库中的综合数据是无法直接从原始数据库系统中获得的。所以,数据进入数据仓库之前,必然要进行统一和整合,这是建立数据仓库最关键、最复杂的一步(ETL),统一源数据中所有矛盾的地方,例如字段的名称和含义,名称和含义,单元和字长等。
3.非易失性
操作型数据库主要服务于日常业务操作,使数据库需要经常对数据进行实时更新,以快速获取最新数据,不会影响正常的业务运行。
只需将过去的业务数据保存在数据仓库中,数据仓库就会根据业务需要定期更新,而不必对每个业务都进行实时更新,而是根据业务需要将一批更新后的数据导入数据仓库。在相当长的一段时间内,数据仓库的数据反映了历史数据的内容,是不同时间点数据库的集合,以及基于这些快照的统计、综合和重新组织的导出数据。一般只对数据仓库中的数据进行查询操作,很少进行删除和更新。但数据需要定期加载和刷新。
4.时变性
数据仓库包含不同粒度的历史数据。数据仓库中的数据可以是指定的日期、周、月、季度或年。通过对企业过去一段时间的经营情况进行分析,数据仓库被设计用于挖掘隐藏的模式。尽管数据仓库的用户无法修改数据,但并非说数据仓库中的数据永远不变。这种分析只能反映过去的情况,当业务发生变化时,模式的挖掘就会失去时效性。所以数据仓库中的数据需要定期更新,以满足决策需要。
对于一个数据产品经理来说,数据仓库非常重要,所以不仅要了解,还要会使用,这样才能更高效工作。在接下来的文章中,小编还会继续给大家分享数据仓库的知识,感兴趣的小伙伴可以继续关注哦!
以上就是“你了解数据仓库吗?它有哪些特征?”的内容了,如果你还想了解其他相关内容,可以来 产品壹佰 官方网站。
总的来说,数据仓库具有以下几个特征:
1.面向主题
数据仓库是面向主题的,它通过一个单独的主题域将多个业务系统的数据加载在一起,以便对单个主题进行分析(例如:用户、订单、商品等等),操作型数据库是为支持各种业务而建立的。
2.集成性
不同来源的数据库中的数据由数据仓库进行汇总,而数据仓库中的综合数据是无法直接从原始数据库系统中获得的。所以,数据进入数据仓库之前,必然要进行统一和整合,这是建立数据仓库最关键、最复杂的一步(ETL),统一源数据中所有矛盾的地方,例如字段的名称和含义,名称和含义,单元和字长等。
3.非易失性
操作型数据库主要服务于日常业务操作,使数据库需要经常对数据进行实时更新,以快速获取最新数据,不会影响正常的业务运行。
只需将过去的业务数据保存在数据仓库中,数据仓库就会根据业务需要定期更新,而不必对每个业务都进行实时更新,而是根据业务需要将一批更新后的数据导入数据仓库。在相当长的一段时间内,数据仓库的数据反映了历史数据的内容,是不同时间点数据库的集合,以及基于这些快照的统计、综合和重新组织的导出数据。一般只对数据仓库中的数据进行查询操作,很少进行删除和更新。但数据需要定期加载和刷新。
4.时变性
数据仓库包含不同粒度的历史数据。数据仓库中的数据可以是指定的日期、周、月、季度或年。通过对企业过去一段时间的经营情况进行分析,数据仓库被设计用于挖掘隐藏的模式。尽管数据仓库的用户无法修改数据,但并非说数据仓库中的数据永远不变。这种分析只能反映过去的情况,当业务发生变化时,模式的挖掘就会失去时效性。所以数据仓库中的数据需要定期更新,以满足决策需要。
对于一个数据产品经理来说,数据仓库非常重要,所以不仅要了解,还要会使用,这样才能更高效工作。在接下来的文章中,小编还会继续给大家分享数据仓库的知识,感兴趣的小伙伴可以继续关注哦!
以上就是“你了解数据仓库吗?它有哪些特征?”的内容了,如果你还想了解其他相关内容,可以来 产品壹佰 官方网站。