GBASE数据库支撑国内最大规模银行大数据平台
众所周知,数据库是全球信息化系统领域中复杂程度最高、研发难度最大的大型软件之一,一款世界级数据库产品的诞生,离不开3-5年高强度复杂应用的压力磨炼,南大通用GBase 8a MPP数据库正是经历了这样一个生长过程。
国内平稳运行时间最长
中国农业银行总行大数据平台项目从2014年上马,到今天的5年多时间,GBase数据库几乎可以说已经通过了全世界银行领域中,强度最高、复杂性最高、压力最大、覆盖最全的分析类业务场景考验。农行用户和南大通用共同见证这一款世界级数据库的诞生、成熟,并走出银行业,支撑起了 金融 、电信、政务、军队等关键行业多个世界级的应用。GBase数据库从初期的不稳定,到现在已经支撑农行自主可控大数据平台稳定无故障运行超过1400天,平台项目因此荣获了中国人民银行 科技 发展一等奖,农行也与南大通用签约共建联合创新实验室。
项目获奖新闻
国内规模最大
农总行大数据平台项目建设以“数据是基础,治理是保障,技术是支撑,分析是关键,应用是目标”为原则,GBase数据库帮助农行用户顺利完成了数据治理,提高数据质量,从而满足了用户数据挖掘的需求,为数据价值在业务中的深入应用夯实了基础,实现了数据价值在业务应用中转变为生产力,构建数据价值利用的有效闭环,真正实现从数据支撑到数据运用的转变。
目前主库的裸数据量超过2.5PB,每天的增量数据为3TB,最大表5000亿行;库内复杂作业15000多个,涉及SQL语句100000多个;日终加工时间为8小时,T+1时间的双活集群间同步3小时完成;目前共部署33套集群,共1156个节点,裸数据总量超过20PB。
价值体现
海量数据管理:为用户提供了并行海量复杂数据处理平台,帮助客户形成PB级以上的业务数据单一视图,为客户提供及时高效的数据分析结果;
满足监管需求:通过对数据统一的管理与治理,满足上层监管部门对上报监管数据的要求,保证数据的准确性、及时性,完整性;
通过数据指导业务:通过数据仓库的建立,对数据在生命周期内有效和高效的管理,证客户接入更全面的业务数据,满足市场 营销 、内部管理、内外监管的分析业务需求;
支撑银行领域数据观念转变:随着数据技术和分析理论的发展,要求银行分析业务必须从抽样数据向全体数据,从绝对到效率,从原因分析到相关性分析转变,数据仓库的建立,很好的支撑了这种转变,使理论成为现实;
创新的大数据平台架构:将MPP数据库技术和Hadoop技术的混合使用并搭建组成大数据平台,是金融行业的大数据技术架构和应用的创新,中国人民银行科技发展一等奖。目前农行的大数据平台服务器数量已经达到1156台,其中MPP支撑结构化数据达20PB,是国内金融行业最大的数据仓库和大数据平台。
农行用户以七个全面高度评价大数据平台的价值
全面自主可控的大数据综合解决方案
全面融合的混搭架构
全面的数据覆盖
全面的服务方式
全面的智能分析
全面的应用支撑
全流程管理体系