从物联网到云计算,他们用数字技术守护莫高窟-天下网商-赋能网商,成就网商
天下网商记者 黄天然
辽阔苍凉的戈壁深处,敦煌莫高窟已伫立千年。
每年,这座举世瞩目的艺术宝库,都要迎接200多万名游客,可是也许很多人不知道,不像博物馆里那些被恒温恒湿环境呵护着的文物,莫高窟的每一件彩绘壁画与泥塑佛像,无时不刻都在遭受着风沙、空气、雨水、岩盐与地质灾害的侵蚀。
一代代文物保护专家呕心沥血,只为让它们在历史长河里留存更久。
浙江大学计算机学院副教授董亚波就是其中一员。14年来,他与研究团队为莫高窟装上环境监测系统,时时刻刻记录着莫高窟里一件件艺术品的“生命体征”,还可以通过云数据库检索分析,为文物保护专家“对症下药”提供了重要帮助。
美丽而脆弱的莫高窟
2006年11月,董亚波和研究团队第一次来到敦煌,此行是应敦煌研究院之请,为莫高窟搭建一套环境监测系统。
这是一项刻不容缓的任务。
董亚波来之前就听说,石窟南区497个洞窟,已有200多个洞窟中的文物遭受了不同程度的伤害,可是直到现场勘查过一些洞窟,他才深刻体会到那些美到勾魂摄魄的壁画和彩塑,在岁月和大自然的侵蚀下,究竟变得多么脆弱。
最常见的问题是褪色,日复一日的风沙侵蚀,打磨掉了壁画和彩塑原本的色彩;更棘手的麻烦是剥落,洞窟微环境内温湿度频繁变化,一些壁画表面酥碱起甲,纷纷剥落;最严重的威胁,则是地质灾害导致的崖体倾斜、开裂,部分壁画如果得不到及早修护,甚至随时有可能垮落、坍塌。
敦煌研究院一直在和这些灾害斗争,一边修复,一边保护,通过定期监测来摸索环境变量影响文物寿命的规律。
然而,当时的监测手段非常落后,文物保护专家通常只能用定期巡查拍照,观测对比壁画的状态变化,发现一些局部出现伤害加剧的趋势之后,再做分析、找原因。
比如,敦煌最常见的病害——盐害。
持续降雨之后,洞窟内的空气湿度升高,会使得壁画地仗层和后方岩石中的盐分潮解后经过一系列复杂的物理化学过程,最终会在壁画表面结晶渗出,导致壁画受损。
研究人员唯有通过巡查,确认壁画表面出现盐害,再用脱盐、加固等多种技术手段进行修复治理。
这样监测方式容易滞后,无法做到防范于未然。
除了复杂的自然环境变量,与日俱增的游客同样对壁画和彩塑的保护有着严重的影响。
敦煌研究院曾公布过一项研究,每40个游客参观半小时,洞窟中的二氧化碳含量就会升高7.5倍,温度升高4℃,空气湿度更加会大幅度增加。这不仅会对壁画文物产生严重的影响,同时也会对游客的身体健康非常不利。
数据监测为文物保驾护航
“文物的生命只有一次,一旦损毁就真的没有了。”
董亚波和同事们很快进入角色,起早摸黑,只为尽快为莫高窟建设一套准确、实时、可实现文物预防性保护的物联网监测设备。
497个洞窟,他也从最初的找不着北,渐渐走到熟门熟路。
“一直希望我们的技术能找到可以验证和应用的场景,敦煌就是实现这一价值的地方。”董亚波介绍,“湿度、温度、二氧化碳、大气环境数据、污染物数据,以及壁画病害的变化等,这些对壁画保护有着关键性作用的数据,在预防性保护工作中必不可少,我们要做的就是采集丰富的信息,用于文物保护的分析和预警。”
当时,董亚波用一台计算机作为服务器,与研究团队一起在莫高窟搭建起无线网络,先在10多个洞窟中尝试布置最简单的监测设备做尝试。
可是,按照文物保护的要求,监测设备既不能接触到壁画表面,又不能影响游客参观,更要克服洞窟内不能布设电源和有线无线网络的困难,所以原本看起来很简单的工作,其难度急剧上升,不得不通过研制文物保护领域专用监测设备的方案来解决。
大漠戈壁条件艰苦,但在董亚波和研究团队的努力下,莫高窟物联网监测系统进展顺利。
2011年,莫高窟内第一套智能联网的监测预警系统初具雏形,传感器可实时监测石窟外部的气象、风沙、水环境、大气污染,以及洞窟内部温度、相对湿度、二氧化碳等信息。
2013年,“敦煌莫高窟微环境控制关键技术研发”成为国家科技部和国家文物局支持的重大科研项目,敦煌研究院的相关研究团队与董亚波进一步丰富了洞窟内传感器监测数据的维度——崖体裂隙、倾斜、振动、洪水等也都纳入了系统实时感知范围。
之后,游客信息也整合进来,从游客进入窟区参观的整个过程,都会实时生成人流量数据,如果在旅游高峰期,一旦哪个洞窟内的人流量和二氧化碳达到预警限值,就可立即进行人流调峰,第一时间保护壁画。
上云成为敦煌“标配”
数以百计的传感器采集到了海量实时数据,却又带来了新的难题。
文保数据与其他行业的数据不同,不能定期清理,因为历史数据反而可能更有价值。
而当所有传感器不停工作,日积月累之下,数据量变得非常庞大。
“物联网生成文保数据,比如某个时间点的洞窟温湿度,数据绝对量并不大,可能一年下来也就几十个GB,但是问题在于,这类数据的条目特别多,有可能会多达几十亿甚至上百亿条,而且会源源不断地持续产生新的数据。而文物保护研究人员则可能会随时从中选择一个监测点位的一年甚至几年的数据,这会对数据库造成很大的压力。”董亚波说。
董亚波最担心的就是窟区停电或者断网,因为洞窟内的传感器会在断电时存储下数据,电力与网络恢复后会同时形成巨大的数据补发洪峰,录入规模一下子就比平时高出一个数量级,这一瞬间就会让容量有限的服务器不堪重负,甚至导致数据错乱。
于是,敦煌研究院从2011年就开始建立云平台,存储管理海量的物联网监测数据。
“敦煌上云开始得非常早,可以说是云技术刚刚出现的时候,就已经开始引入了。”董亚波说。
上云后,敦煌莫高窟就像拥有了一个更智能、容量更大且更加安全稳定的“电子文件柜”,再也不用担心数据丢失。随后出现的更大困扰是查询响应速度。原本,敦煌莫高窟的物联网监测数据,由敦煌研究院信息中心一套基于SQL(Structured Query Language,结构化查询语言)的传统数据库做支撑,但随着传感器数据越来越多,已经逐渐无法支撑百亿千亿级条目的数据管理需求。
当传统技术架构上承载着庞大数据时,数据存储和检索效率变得越来越低,调用长时间跨度的监测数据需要等待十秒甚至更多的系统反应时间。数据存储访问的性能变差,就不得不一次次地增加服务器以提升访问性能。这让研究工作的效率大打折扣。
让更多文化遗产拥有“云档案”
2018年,阿里云与浙大共同发起智云实验室,进行高校数字化探索。很快,阿里云为浙大部署了一套专有云。
专注文保的董亚波成了第一批用户。通过阿里云积累的数据库技术,董亚波首先提出希望解决的就是数据库反应时间的问题。
“当时用阿里云数据库做了测试,访问性能大概比原来有了几十倍的提升。”董亚波说。
如今,董亚波将敦煌经验应用到更多文物保护项目中,如四大石窟之一的甘肃天水麦积山石窟、瓜州锁阳城、浙江宁波保国寺等等,还有许多博物馆的预防性保护项目。
这些文物单位的体量小于敦煌莫高窟,同样有数据采集和监测的需要,却没有技术力量去维护数据中心,因此更适合建立“云档案”。
董亚波将这些文化遗产中采集到的数据都跑在浙大云上存储管理。
而文物实时监测对数据库的高要求,有时还是会让董亚波犯难,浙大云资源有限,数据量一大,有时也会出现数据录入和查询卡顿问题。
今年起,浙大开始“众筹”校内各类分散的计算资源,并通过一条光纤,拉通了阿里云的公共云算力,建立了一朵拥有更大资源池的“众筹式混合云”。
这朵云让浙大研究团队大为受益,在阿里云加持下,可以实现弹性分配、随需而用、无需排期,基本解决了各个文物保护项目实时数据记录、数据存储管理和快速查询调用的需求。
“有了这一云平台,我们可以很便利地将一些AI算法模型与数据联通,尝试寻找隐藏在文保数据内部的奥秘,为不同类型的文物做预防性保护找到更多方案,这对我们很有帮助。”
“最终的监测数据汇集到云上,这依然有赖于云平台的存储和处理能力。”董亚波说。“也许文物无法避免最终消亡的命运,但是我们希望通过科技的力量,能让它们消亡得尽可能慢一点。”