向学术合作抛出橄榄枝
近日,由清华大学,北京航空航天大学和中国计算机学会(CCF)等单位联合主办的第五届开源操作系统技术年会OS2ATC(Open Source Operating System Annual Technical Conference 2017)在北京航空航天大学举行。阿里集团研究员,系统软件事业部负责人林昊(花名毕玄)发表了题为《阿里巴巴在操作系统上的创新与挑战》的主旨演讲。全面分享了阿里操作系统团队近一年来的工作成果及创新,并就当前阿里在操作系统领域遇到的挑战,向学术界抛出合作的橄榄枝。
OS2ATC每年举办一次,今年的会议主题涵盖操作系统内核、分布式系统、可验证系统和AI系统等领域,吸引来自学术界、工业界、开源社区的学者和工程师共同探讨操作系统和系统软件设计与实现,以及分析与评估的理论、方法和技术。本次会议除邀请到国防科大王戟老师、中科大冯新宇老师和清华大学张超老师等知名学者外,来自阿里巴巴,Intel和红帽等公司的一线资深专家也深度参与了本次会议。
多年来阿里基于自身业务需求在操作系统特别是Linux内核领域不断进行深耕。目前在内核快速迭代、QoS Aware的操作系统、Container Native,以及软硬件结合与互动等领域取得了不错成绩。阿里定制化服务器操作系统服务于包括电商,云计算与 金融 在内的所有阿里生态系统业务,累计部署量已超百万台。业务规模和多元化是阿里在操作系统领域不断创新的独特优势,阿里也正充分利用该优势,不断技术创新让业务具备更佳的竞争力。
阿里在Linux内核上已经历2.6.32,3.10.0和4.9等多个大版本,目前正逐步缩小与主流社区的差距,使业务可以快速获得内核领域创新带来的技术红利。而这需要内核具备完备的测试与自动升级部署能力,目前阿里已建立起一套自动化内核测试框架与自动部署工具,用技术手段降低了内核升级的成本。但长远来看,目前的工作还远远不够。在内核版本热升级,阿里应用测试集的抽象等领域,希望能够跟学界一起做出更具突破性的工作。
此外,为了最大化单机资源利用率,阿里优化了CPU调度,内存管理,Block IO和网络等资源管理方法,并结合新硬件实现了更加灵活的资源QoS控制。但在这个工作中,阿里看到硬件正逐步成为QoS控制的瓶颈。阿里同样希望与学界和硬件厂商联手,在所有关键资源上都能实现完美的QoS控制。
在Container Native和软硬件结合互动领域,阿里也在不断投入和持续创新。目前阿里自研开源容器Pouch已构建了RunV引擎,利用虚拟化技术增强容器间的安全隔离。但是Container Native目前还存在一定的未知性,同时也存在巨大的创新空间。在软硬件结合和互动方面,阿里也已在Apache Pass,Open Channel SSD、高性能swap设备和智能网卡等领域开始投入研发能力。
阿里正寻求和学术界及上游硬件厂商展开广泛合作,通过系统层面的持续创新提升基础设施能力,从而来应对快速成长的业务规模和不断涌现的新业务场景。在与学术界的深入合作上,阿里先后搭建了“AIR计划”,达摩院(DAMO)等多个平台。针对未来三年内的技术领域,阿里会和高校及学术领域一起合作探索,共同确定研究方向。在合作过程中,对于有效果的技术方向,阿里的工程团队会负责工程化落地。