生命科学迎来大模型时代:智源研究院院长黄铁军、AWS李健都讲了啥?
近日,由播禾创新中心承办的第五届“全球人工智能产品应用博览会”(Al Expo 2023)--IT&BT融合创新应用论坛,在苏州召开。
本次大会聚焦生物计算大模型话题,围绕数据获取、数据分析、数据应用等多个维度探讨生物计算大模型的构建及价值,以及大模型在药物发现、工艺、临床等多个领域的的潜在应用价值。
会上,来自全国的医药专家、领军AI医药企业、以及新兴大模型企业,围绕生命科学大模型之路、AI制药的商业化之路等话题进行了充分的讨论和分享。
大会伊始,薄荷天使基金创始合伙人, 播禾创始人刘毓文、苏州工业园区党工委委员,管委会副主任倪乾 ,分别作了开幕式致辞。
刘毓文
刘毓文表示,IT&BT融合应用创新论坛希望为大家带来行业最新的交叉进展,并从数据模型算力探索以大模型驱动的AI在生命科学领域的前沿动态,通过丰富的应用实例展示AI赋能生物医药开发的全流程。
作为中国首家IT&BT交叉融合创新中心,播禾创新中心始终致力于联合业界一起努力成就AI for Life Science。
倪乾
倪乾表示,作为赋能手段,AI与生命科学相融合,在药物研发、基因治疗等方面正在发挥越来越重要的作用,为实现“健康中国”拓展了新的空间。
在推动IT+BT融合创新方面,苏州工业园区具备独特的优势。
一方面,园区坚持“一张蓝图绘到底”的原则,拥有良好的产业基础。目前已集聚1500多家AI企业,涵盖基础层、应用层全产业链。
另一方面,园区拥有一流的创新体。诸如国家生物药技术创新中心、国家新一代AI创新发展试验区核心区、苏州超算中心、IT+BT融合创新中心、全国重点实验室及高校科研院所、龙头企业创新中心等,在学科专业、人才资源、成果转化等多个方面形成系统支撑。希望借本次大会东风,催生更多原创性成果和新业态新模式。
赵兴明
大会开始之后,复旦大学特聘教授、中山医院双聘教授、计算神经科学与类脑智能教育部重点实验室主任赵兴明,以《AI赋能的人体微生物组学数据挖掘》为题,首先做了开场报告。
赵兴明表示,2010年的《Nature》上,将肠道微生物称为人的第二基因组,与很多人类疾病密切相关。但如何以AI的方式,量化的角度研究微生物,科研投入力度还不够充分。
目前他所在的实验室已开发了宏基因组组装错误识别与矫正算法metaMIC,以及基于物种识别的Binning算法(Semibin),大大提高了组装准确率。
此外,他还揭示了健康人群中的肠道真菌结构以及四种真菌肠型,并进一步基于肠道细菌发现了两种自闭症亚型,开发了多个微生物组学数据库。
下一步,团队还将基于所开发的基因目录,进一步与国内外科研院所和临床医疗开展合作,探究微生物包括人体肠道微生物与人类生命大健康、大脑认知和行为等方面的影响。
黄铁军
随后,北京智源人工智能研究院院长黄铁军,以《高精度生命模拟》为题做了演讲。
黄铁军表示,今年是在智源研究院的第5年,一直在持续推进生命模拟研究中心的工作。2022年智源大会上发布了最高精度的仿真线虫,今年进一步投入到心脏模拟仿真工作中,同时启用“天河3号”超算计算机作为算力支持。
他进一步表示,今年3月,国外研究团队利用AI完整重建果蝇幼虫大脑已经取得里程碑进展,意味着未来绘制更多其他生物的大脑连接组,尤其是人类大脑终将成为可能。
陈红阳
第三位演讲嘉宾是之江实验室图计算研究中心副主任陈红阳,他的演讲题目是《大模型图预训练与GraphGPT的应用及展望》。
陈红阳表示,GPT直接用于生物制药领域存在一些不足,一是无法保证可信性、二是在特定领域表现差、三是成本高昂。
如Bert 和 ChatGPT 等,已在自然语言领域展现出了惊人的效果,但应用到生物制药领域则无法应对生物领域的非欧结构数据、生成结果准确性难判定,数据标签稀缺、如何融入领域知识,以及如何解决模型训练中的工程问题等。
目前团队正在构建融合领域知识的大规模分子生成预训练模型--朱雀图预训练大模型,应用于药物分子生成、靶点发现,性质预测等生物制药领域,并将其作为生物制药GPT 的核心基础,来加速药物发现和降低药物研发成本。
此外,陈红阳表示团队很早之前就开始在图机器学习和图科学计算领域布局,已成功研发了基于分布式内存计算的大规模高效图学习平台“之江朱雀”,该平台一站式赋能生物制药和生物育种等科学计算领域,通过软硬件协同加速来助力科学发现。
李健
上午主旨发言的最后一位嘉宾是亚马逊云科技大中华区首席医疗行业总监李健,他重点分享了《大模型时代生命科学领域的云端变革契机》。
李健分享了“云上大模型”的思路与解决方案。他表示,我们不认为一种模型或一种方法能够解决千行百业的所有问题。
作为云计算企业,我们一直在思考如何帮助客户从生成式AI获取研究与商业价值,不同研究机构和行业领域的公司如何低成本地接入大模型,高效率开发相应的应用。
一方面,亚马逊云已上线大模型开发功能,除了自研大模型外,还接入了业界公认的大模型,并提供定制服务;
另一方面,云上大模型还有一个优势,可以对客户数据进行安全、合规的数据调用和分析服务,这也是我们认为大模型应用和开发过程中,可能大家容易忽视的问题。尤其是在医疗和生命科学行业,患者数据和临床数据采集后,如何确保这些数据不被黑客攻击,不会出现不适当的使用,将是大模型时代的关键所在。
随后,在本次的“IT&BT融合创新应用论坛”中,在播禾创新中心总经理乐晓桐的主持下,复旦大学赵兴明教授、之江实验室图计算研究中心陈红阳副主任、亚马逊云科技李健、以及碳硅智慧创始人,CEO邓亚峰,围绕“生命科学大模型之路”进行了圆桌讨论。
后续,雷峰网《医健AI掘金志》将将邀请业内专家推出《医疗+GPT》新系列,敬请关注更多详细报道和专家访谈。
雷峰网 (公众号:雷峰网) 雷峰网
雷峰网原创文章,未经授权禁止转载。详情见 转载须知 。