药物发现中的数据科学、预测分析和人工智能
公众号/ ScienceAI(ID:Philosophyai)
编译 | 萝卜皮
Bülent Kızıltan 博士既是一名科学家也是一位企业高管,他通过将创业思维与卓越科学相结合从而推动创新。目前,他在诺华负责因果分析和预测分析的创新工作。以下是他关于药物发现中的数据科学、预测分析和人工智能的访谈内容。
制药中的人工智能和数据科学
Michael Krigsman:今天,我们谈论的是制药领域的人工智能和数据科学。我们正在与诺华(世界上最大的制药公司之一)的 Bülent Kiziltan 交谈。
Bülent Kiziltan:是的,我的职位是诺华的因果和预测分析主管。我们的部门叫做人工智能创新实验室。
我们所做的是推动诺华内部的人工智能创新,并将自己定位在学术界、技术和人工智能创新将真正发生的业务部门的交汇处。
我们正在努力招募不同的人才来建立卓越的运营;让来自药物开发和发现的领域专家参与进来,这样就可以重新发明一些流程,把挑战吃掉,使药物开发的成本尽可能降低。我们知道药物发现和开发在过去五到十年里一直在变慢,主要表现是成本的增加和研发流程迟缓,并且整个过程的规模化非常困难。我们希望人工智能来拯救我们,许多制药公司正在这个领域进行投资。
一般来说,人工智能和数据科学可以以两种方式之一运行。一种方法是用例驱动;在这些情况下,他们向业务部门提供服务。另一种情况是将我们自己定位在学术界(其中大部分兴趣和专业知识是在技术之间产生的,我们需要技术开发和基础设施来扩大规模)和业务部门。
一旦我们生产、掌握诀窍,将其应用到新的应用中,并得到我们的技术合作伙伴的支持,我们就会全力以赴。
Michael Krigsman:您在 AI 创新实验室的职责是什么?
Bülent Kiziltan:我是因果分析和预测分析的负责人。我们所做的任何事情几乎都与预测分析、数据科学或机器学习有关。但除此之外,我们还强调因果学习和因果发现,我们相信这是从数据中实现信息提取的下一个前沿。
但是,在数据科学领域,通常人们对这些团队的看法是:他们使用大数据,只要数据量有限,价值主张就会下降。我们希望确保涵盖从小数据到大数据的整个范围,因为这些术语的定义含糊不清,而且我们没有量化小数据和大数据的明确方法。我们已经建立了这些核心功能,可以从有限的数据中提取有趣的信息,直到我们的大数据都可以在预测中使用和利用。
Michael Krigsman:您能否让我们了解一下您在思考这些问题时,所采用的策略类型?你能带我们通过端到端的方式,来思考在制药中使用数据科学和人工智能这个问题。
Bülent Kiziltan:人工智能,一般来说,操作有一些有趣的限制。多年来,我们一直在阐明决定数据科学运营成败的主要参数是什么。与直觉相反,我们已经看到文化和领导力排在前两位。
直到最近,尽管我们正在分享我们的轶事经验,但我们并没有真正证明我们的数据经验是合理的。最近,我参与了一项全球基准研究,研究全球范围内的公司,成千上万的公司大小不一,来自不同的领域。瞧,我们已经看到文化和领导力对成功至关重要。
然后我们讨论大公司与小公司或初创公司的人工智能。所有这些运营渠道和优先事项都不相同。
在创业领域,与大公司相比,优先级、时间表、规则有很大不同。有固定文化的约束,不同的业务部门有不同的优先级,因此在大公司中有很多「跨业务部门」的讨论。
然后,当我们在制药和生物技术领域再增加一层复杂性时,我们开始谈论规则和数据隐私,这非常非常重要。我们非常重视这些。但是这些对操作造成了额外的限制,因为数据访问是第一,数据理解是第二。我们希望利用技术来消除运营中的瓶颈和障碍,所以这就是我们的起点。
Michael Krigsman:嗯,你提出了一个非常有趣的观点。您从文化和领导力开始,然后才进入数据主题。你甚至都没有谈论算法。
Bülent Kiziltan:我们反复看到的是,我们用于实地执行的技术介于标准统计和创新机器学习之间。
正如我所说,在更大的公司环境中,我们必须定期与领域专家互动。我们必须与不同的业务部门合作——工程部门和 IT 部门——他们的技术能力在取得成功、使项目工作和实地执行方面并不是最重要的。我们需要利用端到端管道的所有方面。
然后,一旦我们查看数据,我们通常会从小数据开始,然后逐步使用其他数据来丰富信息。这是一项艰巨的努力,从不同的流程中提取数据,甚至使用来自我们的合作者和合作伙伴的公开数据来增强信息。然后我们开始讨论逐步使我们的方法更复杂和准确,因为我们使用更复杂的算法和模型来查看它是否提供任何价值。
然后从一开始,我们就必须开始与监管机构和将使用该信息的单位进行对话。这会有用吗?这会受到决策者的制裁吗?整个数据科学和人工智能操作有多个角度。
Michael Krigsman:真的,技术方面——正如你刚才描述的那样——技术能力——我们可以说是促成因素吗?这是在您所做的工作中取得成功的必要条件之一?
Bülent Kiziltan:是的,你总结得对,Michael。绝对有必要推动人工智能和执行的前沿。但如果没有合适的领导和文化,人工智能的价值主张只是短期的。
如果你想长期维持价值主张,你必须围绕它建立一种文化或者一家公司。我认为我很幸运也很荣幸能加入诺华,因为我们已经建立了 unboss 文化——不是作为一种选择,而是要产生实在的影响,重新构想我们所说的医学。
制药行业的人才管理和多元化团队
Michael Krigsman:Bülent,能否跟我们谈谈你团队的组成。你怎么招聘?你雇佣谁?什么样的角色,特别是,你引进人才的标准是什么?
Bülent Kiziltan:人工智能创新,尤其是数据科学,是一个非常跨学科和多学科的领域。因此,我们希望确保我们吸引来自不同学科的人才,他们可以将价值和思维方式从他们自己的领域带入我们的运营中。
当然,数据科学和机器学习核心能力是必要的,但我们对所有背景都持开放态度。正如您和您的听众可能知道的那样,我接受过天体物理学家的培训,并且在我职业生涯的大部分时间里都在研究中子星和黑洞天体物理学。但在那个领域,我与应用数学家、机器学习先驱密切合作,将其中一些技术引入了当时的天体物理学领域。
从有限的数据中提取信息基本上就是我们所做的。这与天体物理学的领域知识相结合类似,这就是我们今天在医疗保健、生物技术和医学领域所做的工作。
我们非常清楚,多样性不仅是一种选择,而且还是在 AI 领域开箱即用和创新的必要条件。目前,我们显然正在壮大我们的团队并寻找能够引入机器学习所需的核心能力的人才,但他们可以来自物理、数学、心理学。我曾与来自社会学、经济学的人一起工作——只要你能说出它的名字。
Michael Krigsman:多元化团队的概念,将来自不同学科的不同背景的人聚集在一起,听起来像是实现目标的基础。
Bülent Kiziltan:是的,绝对。我们当然可以通过同质的人才库在适当的水平上运营和执行,但我们一次又一次地看到,多样化的人才带来了非常有趣的想法,这就是创新发生的地方。所以,多样性是必须的。
Michael Krigsman:我们有一个来自 Twitter 的问题「每个人都在谈论文化,这不是障碍就是机遇。如果每个人都知道这一点,那么为什么文化如此困难,您如何看待文化,指标是否起作用?」这是文化问题,你如何解决这个问题,因为你说这是一个基本的构建块。
Bülent Kiziltan:是的。全球有许多基准研究,不幸的是,在公司中,文化无法自下而上地改变。这是我们所看到的。
它必须从最高层获得授权。因此,除非您拥有一家有利于数据科学运营的公司,否则这主要是一项跨学科的努力。如果公司不是数据驱动的,它在决策过程中只考虑轶事经验。很难克服这种惯性。
当然,可以在非常传统的公司中运行数据科学业务。您的决策者已经在该领域工作了 15、20、30 年,但他们并不欣赏数据驱动的决策,而在我们公司,我必须再说一遍,我们非常荣幸拥有这种心态。
我们正在发展成为一家数据驱动的公司。所有决策都是数据驱动的,这就是为什么我和我所在组织的团队跨越各类障碍,不仅与药物发现和开发互动,而且与所有部门互动,包括金融,包括制造——你能说出它。自上而下的文化赋权至关重要。
Michael Krigsman:谈谈领域知识。我认为很明显你需要掌握数据科学、机器学习等方面的技术,还是科学领域知识、生物学、化学等等呢?
Bülent Kiziltan:没有他们,我们就无法运作。没有领域专家,我们就是盲目的。
创建这种界面是我的职责之一,将团队聚集在一起进行互动和相互理解。语言差异是障碍之一,因此作为运营的一部分,我们所做的就是真正倾听领域专家提出的关键问题,并尝试将其翻译成数据科学语言,以便我们能够构建 分析路线图,将数据科学操作结合在一起。
节奏显然必须根据您正在交互的单元进行定制,以便有很多跨学科的交互。这是有时数据科学操作不那么成功的地方。在这里,领导层会使用双方的语言,以便制定一个您可以执行的成功路线图。
Michael Krigsman:您在招聘时会关注哪些特征?
Bülent Kiziltan:多元化的背景当然至关重要。众所周知,制药领域非常保守,需要生物学和医学领域的专业知识;这肯定会增加运营成本,但我们基本上从各种背景中招聘,适当权衡。
如果他们拥有非常强大的机器学习工程背景,那么 IT 背景确实起着至关重要的作用。生物医学知识背景的人,他们是否使用我们正在开发或使用的一些算法;这些都将进入决策过程。
我不能告诉你我们正在寻找这个或那个。我们正在逐案研究整个面试过程。
软技能同样至关重要,正如我所说,当我在课程中与学生进行演讲时,当他们问我应该投资什么时,我有时会强调这一点。他们期待我谈论 Python(这样我就可以学习一些必要的技术)。我说,「你知道在技术领域该做什么,但你可能不知道的是投资你的软技能,」因为与领域专家交流,仔细理解和倾听才能真正理解问题至关重要。
我会告诉我有技术倾向的朋友。倾听并不总是我们的强项,所以我们真的需要倾听、理解、同理心,从 360 度的角度看待整个问题,以便执行和取得成功。
如何管理多样性。
Michael Krigsman:你让来自不同领域的所有这些人一起工作。你如何阻止他们互相残杀?
Bülent Kiziltan:我会说,有时你会牺牲自己去成为领导者。从这个意义上说,我一直很幸运。但有时你会进入一个更广阔的领域,那里的人肯定来自不同的背景、不同的文化。
然后,作为领导者,我们只有软实力使对话朝着正确的方向发展,但从这个意义上说,我非常幸运。到目前为止,还没有人互相残杀。从这个意义上讲,真正引导对话的责任落在领导者身上,使用软实力专注于问题而不是使其个人化。
在药物发现和精准医学中使用人工智能和数据科学
Michael Krigsman:您能否让我们深入了解您正在解决的问题类型?显然,我不是要您分享机密信息,而是要帮助我们了解您正在解决或试图解决的问题的性质。
Bülent Kiziltan:这些显然是更大的生物技术和医疗保健行业面临的问题,我们如何定制药物和治疗?我们相信,这种大规模的定制只能在人工智能的帮助下实现。
精准医疗是每个制药公司、生物技术和医疗保健公司的一个重点领域。利用在人工智能领域开发的技术至关重要。它肯定会重新定义整个领域。
其他领域是我们开发和发现化合物和药物、生成化学(更具技术性)的地方。这是一个人工智能和机器学习正在产生影响的领域。有很多公司利用数据科学、人工智能和机器学习来增强开发过程,同时也发现了新的化合物。
同样,以前这些只能在实验室中完成。这是一个艰苦、短暂、艰难的过程。有了人工智能,我们或许可以在计算机上以计算机方式完成这一切。我们可以提出一个化合物的优先列表,然后与领域专家讨论我们发现的内容是否有意义。
Michael Krigsman:Lisbeth Shaw 提出了一个非常有趣的问题。她(在 Twitter 上)问道:「因果分析和预测分析将如何影响治疗方法的发展并最终影响患者护理?」
Bülent Kiziltan:作为一个领域,因果学习和因果发现尚未与机器学习融合。
我们正在与该领域的先驱者建立合作伙伴关系,以利用该技术在化合物层面或患者层面发现新的因果关系,因此我们可以使用精准医学来定制治疗方法、剂量。当涉及到生物医学时,它将渗透到开发和发现过程的所有部分。
Michael Krigsman:从广义上讲,您非常关注的两个领域是精准医学(使用数据科学和人工智能),然后是药物发现,试图发现新分子或设计新分子,这是否公平?
Bülent Kiziltan:这是探索部分。是的,我们非常参与其中。这些是我们的主要关注点。而且,我们正在授权整个公司的员工将他们转变为公民数据科学家,以便他们可以在所有决策过程中使用数据,不仅在药物发现和开发中,而且在整个公司中。
Michael Krigsman:把你参与其中的原因联系起来。我不想过多地将重点转移到这里,但我倾向于将其视为 IT 任务,而不是 AI 创新实验室活动。
Bülent Kiziltan:是的。IT 绝对与我们的工作密切合作。没有他们,我们就无法生存。他们处于技术和基础设施方面,这对于扩大技术规模至关重要。
但是我们计划做什么和打算做什么,背后的大脑与机器学习、统计(从小数据到大数据)有关,这取决于我们使用的复杂程度。围绕汽车的大脑和引擎是数据科学和人工智能,而基础设施(汽车本身,也许是轮胎)与 IT 协作,因此我们可以将汽车放在路上,我们可以驾驶它。
Michael Krigsman:您正在考虑端到端流程,不仅仅是您在做什么,而是您在更广泛的背景下的位置。
Bülent Kiziltan:是的,如果没有这个愿景,人工智能就无法孤立地生存。这就是为什么一些人工智能操作长期未能产生价值的原因,因为它们被孤立了。他们还没有与不同的业务部门建立这种节奏和互动。这就是软技能、战略思维发挥作用的地方,以维持人工智能运营的价值主张。
药物发现和精准医学的挑战
Michael Krigsman:您在药物发现和精准医学方面面临哪些挑战?
Bülent Kiziltan:尽管我们拥有非常多样化的人才库,但有时要跟上领域内的前沿问题确实具有挑战性。
这就是为什么我接手并试图做出贡献的任务之一,与那些研发驱动的和学术机构建立接口,以了解该技术的长期愿景和路线图以及它的发展方向。跟上技术的发展方向非常困难,但我认为我们在这方面也做得非常好。
然后在执行方面,总是存在内部惯性和瓶颈,这取决于一个人所从事的领域。当然,制药和生物技术领域,我们不乏瓶颈和痛点,我们团队正在努力解决这些问题。
Michael Krigsman:您和您的团队面临哪些挑战?
Bülent Kiziltan:与不同的业务部门合作,确实需要时间来了解问题。将这个问题转化为数据科学可理解的问题和可量化的问题需要一些时间,有时会很痛苦。
我认为我们已经在内部达到了一个最佳点,我们拥有一个有效的管道;我们可以在其中进行交互、转换、推动创新并在实地执行;我会说我们在内部非常幸运。
在外部,我所看到的,在人工智能操作中,人们有强烈的意见。但我们必须意识到,在数据驱动的环境中,这些强烈的意见必须每周集中解决一次。这意味着,我们必须更新我们对战略的看法,并定制和适应传入的信息。有时,我们并不经常看到策略正在适应新的传入信息。
Michael Krigsman:Bülent,你提到了大数据和小数据。也许可以为我们详细说明。
Bülent Kiziltan:总的来说,人工智能正在从以模型为中心的操作转变为以数据为中心的操作,并且必须围绕可用数据来制定策略。通常情况下,特别是在医疗保健领域(包括生物技术和制药领域),我们介于小数据和大数据之间。
作为数据科学运营,如果您的所有核心能力都面向大数据,那么您可能会在某个时候变得过时;因为您有一把锤子,并且您试图基本上相应地制定每个问题。鉴于我们的运营和我的团队,我们拥有从标准统计学、应用数学、基础统计学到标准机器学习、创新生成学习、一直到对比学习,甚至更多的核心能力。我们不仅试图通过深度学习或机器学习更广泛地从数据中提取信息,而且我们希望查看可能可用的信息的整个范围。
通常情况下,创新实际上发生在小数据周围,我们如何获得额外的信息,然后通过模拟或公开可用的数据使用更大的数据来实施、创新和扩充所有这些信息。但这是一个渐进的过程。
Michael Krigsman:LinkedIn 上的 Cindi Howson 指出,文化仍然是数据驱动的最大障碍。你已经详细说明了这一点。非常有针对性,你如何在你的团队中克服这一点?
Bülent Kiziltan:我很幸运,我们的公司和团队是数据驱动的。但我们所看到的,往往是,我们需要作为一个团队和一个组织,始终踏上一段旅程。
总是有相互教育,我们都需要保持开放的心态,一起踏上这段旅程,无论是数字化、数字化转型之旅,还是数据驱动。这是所有利益相关者都必须成为合作伙伴的文化之旅。
诺华如何围绕人工智能意识吸引社区
Michael Krigsman:我们还有一个来自 Twitter 的问题。Diana McKenzie——曾经是 Workday 的 CIO,现在她是多家生命科学公司的董事会成员,她是 CXOTalk 的嘉宾——说:「你有没有采取任何独特的方法来教育和吸引更广泛的团队?通过提供对 AI 方法的访问和理解来帮助诺华的员工?」
Bülent Kiziltan:这是我们需要踏上的旅程。这正是我的意思。
我们需要并且正在为整个公司创造机会,不仅让从事数据科学和生物信息学的员工参与进来,还让决策者参与进来。我们与决策者就我们做什么、如何做以及我们从小数据一直延伸到大数据的核心能力进行了大量一对一的对话。
但我们也有内部会议,我们参与的会议。我们有集群会谈。我们紧跟最新的技术。
我们内部有很多机会。这些对于成为该旅程中的有效学习者至关重要。
Michael Krigsman:我有一个后续问题要问你。你为什么这样做?为什么整个公司的人都必须拥有人工智能方面的专业知识?
Bülent Kiziltan:人工智能和机器学习只是推动数据驱动决策并了解与之相关的风险的一种手段。我们可以在整个决策过程中适当地量化风险,而不管我们与什么单位交谈。
我们正在努力重新构想医学,为患者提供治疗方法。我们想加快这个过程。我们希望定制我们的疗法和剂量。我们要帮助病人,为社会做贡献。
所有这些都与我们做出的决定以及与之相关的风险密切相关。机器学习在真正量化并为我们提供对所涉及风险的真实预测和预测方面做得非常出色。它帮助我们在决策过程中利用该风险预测。
这与领域无关。它可能与制造、财务甚至生物研究有关。但是机器学习是一种神奇的技术,可以帮助我们扩大决策过程、吸收信息,甚至将来自不同领域的信息结合起来。这些领域不一定是同质的,这是机器学习可以帮助一个领域的决策者。
Michael Krigsman:这听起来像是拥抱更广泛的社区可以帮助您的团队不仅专注于研究问题、抽象研究问题,而且还关注将最终成为市场产品的产品交付的实际现实。它可以帮助您保持联系。
Bülent Kiziltan:当然。创新可以通过两种方式发生。其中之一是开发这些算法。而且,根据定义,创新发生在有新应用的时候。我认为,在频谱的两端断开连接会扼杀人工智能的价值主张。
我认为,扎根、同时执行、了解前沿并为人工智能领域做出贡献至关重要。有一种循环,你为领域做出贡献,吸收一些技术,在实地执行,提出新的问题和数据集,然后回到领域专家那里并结合这些信息,以便保持创新循环。
管理数据科学和人工智能中的偏见
Michael Krigsman:我们还有一个来自 Twitter 的问题。想了解数据中的偏差。您如何处理具有固有偏见并可能扭曲决策以及对团队产生偏见的数据?偏见问题,你如何解决这个问题?
Bülent Kiziltan:是的,这是一个活跃的研究领域。我们聘请来自不同学科的领域专家来尝试解决这个特定问题。可能存在抽样偏差,可能存在算法偏差,可能存在数据驱动的偏见。
这些都是我们需要尽早解决的问题。一旦我们提出预测或预测,我们就会采取某些步骤来确保我们不会偏向于影响决策的水平。
但我必须说这是一个积极发展的领域,我还没有看到一个强有力的、量化的观点和方法来帮助我们解决这个问题。它必须逐个用例进行处理,我们需要(并且我们正在)逐步解决其中的一些问题。但这是一个很好的问题。
基于实验室和基于人工智能的药物发现方法之间的区别
Michael Krigsman:所有这些与传统的药物发现方法有什么不同?
Bülent Kiziltan:我们的同事一直在实验室不知疲倦地工作,试图手动生产(与化学家合作),试图提出新化合物,然后逐步将其应用于细胞并观察(在显微镜下)它的行为方式。根据他们想要的属性,这是一个非常手动的过程并且很难扩展。
这是机器学习和人工智能正在帮助的问题之一,即扩大规模并使该过程更快。通过这样做,我们已经消除了化合物生产和发现过程中的一些障碍。
现在我们还可以用技术做的是在计算机中提出新的化合物,然后提出具有预测特性的化合物列表。然后与我们的化学家、领域专家交谈,真正尝试(如果有意义)其中的一些化合物。已经有公司证明,那些在计算机上生产的具有预测特性的化合物确实存在,因此我们基本上也在这个新的发现领域取得了进展。
Michael Krigsman:您如何与使用传统方法工作的实验室人员合作?有异花授粉吗?你会如何合作?
Bülent Kiziltan:显然,我们在集群内召开了会议;我们交换想法,根据我们正在解决的问题,我们召开了这些会议,因为其中很多是为了解决问题、了解问题并推动事情向前发展。是的,一对一的互动仍然是推动事情发展的唯一途径。
向商业领袖提供有关管理 AI 团队的建议
Michael Krigsman:您能否向希望将这些经验教训应用到自己的业务(无论是医疗保健还是制药业)的商业领袖们分享一些建议?
Bülent Kiziltan:这些 AI 策略和经验无法在任何地方应用。战略必须根据运营、优先级、文化、运营的瓶颈和障碍进行定制。
我们不可能有一个可以应用于多个方向的策略。有经验的领域专家必须去分析问题是什么,分析操作结构,并相应地提出建议。对我的建议持保留态度,但这些都是不断发展的,应该动态适应任何公司环境。
Michael Krigsman:企业领导者应该如何决定哪些问题适合可能有解决方案,或者您可以使用这些技术来取得真正的进展?同时,您应该远离哪些问题?
Bülent Kiziltan:数据是关键。了解数据、可获得哪些信息是制定战略决策的关键。
有时,你可以拥有一群非常有才华的研究人员,但如果没有信息,他们就没有魔杖来提出与之相关的不确定性的预测。了解您有哪些可用数据——如果没有,则将这些数据引入,记录高质量数据——是第一步。
Michael Krigsman:我们还有一个来自 Twitter 的问题,还有来自 Diana McKenzie 的问题。她说:「是否有人成功地为人工智能算法申请了专利,用于推进发现研究或临床开发中的治疗方法?」
Bülent Kiziltan:是的。专利算法是一个活跃的讨论领域。我知道已获得专利的算法,而且我知道公司在这方面有不同的偏好。此外,在人工智能领域,先驱们一直在讨论这些专利的含义,但已经有专利算法,而且随着我们的前进,数量还在增加。
Michael Krigsman:回到选择问题的问题上,您能否进一步详细说明?你说数据是关键。用数据科学和人工智能研究一个好问题的其他特征是什么?
Bülent Kiziltan:我们必须根据公司的优先级、部门以及团队关注的影响领域来定制我们的方法。有各种各样的参数进入决策过程。
此外,您拥有什么类型的人才,您的核心能力是什么,您将如何踏上这段旅程。我们有强大的技术合作伙伴吗?我们是否拥有 IT 基础设施?
数据是第一,然后基础设施是第二。与领域专家交谈以确定一些影响较大的问题,是我个人对与领域专家合作感到非常兴奋的地方;因为我们希望对社会产生影响,我们希望改善患者的生活。
我们知道我们在生物技术和制药领域的不足之处,因此我们坐下来确定关键临床问题的优先级,以便根据我们拥有的基础设施和数据,真正了解我们可以解决的问题是什么。为社会做出贡献,与我们的患者一起为更好的生活做出贡献。然后为人工智能领域做出贡献,这也是我们的重点领域之一。不仅专注于我们自己的领域,而且回报于人工智能领域,因此我们可以成为推动技术前进的一个社区。
Michael Krigsman:数据、基础设施和领域专业知识,这意味着问题的选择取决于已经构建的相当复杂的基础设施。
Bülent Kiziltan:是的,这是一项艰巨的努力,Michael。从外部很难理解,但是建立能够有效地相互交流的基础设施,数据从不同的领域流入;在这个领域有很多法规,这是一项艰巨的任务。我们很幸运能在内部和外部拥有出色的合作伙伴。
Michael Krigsman:Bülent,当我们结束时,关于这个领域的任何最终想法,你工作的领域,你想分享吗?
Bülent Kiziltan:我曾经有机会与该领域的先驱们聚在一起。就在 COVID 爆发之前,我们在哈佛大学接待了来自 Facebook AI 的 Yann LeCun,他就基于能量的算法以及他们一直在做的一些工作发表了演讲。
我们正在讨论人工智能如何使用我们在天体物理学和物理学领域开发的一些方法。随着岁月的流逝,我期待先驱者能够对哪种模型更适用于某些数据集和问题产生一种直觉。
我至少遇到和经历过的情况恰恰相反。大多数时候,我们在架构中找到创新方法的地方是我们期望架构产生最弱预测能力的领域。
人工智能和机器学习领域的事物并不总是直观的。一些为大数据集开发的算法实际上也可以在小数据体系中工作,但需要大量人工干预,有时无法改进。
必须发生的传统统计学家和创新的机器学习研究人员之间存在很多交叉影响。事情并不总是直观的,这是解决任何问题时要牢记的观点。
这就是为什么我和我的团队正在努力建立一个核心能力,我们可以从标准统计、应用数学到下一代机器学习技术的各个方面控制能力。我们逐步解决问题,并在此过程中进行基准测试,并查看我们可以在哪里生成业务合作伙伴或领域专家可以使用的有趣信息。
Michael Krigsman:所以你一开始就说解决方案不仅仅是技术,而是所有这些不同的专家、不同的团队之间的所有这些部分(领导力、文化、沟通)的整个端到端链 ,正如你所描述的。
Bülent Kiziltan:当然。这是一个生态系统,Michael。这就是为什么文化和领导力至关重要的原因。我们需要的领导者至少能够理解技术的复杂性和价值主张,同时也了解来自各个部门的敏感性,并让我们能够在此过程中成为数据驱动型并与外部合作伙伴互动。
再次强调,这是一次团队之旅。我们需要一起踏上这段旅程。我们为彼此创造价值,一加一大于二。
孤立的人工智能(或任何其他过程)并不能提供我们可以共同生产的长期价值主张。
结语
Michael Krigsman:好的。我认为我们今天的时间即将结束。Bülent Kiziltan,非常感谢您与我们分享您的专业知识,我们真的很感激。
Bülent Kiziltan: 谢谢你,Michael。很高兴与您和观众重新建立联系。
Michael Krigsman: Bülent,谢谢你今天和我们在一起。各位,谢谢收看。
原文内容:https://www.cxotalk.com/episode/data-science-predictive-analytics-ai-drug-discovery-novartis
相关报道:https://www.zdnet.com/article/managing-ai-and-data-science-practical-lessons-from-big-pharma/