新闻动态

听见我们的声音

精彩摘录

俞声:“ 从医院信息口给我们的反馈,就目前这个时间段,信息化比智能化更能帮到医院。如果绕开信息化,在基础的自然语言处理做得不是很好的时候可以做智能化,但是有天花板。医疗行业样本量小的情况会高度制约你所做模型的性能。”

温书豪:“ 以后的药物研发不应该主要靠人的经验、靠实验的试错,我认为应该有新的药物研发范式:通过很多准确的算法、调动巨大的计算资源进行计算、实现规模化、自动化甚至机器人做药物研发。”

邓侃:“ 医疗行业有着巨大的市场机遇,从业企业需要更加专业、更加专注。海量的真实临床病历数据同样是一片巨大的价值红海,这里面有学术价值,有社会价值,也有商业价值,就看企业如何围绕其构建一套具有前瞻性的商业模式。”

谢育涛(左一)、俞声(左二)、邓侃(右二)、温书豪(右一)

 

以下文字经大会现场分享内容整理而成:

 

医疗创业路上的思考

谢育涛:温总做制药的,请您讲讲人工智能对生物医药方面能起哪些作用?有没有发展性?

温书豪:我们做人工智能药物研发,人工智能对药物研发有两个很重要的作用:一、大大提升药物研发的效率,降低药物研发的成本;二、它可能想出一些人想不出来的药,做出人做不出来的药。我们认为以后的药物研发不应该主要靠人的经验,靠时间的试错,我们认为应该要有新的范式通过很多准确的算法——可以是物理,也可以是人工智能,用巨大的算力调动庞大的计算资源进行计算。通过规模化、自动化甚至机器人完成药物研发,这才是新的药物研发的范式。

谢育涛:请侃博讲讲数据对 AI 医疗有没有发展性?

邓侃:我创业之前负责国内主流搜索平台的搜索引擎,发现有关医疗类的搜索量占据平台差不多 1/3 以上的流量,这个量很大。当时,我也产生了一个困惑:一方面这个产品在社会上曾收到了那么多的负面评价,但另一方面大家仍然非常频繁的使用这个产品,这是为什么呢?我个人认为这个需求已经成为社会普遍的刚需。我国医疗领域存在着优质资源相对稀缺且分布不均的现象,AI 能够学习真实世界的临床病历并分析大量临床数据,提高医疗效率及普惠性,为健康中国的建设赋能。

AI 医疗研究信息化的思与辩

谢育涛:请俞博从 AI 医疗研究的角度讲讲,我们应该怎么思考信息化,包括落地的时候有什么需要注意的事情。

俞声:昨天沈向洋理事长提到医疗和其他行业的情况,总体来讲分两层,先是信息化,然后智能化。从医院信息口给我们的反馈,就目前这个时间段,信息化比智能化更能帮到医院。这块信息化主要指患者专业的表型提取,Phenotyping,基本意思是提取患者的基本临床特征,把它作为机器学习的特征,还有像患者搜索等,这些我们一般统称为“病历结构化”的自然语言处理任务。

从研究角度也有这个问题,如果绕开信息化,在基础的自然语言处理做得不是很好的时候,你能不能直接做智能化?这个硬要做肯定可以做,但是有天花板,性能绝对有限制。原理非常简单,当没有提取比较高信息价值的基本特征,要从原始自由文本/噪声文本中提取一点信号,它要求你必须要消耗更多的样本。深度学习本来特别吃样本,医疗的样本相对很多行业又特别少,因此(消耗更多样本在原始信号提取)会高度制约你所做模型的性能。

另外,像医院的信息部门要部署的模型不只是一个,有几十甚至上百个,因为他做的不只是诊断,诊断也分不同的模型:简单的分类模型、罕见病的识别模型、强化模型,还有对于治疗推荐的各种各样模型。如果一百个模型在每个患者身上重复识别发热,如果我是信息科主任我是绝对不允许这样的系统上线,这会造成系统负担过重,导致落地十分困难。

现在说信息化做得不好,这对于中英两种语言原因不太一样。首先英语比中文难,英语缩写的随意性以及首字母缩写的一词多义现象极其严重,中文至少在构词上是远超越其他语言的。这是我在美国做了好几年电子病历处理以后的感受,我本能地不想碰英语病历。中文的困难和英语不一样,中文语言有天然优势,但是比美国缺少开放的医学术语系统,这里的关键词是“开放”。这是公共的基础设施,也就是所有的医院、学校、IT 公司都需要从零基础自己建自己的数据系统,这是非常不现实的。这给我们造成非常大的困难。所以近些年回国以后,我把主要工作精力转移到建设开放的医学术语系统和知识图谱上,同时也非常有幸和 IDEA 合作建立这个公共的基础设施。

邓侃:我们处理过 12.7 亿份中文的真实临床电子病历数据。这些临床病历设计初衷是面向记录,而不是面向汇总研究和价值挖掘。中文病历文本内容相对于英文病历有着很大的不同,中文文本自身在识别上比英文难度更大,直接将病历中的中文信息放到计算机里无法进行任何形式的计算,所以首先要做的是结合医学术语和医疗标准规范实现数据标准化、结构化,这就需要强大的数据处理技术和 AI 技术能力。

谢育涛:提到信息化到智能化的过程,听上去信息化是非走不可的道路,这条路很多问题待解决。往智能化方向走有哪些不同的挑战?

邓侃:现如今,信息化已成为构建现代医疗的基础设施,而智能化则会为医疗业务带来更多的可能。我们首要思考的是在国内优质医疗资源不均衡的背景下,如何借助 AI 技术,为人们创造更便捷、更科学、更有价值的医疗服务模式。刚才讲到 Eric Topol,那就是我们正在做的事情。目前国内优质的医疗资源分布不均衡且医患之间存在着不信任,反而给国家带来突破的机会。患者越来越有意识的想知道他们所患的到底是什么病,要如何治疗。

我和大家说一个故事。国家卫健委在全国四个县做了四个试点,其中有一个叫山西永和县。我们去了之后发现永和县人民医院的楼盖得非常好,里面的医疗设备先进、齐全,但因为没有好医生,所以病人也不多,由于病人少,因此好医生留不住,整个现状就进入了非常快速的下旋状态。

当时有位专家给我提了一个建议,目前大家有两个共识:第一,所有永和县的老百姓都承认医院的设备是好的;第二,老百姓内心对医院的医疗水平是有点顾虑的。那倘若永和县人民医院把自身化作为操作工,就是做化验、抽血、验尿,还有拍片等工作,拍片之后把客观数据上传,传输给北京、上海等地的权威医院,由那边的权威专家给出诊断和治疗方案。我们做了一些类似的尝试,效果不错。

AlphaFold 能否为制药领域带来真正突破?

谢育涛:DeepMind 开源的 AlphaFold 现在很火,想请几位嘉宾谈谈 AlphaFold 是否有可发展性?

(温书豪:AlphaFold 迈出了非常重要的一步)

温书豪:我们还是用事实说话,以结果为导向,这次 DeepMind 做的 AlphaFold 对蛋白结构的预测达到很好的效果。虽然我认为这离最终通过 AI 把药物做出来还是有点距离的事,但是 AlphaFold 迈出了非常重要的一步。药、人,都是原子、电子组成的,药物要发挥作用,其实是药物分子和人体的蛋白发生作用,是物理学计算相互作用的范畴。AlphaFold 也是一样的,它有基本的底层逻辑可循,有很多物理的模型来理解在怎么样的条件下,这个蛋白会处于稳定的状态和结构。它是数字化或者人工智能的基础,或者以后会以越来越准的基础跨过一个阈值。

这次 DeepMind 用了几百个 TPU,算力也是达到了过去没有的状态,底层逻辑是清楚的。后续因为生命科学是人工智能领域里面大家最关注的,人才、资本都会往里面涌,会不断地有新的算法涌现。我觉得进展是非常确实的,再加上未来会有更多的硬件和 AI 的突破,动力学的模拟,用人工智能开发做药物,我相信是指日可待的。

谢育涛:昨天沈向洋理事长讲创新有科技创新、产品创新、模式创新,最重要的是科技创新。我觉得 AlphaFold 在这个领域往前走了很大一步。AlphaFold 是做生物、蛋白质,和温总做的药物是同一类事情吗?

温书豪:药物行业链条特别长,AlphaFold 在最源头去理解导致疾病的靶点,这是很重要的。做药首先要有靶后面再有箭,很多抗体的药物也是蛋白结构,AlphaFold 确实在靶点的发现、对于将来抗体药物设计,跨出很重要的第一步。我们做的事情是如果给一个靶点,后面构造一套系统,最快帮你把小分子抗体或者多肽药物做出来,包括机器人做药物,构建很多数据和算法,与实验反馈相辅相成。

谢育涛:我想听听侃博和俞博对于这个领域有没有一些看法,AlphaFold 有没有道理?

邓侃:俞老师、谢老师都做知识图谱,我们也做了一些尝试,做了之后发现一个很重要的问题:疾病和症状之间有什么关系?目前只是数量的相关性,一个经验性的东西。假如说我们能把下面整个深化的信号通道、逻辑关系挖掘出来,那这一定是个绝对革命性的东西。

俞声:总体来讲,药物这块我完全没有学过,我不能妄评 AlphaFold 有没有道理。像刚才侃博说的,像药物的各种通路,如果让人脑去想,需要很庞大的知识,这个行业学术门槛很高。从知识图谱的角度能做的可能是(建立)一种高度专业化、高度特异化的学术性的知识图谱,可以作机器预测模型的骨架,作为一种引导告诉研究者哪个方向能形成一些突破,我觉得这是有可能的。

谢育涛:侃博讲到一个地方我在想,症和治之间的关系要打通,个人有什么能力参与?我关注到有位教授提到一个概念 IAP,Individual Activity Participant-个人积极参与,因为我们看病基本都是医生讲讲就自己决定,要不要吃药、要不要动手术医生说了算,能不能以某种形式知道我的情况,不仅是知情权,还有参与判断的权利,对打通这件事有没有帮助?

(邓侃:未来的医疗或许掌握在患者手里)

邓侃:很有意思,谢老师提到的人叫 Eric Topol,这个人写过两本书,一本是《颠覆医疗》,做智慧医疗的人基本都看过这本书;第二本是《未来医疗》,其实原名比较具象、生动,叫《患者正在盯着你》,副标题是说“未来医疗在患者手里”。中国医疗优质医疗资源分布不均,以及前几年对于医疗机构的监管力度不够,随着人们对医学认知水平的提高,导致了医患之间的信任被削弱。因为患者没那么相信医生,患者更关心自己的医疗方案是不是准确。AI 能够在健康管理、医疗影像、辅助诊断等多场景赋能医疗行业,助力医疗领域的效率提升和供给侧改革。在这种背景及多方面因素的促进下,中国或许能在智慧医疗领域成为世界领先。”

获取医疗数据信息的挑战?

谢育涛:我在医疗领域的尝试中经常碰到一些困难,很多数据不能获悉。包括做 AI,我和俞博做图谱都会遇到数据隐私、数据保护、个人的信息等问题,这是数据方面的挑战。另外我们在算法方面也有挑战,还没有完全解决,用于调参的数据准备量可能不够。刚才讲到数据的事情,没数据没法做 AI,而又有健康数据使用权的问题,我们聊一下这个相对不太清晰的问题。

邓侃:我想澄清一个概念,我们说患者隐私、数据隐私保护,这其实是两个不同的概念发生了混淆。我们要在医院信息安全体系架构下,保证原始数据不出医院,将病历信息进行脱敏和分离,捍卫医疗数据安全,保护患者隐私。

谢育涛:有些事实数据和诊断数据处理的方法不同。对 AI 技术的发展来讲,制药领域有没有这方面的数据隐私或者获取的问题?

温书豪:我发现产业界现在越来越 Open(开放),在制药领域里面,比如我们的客户是欧美一线大药企,与我们建立开放互信的合作关系,晶泰科技过去已加速上百款管线药物。为什么信任我们呢?

第一,早期我们做很多数据模型,通过使用 AI 他发现很准、很好用,建立了基础的商业信任。

第二,产业界的结构、思维都在变化。很多大药企是这么想的:通过规模化的研发项目打磨了算法,你做了平台,再给 100 家公司用,后面还有 100 家 VC 投资它,对他来说是划算的。现在药物行业越来越专注,每个人做好自己专攻的事。

第三,大家觉得研发各种方式来分享数据之后,对于整个产业界是好事,大药企变得越来越投行化,把自己的优势发挥出来。

所以我说整个产业的思维方式也更加 Open,更加专注自己擅长的细分领域。

谢育涛:医药、生物制药和大数据健康对数据直接需求的程度有些不一样。从研究的角度,像俞博做研究也需要一些数据,这个对数据的需求和隐私的保护是不是有不同的需求或者考量?

(俞声:健康数据需要被合理使用)

俞声:从我们这种科研类型的角度,需要用到的数据和侃博差不多,而且刚才侃博提到一个概念特别有启发,数据的隐私可以分成关于患者的隐私和关于医院的隐私。我记得某个法规有一个说法,“信息的物权是归信息描述的对象所有”。凡是不涉及医院隐私的部分,仅仅关于患者的隐私,在安全的环境下,如果能够拿出来,或者医院愿意在安全的环境下分享一部分——这个数据可以不脱离医院,或可以只是进入患者个人的账户——即使这部分拿出来也是非常有帮助的,可以解决很多事情。

踩过前坑,乐看未来

谢育涛:借这个机会想问问两位创始人,你们都是独角兽企业,创业中肯定有很多艰辛,有没有踩过的一些坑可以跟我们分享下?

温书豪:我 2015 年开始做晶泰科技,早期经历过很多困难的阶段,回到国内后,我和我的合伙人到上海张江生物医药园跑了快半个月,跑了 30 多家公司,没有一家答理我们。那时候中国是以仿制药为主,他说实话:“我们是小米加步枪,你给我装狙击镜也没用”。后来我们转变策略,往欧美一线大药企看,再后来拿到欧美一线大药企盲测机会,利用算法来预测药物的某些重要性质。

做 AI 药物研发或者做算法往药物行业走,很好的模式是早期的产业界的驱动,而且越是标杆型客户的意义越重大,因为很难做。后面发现如果跟的是欧美一线,排名第一的大药企,因为他们有足够多的管线,他们的数据标准、安全标准、准确度标准非常高,只要做通以后,在整个药物行业更容易打开局面,其他的企业客户就不会问同样的问题。

我们花一年半的时间做到研发,在一年半最后三个月拿到盲测,经过两年时间才拿到 0 到 1 的客户。中间很多国内的药企只是观望,我们也考虑过转型,很多不如意,但是还是坚持下来,没有轻易转变方向。

邓侃:我们的立足点是用自然语言处理的技术来处理真实世界的临床病历。医院信息口的预算,如果按照排名来看,现阶段可能在整个医院各个口的预算排名很靠后。虽然目前医院在该方面的投入不算高,但我们仍然会继续坚持。随着国家医药体制改革的深化,对智慧医疗产品与服务的需求将会不断增长,AI 技术在辅助诊断、深度提升医疗质量方面的产品价值已经得到了社会的阶段性认可,已成为医院信息化建设的未来方向。同时,我们也在挖掘 AI 在健康管理的应用潜能,借助海量真实病历和科学的临床路径,实现常见病种患者从院内到院外的全病程管理。

谢育涛:前面讲到有很多热钱进来,有很多研究在发展,真正做的时候有很多困难,想请三位嘉宾劝慰或者鼓励下,无论是做研究的创业者,还是对这个领域很有兴趣的一群人。

温书豪:我们公司做 AI 药物研发有四五年时间,我们看到人工智能与生物医药产业的结合是不可逆转的趋势。我觉得这个市场足够大,两个万亿级的产业,算法给药物行业带来很多规模化效应。欢迎更多 AI 领域的创业者可以进到行业里面,里面有巨大的机会。

邓侃:医疗行业有着巨大的市场机遇,从业企业需要更加专业、更加专注。海量的真实临床病历数据同样是一片巨大的价值红海,这里面有学术价值,有社会价值,也有商业价值,就看企业如何围绕其构建一套具有前瞻性的商业模式。

谢育涛:您是鼓励我们去做病历?

邓侃:至少我在给自己打气继续做病历。

俞声:我想和年轻老师分享科研定位上的一些想法。在研究定位上,如果一个问题是能快速转化的问题,比如一两年可以应用转化,这种问题就不适合老师研究,应该留给公司做。年轻老师做研究的方向,定位上更适合找更本质、更广泛的,做一些五年、十年之后才有可能去作为落地转化的研究,我觉得会更适合学校的氛围。

2021 IDEA大会专题——AI+医疗,挑战与机会并存

日期:2021-12-03
  • 分享:
2021 IDEA大会上,IDEA 平台技术研究中心负责人谢育涛主持“AI+医疗”圆桌论坛,邀请到清华大学副教授俞声,大数医达创始人兼CEO邓侃,晶泰科技联合创始人温书豪,从AI生物制药、医疗信息化等领域切入,探讨在AI医疗发展过程中,创业者与研究者所面临的挑战与机会。

精彩摘录

俞声:“ 从医院信息口给我们的反馈,就目前这个时间段,信息化比智能化更能帮到医院。如果绕开信息化,在基础的自然语言处理做得不是很好的时候可以做智能化,但是有天花板。医疗行业样本量小的情况会高度制约你所做模型的性能。”

温书豪:“ 以后的药物研发不应该主要靠人的经验、靠实验的试错,我认为应该有新的药物研发范式:通过很多准确的算法、调动巨大的计算资源进行计算、实现规模化、自动化甚至机器人做药物研发。”

邓侃:“ 医疗行业有着巨大的市场机遇,从业企业需要更加专业、更加专注。海量的真实临床病历数据同样是一片巨大的价值红海,这里面有学术价值,有社会价值,也有商业价值,就看企业如何围绕其构建一套具有前瞻性的商业模式。”

谢育涛(左一)、俞声(左二)、邓侃(右二)、温书豪(右一)

 

以下文字经大会现场分享内容整理而成:

 

医疗创业路上的思考

谢育涛:温总做制药的,请您讲讲人工智能对生物医药方面能起哪些作用?有没有发展性?

温书豪:我们做人工智能药物研发,人工智能对药物研发有两个很重要的作用:一、大大提升药物研发的效率,降低药物研发的成本;二、它可能想出一些人想不出来的药,做出人做不出来的药。我们认为以后的药物研发不应该主要靠人的经验,靠时间的试错,我们认为应该要有新的范式通过很多准确的算法——可以是物理,也可以是人工智能,用巨大的算力调动庞大的计算资源进行计算。通过规模化、自动化甚至机器人完成药物研发,这才是新的药物研发的范式。

谢育涛:请侃博讲讲数据对 AI 医疗有没有发展性?

邓侃:我创业之前负责国内主流搜索平台的搜索引擎,发现有关医疗类的搜索量占据平台差不多 1/3 以上的流量,这个量很大。当时,我也产生了一个困惑:一方面这个产品在社会上曾收到了那么多的负面评价,但另一方面大家仍然非常频繁的使用这个产品,这是为什么呢?我个人认为这个需求已经成为社会普遍的刚需。我国医疗领域存在着优质资源相对稀缺且分布不均的现象,AI 能够学习真实世界的临床病历并分析大量临床数据,提高医疗效率及普惠性,为健康中国的建设赋能。

AI 医疗研究信息化的思与辩

谢育涛:请俞博从 AI 医疗研究的角度讲讲,我们应该怎么思考信息化,包括落地的时候有什么需要注意的事情。

俞声:昨天沈向洋理事长提到医疗和其他行业的情况,总体来讲分两层,先是信息化,然后智能化。从医院信息口给我们的反馈,就目前这个时间段,信息化比智能化更能帮到医院。这块信息化主要指患者专业的表型提取,Phenotyping,基本意思是提取患者的基本临床特征,把它作为机器学习的特征,还有像患者搜索等,这些我们一般统称为“病历结构化”的自然语言处理任务。

从研究角度也有这个问题,如果绕开信息化,在基础的自然语言处理做得不是很好的时候,你能不能直接做智能化?这个硬要做肯定可以做,但是有天花板,性能绝对有限制。原理非常简单,当没有提取比较高信息价值的基本特征,要从原始自由文本/噪声文本中提取一点信号,它要求你必须要消耗更多的样本。深度学习本来特别吃样本,医疗的样本相对很多行业又特别少,因此(消耗更多样本在原始信号提取)会高度制约你所做模型的性能。

另外,像医院的信息部门要部署的模型不只是一个,有几十甚至上百个,因为他做的不只是诊断,诊断也分不同的模型:简单的分类模型、罕见病的识别模型、强化模型,还有对于治疗推荐的各种各样模型。如果一百个模型在每个患者身上重复识别发热,如果我是信息科主任我是绝对不允许这样的系统上线,这会造成系统负担过重,导致落地十分困难。

现在说信息化做得不好,这对于中英两种语言原因不太一样。首先英语比中文难,英语缩写的随意性以及首字母缩写的一词多义现象极其严重,中文至少在构词上是远超越其他语言的。这是我在美国做了好几年电子病历处理以后的感受,我本能地不想碰英语病历。中文的困难和英语不一样,中文语言有天然优势,但是比美国缺少开放的医学术语系统,这里的关键词是“开放”。这是公共的基础设施,也就是所有的医院、学校、IT 公司都需要从零基础自己建自己的数据系统,这是非常不现实的。这给我们造成非常大的困难。所以近些年回国以后,我把主要工作精力转移到建设开放的医学术语系统和知识图谱上,同时也非常有幸和 IDEA 合作建立这个公共的基础设施。

邓侃:我们处理过 12.7 亿份中文的真实临床电子病历数据。这些临床病历设计初衷是面向记录,而不是面向汇总研究和价值挖掘。中文病历文本内容相对于英文病历有着很大的不同,中文文本自身在识别上比英文难度更大,直接将病历中的中文信息放到计算机里无法进行任何形式的计算,所以首先要做的是结合医学术语和医疗标准规范实现数据标准化、结构化,这就需要强大的数据处理技术和 AI 技术能力。

谢育涛:提到信息化到智能化的过程,听上去信息化是非走不可的道路,这条路很多问题待解决。往智能化方向走有哪些不同的挑战?

邓侃:现如今,信息化已成为构建现代医疗的基础设施,而智能化则会为医疗业务带来更多的可能。我们首要思考的是在国内优质医疗资源不均衡的背景下,如何借助 AI 技术,为人们创造更便捷、更科学、更有价值的医疗服务模式。刚才讲到 Eric Topol,那就是我们正在做的事情。目前国内优质的医疗资源分布不均衡且医患之间存在着不信任,反而给国家带来突破的机会。患者越来越有意识的想知道他们所患的到底是什么病,要如何治疗。

我和大家说一个故事。国家卫健委在全国四个县做了四个试点,其中有一个叫山西永和县。我们去了之后发现永和县人民医院的楼盖得非常好,里面的医疗设备先进、齐全,但因为没有好医生,所以病人也不多,由于病人少,因此好医生留不住,整个现状就进入了非常快速的下旋状态。

当时有位专家给我提了一个建议,目前大家有两个共识:第一,所有永和县的老百姓都承认医院的设备是好的;第二,老百姓内心对医院的医疗水平是有点顾虑的。那倘若永和县人民医院把自身化作为操作工,就是做化验、抽血、验尿,还有拍片等工作,拍片之后把客观数据上传,传输给北京、上海等地的权威医院,由那边的权威专家给出诊断和治疗方案。我们做了一些类似的尝试,效果不错。

AlphaFold 能否为制药领域带来真正突破?

谢育涛:DeepMind 开源的 AlphaFold 现在很火,想请几位嘉宾谈谈 AlphaFold 是否有可发展性?

(温书豪:AlphaFold 迈出了非常重要的一步)

温书豪:我们还是用事实说话,以结果为导向,这次 DeepMind 做的 AlphaFold 对蛋白结构的预测达到很好的效果。虽然我认为这离最终通过 AI 把药物做出来还是有点距离的事,但是 AlphaFold 迈出了非常重要的一步。药、人,都是原子、电子组成的,药物要发挥作用,其实是药物分子和人体的蛋白发生作用,是物理学计算相互作用的范畴。AlphaFold 也是一样的,它有基本的底层逻辑可循,有很多物理的模型来理解在怎么样的条件下,这个蛋白会处于稳定的状态和结构。它是数字化或者人工智能的基础,或者以后会以越来越准的基础跨过一个阈值。

这次 DeepMind 用了几百个 TPU,算力也是达到了过去没有的状态,底层逻辑是清楚的。后续因为生命科学是人工智能领域里面大家最关注的,人才、资本都会往里面涌,会不断地有新的算法涌现。我觉得进展是非常确实的,再加上未来会有更多的硬件和 AI 的突破,动力学的模拟,用人工智能开发做药物,我相信是指日可待的。

谢育涛:昨天沈向洋理事长讲创新有科技创新、产品创新、模式创新,最重要的是科技创新。我觉得 AlphaFold 在这个领域往前走了很大一步。AlphaFold 是做生物、蛋白质,和温总做的药物是同一类事情吗?

温书豪:药物行业链条特别长,AlphaFold 在最源头去理解导致疾病的靶点,这是很重要的。做药首先要有靶后面再有箭,很多抗体的药物也是蛋白结构,AlphaFold 确实在靶点的发现、对于将来抗体药物设计,跨出很重要的第一步。我们做的事情是如果给一个靶点,后面构造一套系统,最快帮你把小分子抗体或者多肽药物做出来,包括机器人做药物,构建很多数据和算法,与实验反馈相辅相成。

谢育涛:我想听听侃博和俞博对于这个领域有没有一些看法,AlphaFold 有没有道理?

邓侃:俞老师、谢老师都做知识图谱,我们也做了一些尝试,做了之后发现一个很重要的问题:疾病和症状之间有什么关系?目前只是数量的相关性,一个经验性的东西。假如说我们能把下面整个深化的信号通道、逻辑关系挖掘出来,那这一定是个绝对革命性的东西。

俞声:总体来讲,药物这块我完全没有学过,我不能妄评 AlphaFold 有没有道理。像刚才侃博说的,像药物的各种通路,如果让人脑去想,需要很庞大的知识,这个行业学术门槛很高。从知识图谱的角度能做的可能是(建立)一种高度专业化、高度特异化的学术性的知识图谱,可以作机器预测模型的骨架,作为一种引导告诉研究者哪个方向能形成一些突破,我觉得这是有可能的。

谢育涛:侃博讲到一个地方我在想,症和治之间的关系要打通,个人有什么能力参与?我关注到有位教授提到一个概念 IAP,Individual Activity Participant-个人积极参与,因为我们看病基本都是医生讲讲就自己决定,要不要吃药、要不要动手术医生说了算,能不能以某种形式知道我的情况,不仅是知情权,还有参与判断的权利,对打通这件事有没有帮助?

(邓侃:未来的医疗或许掌握在患者手里)

邓侃:很有意思,谢老师提到的人叫 Eric Topol,这个人写过两本书,一本是《颠覆医疗》,做智慧医疗的人基本都看过这本书;第二本是《未来医疗》,其实原名比较具象、生动,叫《患者正在盯着你》,副标题是说“未来医疗在患者手里”。中国医疗优质医疗资源分布不均,以及前几年对于医疗机构的监管力度不够,随着人们对医学认知水平的提高,导致了医患之间的信任被削弱。因为患者没那么相信医生,患者更关心自己的医疗方案是不是准确。AI 能够在健康管理、医疗影像、辅助诊断等多场景赋能医疗行业,助力医疗领域的效率提升和供给侧改革。在这种背景及多方面因素的促进下,中国或许能在智慧医疗领域成为世界领先。”

获取医疗数据信息的挑战?

谢育涛:我在医疗领域的尝试中经常碰到一些困难,很多数据不能获悉。包括做 AI,我和俞博做图谱都会遇到数据隐私、数据保护、个人的信息等问题,这是数据方面的挑战。另外我们在算法方面也有挑战,还没有完全解决,用于调参的数据准备量可能不够。刚才讲到数据的事情,没数据没法做 AI,而又有健康数据使用权的问题,我们聊一下这个相对不太清晰的问题。

邓侃:我想澄清一个概念,我们说患者隐私、数据隐私保护,这其实是两个不同的概念发生了混淆。我们要在医院信息安全体系架构下,保证原始数据不出医院,将病历信息进行脱敏和分离,捍卫医疗数据安全,保护患者隐私。

谢育涛:有些事实数据和诊断数据处理的方法不同。对 AI 技术的发展来讲,制药领域有没有这方面的数据隐私或者获取的问题?

温书豪:我发现产业界现在越来越 Open(开放),在制药领域里面,比如我们的客户是欧美一线大药企,与我们建立开放互信的合作关系,晶泰科技过去已加速上百款管线药物。为什么信任我们呢?

第一,早期我们做很多数据模型,通过使用 AI 他发现很准、很好用,建立了基础的商业信任。

第二,产业界的结构、思维都在变化。很多大药企是这么想的:通过规模化的研发项目打磨了算法,你做了平台,再给 100 家公司用,后面还有 100 家 VC 投资它,对他来说是划算的。现在药物行业越来越专注,每个人做好自己专攻的事。

第三,大家觉得研发各种方式来分享数据之后,对于整个产业界是好事,大药企变得越来越投行化,把自己的优势发挥出来。

所以我说整个产业的思维方式也更加 Open,更加专注自己擅长的细分领域。

谢育涛:医药、生物制药和大数据健康对数据直接需求的程度有些不一样。从研究的角度,像俞博做研究也需要一些数据,这个对数据的需求和隐私的保护是不是有不同的需求或者考量?

(俞声:健康数据需要被合理使用)

俞声:从我们这种科研类型的角度,需要用到的数据和侃博差不多,而且刚才侃博提到一个概念特别有启发,数据的隐私可以分成关于患者的隐私和关于医院的隐私。我记得某个法规有一个说法,“信息的物权是归信息描述的对象所有”。凡是不涉及医院隐私的部分,仅仅关于患者的隐私,在安全的环境下,如果能够拿出来,或者医院愿意在安全的环境下分享一部分——这个数据可以不脱离医院,或可以只是进入患者个人的账户——即使这部分拿出来也是非常有帮助的,可以解决很多事情。

踩过前坑,乐看未来

谢育涛:借这个机会想问问两位创始人,你们都是独角兽企业,创业中肯定有很多艰辛,有没有踩过的一些坑可以跟我们分享下?

温书豪:我 2015 年开始做晶泰科技,早期经历过很多困难的阶段,回到国内后,我和我的合伙人到上海张江生物医药园跑了快半个月,跑了 30 多家公司,没有一家答理我们。那时候中国是以仿制药为主,他说实话:“我们是小米加步枪,你给我装狙击镜也没用”。后来我们转变策略,往欧美一线大药企看,再后来拿到欧美一线大药企盲测机会,利用算法来预测药物的某些重要性质。

做 AI 药物研发或者做算法往药物行业走,很好的模式是早期的产业界的驱动,而且越是标杆型客户的意义越重大,因为很难做。后面发现如果跟的是欧美一线,排名第一的大药企,因为他们有足够多的管线,他们的数据标准、安全标准、准确度标准非常高,只要做通以后,在整个药物行业更容易打开局面,其他的企业客户就不会问同样的问题。

我们花一年半的时间做到研发,在一年半最后三个月拿到盲测,经过两年时间才拿到 0 到 1 的客户。中间很多国内的药企只是观望,我们也考虑过转型,很多不如意,但是还是坚持下来,没有轻易转变方向。

邓侃:我们的立足点是用自然语言处理的技术来处理真实世界的临床病历。医院信息口的预算,如果按照排名来看,现阶段可能在整个医院各个口的预算排名很靠后。虽然目前医院在该方面的投入不算高,但我们仍然会继续坚持。随着国家医药体制改革的深化,对智慧医疗产品与服务的需求将会不断增长,AI 技术在辅助诊断、深度提升医疗质量方面的产品价值已经得到了社会的阶段性认可,已成为医院信息化建设的未来方向。同时,我们也在挖掘 AI 在健康管理的应用潜能,借助海量真实病历和科学的临床路径,实现常见病种患者从院内到院外的全病程管理。

谢育涛:前面讲到有很多热钱进来,有很多研究在发展,真正做的时候有很多困难,想请三位嘉宾劝慰或者鼓励下,无论是做研究的创业者,还是对这个领域很有兴趣的一群人。

温书豪:我们公司做 AI 药物研发有四五年时间,我们看到人工智能与生物医药产业的结合是不可逆转的趋势。我觉得这个市场足够大,两个万亿级的产业,算法给药物行业带来很多规模化效应。欢迎更多 AI 领域的创业者可以进到行业里面,里面有巨大的机会。

邓侃:医疗行业有着巨大的市场机遇,从业企业需要更加专业、更加专注。海量的真实临床病历数据同样是一片巨大的价值红海,这里面有学术价值,有社会价值,也有商业价值,就看企业如何围绕其构建一套具有前瞻性的商业模式。

谢育涛:您是鼓励我们去做病历?

邓侃:至少我在给自己打气继续做病历。

俞声:我想和年轻老师分享科研定位上的一些想法。在研究定位上,如果一个问题是能快速转化的问题,比如一两年可以应用转化,这种问题就不适合老师研究,应该留给公司做。年轻老师做研究的方向,定位上更适合找更本质、更广泛的,做一些五年、十年之后才有可能去作为落地转化的研究,我觉得会更适合学校的氛围。