AI会客厅实录|对话北京中关村学院×中关村人工智能研究院何亮

2025年10月22日,20时57分00秒 科技新知 阅读 2 views 次

2025人工智能计算大会(AICC2025)特别策划了“AI会客厅”直播活动,由媒体人和与会嘉宾共同围绕ABI、人工智能+行动、低空经济、AI4S等产业前沿话题展开探讨。

AI4S作为当前产业界热议的核心议题之一,AI制药、材料科学、智慧育种、气象预测等等领域的实践都正在对普通大众的日常生活产生深刻影响。AI4S的产学研发展应用现状如何?哪些领域正在加速变革?其中会涉及哪些伦理争议和风险?为AI+人才培养带来了哪些新的命题?智东西总编张国仁与北京中关村学院×中关村人工智能研究院的生物大模型首席研究员何亮共同就AI4S相关前沿话题展开对话,以下内容根据直播整理。

张国仁:大家下午好, 2025人工智能计算大会“AI会客厅”的最后一位嘉宾,是来自北京中关村学院、北京中关村人工智能研究院的生物大模型首席研究员何亮。何老师长期专注于生物大模型与科学基础模型研究,曾在微软亚洲研究院和微软研究院科学智能中心等单位开展科研工作,在生物大模型、AI+药物设计等领域有着深厚的积累和储备。

首先我们还是围绕AI For Science这个词的展开。AI4S在科学研究领域应用比较广泛,但是跟普通人关系好像没那么大。它的实际意义和对研究的影响如何?请何老师给我们先简要在这方面介绍一下。

何亮:首先说到AI4S研究,其实在上个世纪大家也会有类似的疑问:为什么要发射卫星上天,为什么要造火箭?而现在大家都看到,这些技术已经深刻影响了我们的生活。我也可以引用北京中关村学院的研究理念来开始今天的分享——“极基础、极应用、极交叉”。先说与生活最相关的“极应用”。AI应用正在影响人们生活的方方面面,比如生物领域常用的洗衣粉,其中的生物酶本质上是一种蛋白质,这种酶的效果好不好、去污能力强不强,都需要通过研究与优化。再比如材料领域,很多人已经使用电动汽车,对电池和能源性能非常关注。如何让电池续航更强、冬天掉电更慢,新材料的研究就能直接带来改进。还有智能育种,我们通过AI帮助培育优良品种,可直接用于农业,关系到粮食安全。AI4S的重要使命是加速科学发现。过去从科研到应用可能需要十年甚至二十年,而现在借助AI工具,可以把这一周期缩短到几年甚至几个月。“极交叉”则指多个领域的共性问题交汇,AI4S的价值就在于促进这些领域的融合创新。对公众而言,我们今天享受的科技成果,往往源自多年前的科学突破。从科学发现到应用再到市场推广,正如那句话所说:“流水不争先,争的是滔滔不绝”,科研亦是如此。

张国仁: AI+科研最近被列为了国务院发布的人工智能+行动计划重要领域之首,从您的研究和实践来看,这个领域的研究对中国未来的发展意义有多么重大?

何亮:AI4S的重要性非常大。刚才我们提到,从极基础研究到极应用,它覆盖了创新的整个链条。科学本身是创新的源头动力。科研发现往往是一个漫长的过程,如果能通过AI提升源头创新的速度,就能更快地享受到科技进步带来的红利。对国家而言,AI4S是建设科技强国的重要基础。只有在生物科技、材料、农业、气象等关键领域实现突破创新,才能真正让科技发展成果回馈社会,使国家更强大。另一方面,在当今国际竞争激烈的格局下,AI4S也是国家保持领先的关键,需要持续的技术创新和深入研究。

张国仁:咱们国家去做AI4S有哪些独特的优势?

何亮:首先,我们有体制优势,能够高效整合人才、算力、平台和数据等资源,这是许多国家难以做到的。其次,我国拥有庞大的数据基础,例如医疗病例、材料测试、气象观测等,这为AI模型的训练与应用提供了坚实支撑。最后,我国科研人才数量多、基础好。AI人才与生物学家、材料科学家、农业专家、气象学家之间的跨界合作,正在不断产生思想与算法的火花,带来更多可落地、甚至突破性的成果。

张国仁:回到应用层面,随着AI4S的发展,哪些领域最受益?

何亮:我毕业后就投身AI4S,更具体地说是AI for Life Science(生命科学)领域。从实践来看,生命科学和生物医药首先受益。众所周知,传统制药周期长、成本高——“两个十”:十年时间、十亿美元投入。而AI+制药可以将周期从十年缩短到几个月,大幅提升效率。第二个受益领域是材料科学。由于材料元素组合复杂、搜索空间巨大,AI能帮助快速筛选出具有特定属性的新材料。第三是农业育种。中国作为人口大国,粮食安全是国家战略。AI通过基因组数据分析,可以指导高产、耐旱、抗虫等优良特性品种的培育。第四是气象能源领域。例如在西北地区开展风力发电,借助天气预测或风能预测大模型,就能更好地规划与优化发电。

张国仁:聊一个跟您专业直接相关的话题,也是AI4S比较受大众关注的一个点,2024年诺贝尔化学奖颁给了蛋白质结构预测领域的科学家,其中很重要的功能是AlphaFold3大模型,这个对行业来说意味着什么意义?

何亮:这太重要了。我刚进入AI4S领域没多久,AlphaFold就出现了。蛋白质结构预测是长期存在的科学难题,而AlphaFold3首次让模型预测达到实验级精度,这是一次里程碑式的突破。这意味着科学界正式认可AI具备解决重大科学问题的能力,AI4S在科研体系中拥有了应有的一席之地。更重要的是,它给从业者带来了信心和鼓舞:既然AI能解决这一重大问题,就可能在更多科学领域实现突破,推动人类科技的整体进步。

张国仁:好的,说到AI4S对科学研究的帮助,您前面提到了一些例子,被创造出来的可以叫作“生物”吗,如果是的话,可能会涉及到一些伦理的问题,包括基因编辑,那会有安全上的隐忧吗?或者在科学界,你们在应用这些技术的时候有没有一些安全上的应对方法策略,在行业里面国际上形成一些共识?

何亮:通过AI4S设计出的第一个病毒噬菌体虽然名称中带“病毒”,但对人类没有危害。然而,这也提醒我们潜在的伦理风险。AI在一定程度上降低了制造潜在危险生命体的门槛,使其变得更容易被创造出来。除此之外,还有诸如公平性、可用性、环境影响等多方面的伦理问题。总体来说,首先我们应从AI本身出发,践行“负责任的AI”(Responsible AI),确保AI的使用在合理监管下进行。其次,我认为需要建立跨行业的委员会或评审监督机制,对新技术成果在推广和扩散阶段进行监管和评估。当然,这并非一国之事,必须推动国际合作。值得肯定的是,我国在AI4S伦理治理方面已取得一定成功。总体而言,伦理规范应走在科技发展的前面,这应被放在极为重要的位置。

张国仁:确实是行业野蛮发展必然会面对的一些问题。回到您的研究,现在是不是有些AI工具已经在研究中占据主导位置了?如果说在一些数据上跟你实际时间有冲突,会如何处理呢?

何亮:这个问题可以分两方面看。一是我个人在科研过程中的AI应用,二是AI在科研题目中的应用。就我个人而言,大语言模型已经非常强大。无论是科研中的数据收集、文献调研,还是实验过程中的代码编写、调试(debug),以及论文撰写和润色,AI都能提供很好的帮助。它是一个强有力的工具,正在显著加速科研进程。但AI也存在“幻觉”问题,因此我们需要保持清醒的判断,确保生成内容与事实相符。第二个方面是AI在生命科学全流程中的应用:从靶点发现、结构解析、小分子设计,到临床前验证,AI贯穿始终。以我最近发表在《Nature Machine Intelligence》上的论文为例,我们研究如何优化蛋白质序列。湿实验无法穷举所有突变组合,哪怕是几个氨基酸位点的突变,组合空间都可能达到数十亿甚至上百亿种,极其耗时耗力。我们的做法是先通过部分湿实验获得数据,让AI学习其中的规律。掌握规律后,AI可以在虚拟空间中进行快速实验,加速验证整个搜索空间。

此外,我们引入强化学习等算法来探索这一巨大空间。模型建立之后,AI可以迭代地进行搜索和优化。结果显示,这种方法的成功率很高,也找到了性能优异的突变方案。也就是说,从湿实验观测到AI生成与再验证的全过程,AI都深度参与其中。但最终的验证仍必须依赖客观的实验世界。

张国仁:具体到你们应用这些AI的工具,前面探讨的更多是基于这些现象或是大面上,具体到你们应用的工具,从算力到大模型,或者一些专用的领域,大概用到了哪些方面的东西?让我们感受更明确一些。

何亮:目前国内的大语言模型发展非常快,比如DeepSeek、千问等模型,在中文理解方面相比ChatGPT更具优势。很多时候我会在工作中交叉使用多个模型,包括ChatGPT,用于英文文献阅读与信息整理。

张国仁:国内有一些专用的工具吗,像AlphaFold3专门做蛋白质研究,有专用于某些领域的研究工具吗?

何亮:有的。我国也在积极研发自己的生物结构预测模型和科学基础模型。虽然与国际领先水平相比,我们在这一领域所占比例还不算大,但发展速度很快。这也是我们持续努力、追赶并力争引领的方向。

张国仁:明白,随着AI的加入,一方面是一个好的助手,好的工具。另一方面是不是很大程度上提高成本的投入,有的实验需要采购大的超算,对于科学研究的成本是不是一种增加?

何亮:实际上,AI科研的成本是阶段性的。最消耗算力的是模型预训练阶段,包括蛋白质模型和科学大模型的基础训练,这部分显卡资源需求确实较高。但在完成预训练后,推理阶段的算力需求会大幅下降,因此总体投入在后期并不会持续高企。我的理解是,AI科研的成本主要集中在早期模型构建阶段。

张国仁:也是一个阶段性的,不是每时每刻一定是高消耗的状态。其实还有一个很本质的问题,我们刚才说到AI For Science,就是科学家要用AI,科学家首先得用好AI,是不是也得懂AI,对于AI+科研的人才,会有什么样的要求吗?

何亮:我认为AI+科研的人才培养,关键在于跨学科。未来应当培养既理解AI、又熟悉专业领域的复合型人才。一个人不可能精通所有领域,但需要在AI方法和学科知识之间建立桥梁。

以模型构建为例,必须理解领域数据的特点——哪些数据合理、哪些可被AI有效利用。毕竟,如果输入数据质量差,输出结果也不会可靠。因此高质量数据的整理与理解需要领域专家深度参与。

我本身是做AI出身的,也在与生物学同事的合作中不断学习。不同学科的思维差异巨大,彼此理解的过程本身就是创新的来源。

在学生培养方面,也应鼓励交叉思维,知识结构既有侧重又有交叉,促进不同领域之间的深度合作与学习。

张国仁:我觉得您说的这两个非常关键,一个是人工智能教育应该从娃娃抓起,好像我们现在从小朋友到长辈,大家都在使用互联网,大家觉得这不是一个需要学习的东西,同样人工智能在下一代也是一样要成为他们习以为常的工具,第二方面各个领域的人互相的配合,互相结合,去完成一个事情也非常重要,所谓跨学科交叉学习更为重要。

感谢何老师对我们深入浅出对于AI For Science这个领域,对普通人既远又近的领域的分享,让我们有了更多认识,也感谢观众对我们的关注。

(来源:新浪科技)



用户登录