AI for Science 2026全面爆发:从蛋白质设计到药物研发,7款AI工具让科学家把数周工作压缩到几小时
2026年6月30日,Anthropic举办AI for Science峰会,诺华/BMS/基因泰克CEO齐聚。NVIDIA BioNeMo Agent Toolkit上线,50+企业接入。从AlphaFold诺奖到蛋白质从头设计,从VirBench病毒检测到IsoDDE药物研发——AI正在改写科学发现的速度极限。本文系统梳理2026年AI for Science的六大突破、7款核心工具对比,以及科学智能体的未来图景。
2026年6月30日上午10点(太平洋时间),Anthropic举办了一场可能是今年以来最重要的AI行业活动——「The Briefing: AI for Science」。这场线上峰会的参会阵容令人咋舌:诺华CEO Vas Narasimhan、百时美施贵宝CEO Chris Boerner、基因泰克研发负责人Aviv Regev——全球顶级制药巨头的核心决策者悉数到场。
就在一周前,英伟达发布了BioNeMo Agent Toolkit,让AI智能体获得了"博士级研究助理"的专业技能。50多家头部企业已接入,包括礼来、Schrödinger、华盛顿大学蛋白质设计研究所——甚至Anthropic和OpenAI也在集成这个工具包。
再往前推三周,AlphaFold的诺奖得主John Jumper从DeepMind跳槽到Anthropic,震惊了科学界。这位2024年诺贝尔化学奖得主的下一站,今天极有可能在峰会上首次公开亮相。
这不是三件孤立的事件。它们共同指向一个正在加速的趋势:AI for Science(科学智能)已经从实验室走出来,进入了制药巨头、生物科技公司、科研机构的日常工作流。
全球科学研发支出已达3.8万亿美元,年度制药预算接近3000亿美元。谁能让AI真正在实验室里跑起来,谁就能在这一轮科学革命中占据先机。问题是:AI到底能在科学里做什么?哪些工具真正好用?科学家能从这套新范式里获得什么?
一、AI for Science为什么是2026年最值得关注的赛道
如果说2023-2025年是AI在"对话"和"编程"上证明自己的三年,那2026年就是AI杀入"实验室"的关键一年。
一个标志性事件可追溯至2024年10月——AlphaFold核心开发者John Jumper与David Baker共同获得诺贝尔化学奖。这是AI首次以"主力"身份登上诺贝尔领奖台。评审委员会的评语简明有力:"他们用AI解决了蛋白质结构预测这个困扰科学界50年的难题。"
此后两年,AI for Science的进展呈指数级加速:
- 2025年:AlphaFold 3将预测范围从蛋白质扩展到DNA、RNA、配体和离子;RFdiffusion实现蛋白质"从头设计";ESM-3展示了用AI生成自然界不存在的蛋白质的能力。
- 2026年2月:Isomorphic Labs发布IsoDDE药物设计引擎,被《Nature》称为"AlphaFold 4级"突破。同时宣布AI设计的抗癌药物进入人体临床试验。
- 2026年6月8日:Anthropic发布VirBench研究,揭示了一个惊人的结论——AI在生物学中的瓶颈不是模型不够聪明,而是数据基础设施没跟上。
- 2026年6月20日:John Jumper在Google DeepMind工作9年后加入Anthropic,AI人才争夺战的战场从编程模型扩展到科学领域。
- 2026年6月23日:NVIDIA BioNeMo Agent Toolkit正式上线,50+企业采用,首次让AI智能体具备了"理解科学知识、使用科学工具、执行科学工作流"的完整能力。
- 2026年6月30日(今天):Anthropic召集全球顶级药企举办AI for Science峰会。
这条时间线揭示了一个清晰的事实:AI for Science已经从"能不能做"的阶段,进入了"怎么做、谁来做、做给谁用"的阶段。
二、蛋白质设计——AI最早攻克的科学堡垒
蛋白质是生命活动的执行者。理解蛋白质的3D结构,是理解疾病机制、设计药物的基础。传统方法(X射线晶体学、冷冻电镜)解析一个蛋白质结构需要数月甚至数年,花费数万到数十万美元。
AI把这个过程压缩到了几分钟。
以下是我们整理的2026年最值得关注的7款蛋白质设计和结构预测AI工具:
1. AlphaFold 3(Google DeepMind | 闭源)
AlphaFold 3是目前最准确的全原子结构预测工具,能同时建模蛋白质、DNA、RNA、配体和离子。其核心创新是用扩散模型替代了前代的结构模块,在蛋白质-配体相互作用上的准确率比AlphaFold 2提升了约50%。
局限:代码和权重均未公开,仅通过AlphaFold Server网页界面使用。背后的商业考量是——DeepMind的姊妹公司Isomorphic Labs需要用这个技术赚钱,开源会让商业模式难以成立。
2. RoseTTAFold / RFdiffusion / ProteinMPNN(华盛顿大学Baker Lab | 完全开源)
如果说AlphaFold 3代表了"闭源顶峰",那David Baker实验室的三个工具就是"开源生态的基石":
- RoseTTAFold All-Atom:比AlphaFold 3更早实现全原子建模,包含配体和辅因子。三轨架构(序列、距离、坐标同时学习)是结构预测领域的基础性创新。
- RFdiffusion:基于扩散模型的蛋白质骨架从头设计工具。输入目标蛋白结构和结合位点,它能生成可结合的全新蛋白质——这些蛋白质在自然界中不存在。2024年已有10+设计蛋白进入临床前或临床阶段。
- ProteinMPNN:消息传递图神经网络,给定蛋白质骨架,自动生成适配的氨基酸序列。
这三者组合成的"RFdiffusion→ProteinMPNN→AlphaFold验证"管线,已成为蛋白质设计的行业标准工作流:生成约10,000个候选骨架→为每个骨架分配8条序列→AlphaFold重新折叠验证→湿实验表达前100个候选并测量结合亲和力。这一流程将传统数月的工作压缩到了几天。
3. ESM-3(EvolutionaryScale | 部分开源)
Meta/FAIR独立出来的EvolutionaryScale公司推出,最大版本980亿参数。ESM-3不仅能预测蛋白质结构,还能生成具有所需功能的全新蛋白质。其标志性实验esmGFP展示了AI压缩约5亿年进化轨迹的能力——生成了在自然界中需要5亿年才能演化出的绿色荧光蛋白变体。
4. Boltz-2(MIT | 完全开源,MIT许可)
Boltz-2的定位非常清晰:"用不了AlphaFold 3?用Boltz-2。"它在AlphaFold 3级别的全原子预测能力上,做到完全开源和可商用。新增结合亲和力预测功能,单个A100 GPU处理中等蛋白质仅需1-5分钟。
5. Chai-1(Chai Discovery | 部分开源)
2024年秋季成立的初创公司,在抗体建模方面表现突出。提供免费Web UI,其Chai-1r版本增加了结合亲和力预测和基于强化学习的重排序。
关键趋势:DeepMind关闭AlphaFold 3的决定,反而加速了开放生态系统的发展。Boltz-2、Chai-1等工具在一年内就追近了AlphaFold 3的准确率。Baker实验室的"RFdiffusion+ProteinMPNN"组合更是开辟了"蛋白质从头设计"这个全新领域——不仅能预测自然界的蛋白质结构,还能设计自然界不存在的新蛋白质。这在2023年之前是不可想象的。
三、从预测到设计——AI制药进入临床验证阶段
如果说蛋白质结构预测是"看懂生命",那药物设计就是"改造生命"。后者离钱最近,也最考验AI的真实能力。
IsoDDE:被称为"AlphaFold 4"的药物设计引擎
2026年2月10日,Demis Hassabis领导的Isomorphic Labs发布了一份27页的技术报告,展示了名为IsoDDE(Isomorphic Drug Design Engine)的AI药物设计引擎。《Nature》评价其为"AlphaFold 4级别的突破"。
IsoDDE的核心能力不是预测单个蛋白质结构,而是模拟药物分子与靶点蛋白的完整相互作用——包括结合强度、选择性、代谢稳定性等药理学关键参数。在多项基准测试中,其预测准确率大幅超越此前所有公开方法。
更关键的是:IsoDDE设计的抗癌药物已在2026年4月进入人体临床试验。这是AI制药从"概念验证"到"临床验证"的历史性一步。如果试验成功,将意味着AI不仅能帮科学家"算"出候选药物,还能"算"出真正有效的药物。
NVIDIA BioNeMo:让AI智能体成为"博士级研究助理"
2026年6月23日上线的NVIDIA BioNeMo Agent Toolkit,可能是今年最具产业影响力的AI for Science产品。它的核心价值不在于"又一个模型",而在于打通了AI智能体与科学工具之间的"最后一公里"。
BioNeMo汇集了NVIDIA十余年积累的生命科学库、工具和开放模型,使AI智能体能够:
- 调用NVIDIA NIM推理蛋白质结构预测、分子对接等模型
- 通过Parabricks加速基因组分析(序列比对、变异检测)
- 使用预置的科学工作流(虚拟筛选、靶点发现、蛋白质结合物设计)
- 在受控的OpenShell运行时环境中执行计算实验
黄仁勋的原话精准概括了BioNeMo的定位:"前沿模型是大脑,BioNeMo是科学工具箱。两者结合,赋予了AI智能体博士级研究助理的专业技能和超级计算机的运行速度。"
目前超过50家头部企业已接入BioNeMo,包括礼来(制药)、达索系统(工业软件)、Databricks(数据平台)、Schrödinger(计算化学)、华盛顿大学蛋白质设计研究所。甚至连Anthropic和OpenAI也在集成这个工具包。
华盛顿大学蛋白质设计研究所所长David Baker(2024诺奖得主)的评价值得注意:"科学的下一次飞跃不会来自单一发现,而是得益于迭代设计的速度,以及智能体能够以人类无法企及的速度,不断对复杂生物学问题进行推理的能力。"
四、VirBench的教训:数据基础设施比模型更重要
2026年6月8日,Anthropic研究员Laura Luebbert(Broad Institute / FutureHouse)团队发布了一项名为VirBench的研究。这项研究揭示了一个被热炒的"大模型叙事"所掩盖的真相。
研究团队构建了VirBench基准——120个真实的病毒序列检索任务,覆盖40种病原体。测试了6个前沿AI模型(Claude Sonnet 4、Claude Opus 4.7、GPT-5.2-pro、GPT-5.5等),每个查询独立运行三次。
结果令人警醒:
| 模型 | 不使用专用工具 | 使用gget virus工具 | 提升幅度 |
|---|---|---|---|
| Claude Sonnet 4 | 16.9% | 92.8% | +75.9个百分点 |
| Biomni OSS | 22.5% | 90.0% | +67.5个百分点 |
| GPT-5.2-pro | 67.1% | 98.9% | +31.8个百分点 |
| Claude Opus 4.7 | 83.2% | 98.3% | +15.1个百分点 |
| GPT-5.5 | 91.3% | 99.7% | +8.4个百分点 |
结论可以用一句话概括:一个便宜的模型+正确的工具,比一个昂贵的模型孤军奋战更强。
VirBench暴露的根本问题是——生物学数据库不是为AI智能体设计的。NCBI、ENA、DDBJ等核心数据库的网页界面语义复杂、分页截断、返回结果不可审计。AI模型在这些混乱的数据基础设施上"挣扎",消耗了大量token在无意义的分页和重试上。
Anthropic团队与NCBI合作开发的gget virus确定性检索工具,将精度从16.9%拉到了92.8%——但该工具本身没有任何"AI"成分。它只是一个薄层的、确定性的、可审计的数据库接口。这揭示了一个重要洞察:在科学领域,"无聊的基础设施"往往比"花哨的模型"更有价值。
这与软件工程领域的MCP(Model Context Protocol)趋势不谋而合:科学领域同样需要"薄层的、确定性的工具界面"供AI智能体调用,而不是让模型在混乱的数据中自行摸索。
五、2026下半年展望:AI科学家的三个方向
综合Anthropic峰会、BioNeMo上线、VirBench研究三条线索,可以勾勒出2026下半年AI for Science的三个演进方向:
方向一:从"单点工具"到"智能体工作流"。当前的AI科学工具大多是独立的——一个工具预测蛋白质结构,另一个工具做分子对接,再一个工具做毒性预测。BioNeMo Agent Toolkit的出现正在改变这个局面:AI智能体能自动串联这些工具,完成"筛选化合物→与靶点对接→预测结合强度→筛选成药性候选分子"的完整工作流。筛选周期从数天缩短到几分钟。
方向二:从"预测"到"实验闭环"。Isomorphic Labs的临床试验是最直接的验证——AI设计的药物到底能不能在人身上起效?如果2026下半年有积极的临床数据,将引爆整个AI制药赛道。同时,实验室自动化的进展(Automata、HighRes、帝肯等公司正在整合BioNeMo)意味着未来的AI智能体将能直接操控实验室设备,实现"计算→实验→分析"的完全闭环。
方向三:开放科学与商业护城河的博弈。AlphaFold 3闭源的决定引发了一场围绕科学工具"该不该开放"的大讨论。Baker实验室的全线开源策略、Boltz-2的MIT许可、BioNeMo的"开放平台"定位——这些代表了"开放科学"阵营的反击。2026年的关键问题是:科学家到底需要什么?是训练数据闭源但性能最好的专有模型,还是完全透明可审计的开源工具?Anthropic今天峰会上对安全和信任架构的强调,或许预示着一个答案:在科学领域,可审计性本身就是一种护城河。
结语
2026年6月30日,当我们看到诺华、百时美施贵宝、基因泰克的CEO们坐在Anthropic的线上会议室里讨论AI如何加速科学发现时,一个时代已经悄然开启。
从2024年AlphaFold拿诺贝尔奖,到2026年AI设计的药物进入人体试验——仅仅两年时间,AI就从"科学家的辅助工具"变成了"科学发现的核心引擎"。
对普通科研人员来说,最实际的问题不是"AI会不会取代科学家"——答案显然是否定的。真正的问题是:你的实验室、你的研究团队,是否已经接入了这套新工具链?是否还在手动检索NCBI数据库,而AI智能体正在用gget virus在几秒内完成同样的工作?
科学发现的速度已经不可逆地被AI改写。跟上这个速度,或是被它甩下——这是2026年每个科学家都需要回答的问题。