随着 multi-agent 技术的发展,AI 可能不再只是“工具箱”,而是能自主完成跨学科复杂研究,从而推动科学发现走向全新模式。AI 实现科学和科研发现正在走进现实,AI scientist 已经在改写科研和药物开发范式:
今年 5 月,前谷歌 CEO Eric Schmidt 投资的 AI lab FutureHouse 推出了四个 AI scientist agent,一个月后,他们又宣布自己的 AI 系统 Robin 成功开发出了新的 dAMD 药物。就在两天前,OpenAI 也专门发布博客强调 AI 在生物学领域的能力正在不断增强。
本期内容我们邀请到了斯坦福大学 CS 博士生、AI scientist Biomni 核心贡献者黄柯鑫 一起聊 AI Scientist。柯鑫的学术背景兼顾了生物和计算机研究,有多篇论文发表在 Nature 系列期刊及 ML 顶会上。
Biomni 是斯坦福研究团队最近发布上线的一个生物医学通用 agent,它整合了 150 种专业工具、59 个数据库和 105 种软件,可以执行生物医学子领域的各种研究任务,打破了传统科研流程中碎片化、低效的壁垒,显著提高了科研效率。感兴趣的朋友可以在biomni.stanford.edu 免费注册和使用。
在本期节目中,柯鑫结合自己的科研经历,分享了 AI scientist 的理念,为什么普通 agent 无法胜任科研任务,以及 AI for Science 领域正在发生的重要趋势等话题。
和 AlphaFlod 等生物医学领域的大模型不同,AI Scientist 通常指利用 AI 技术辅助或自动化科学研究过程的系统(或工具),能在数据分析、假设生成、实验设计等方面加速科学发现,这个概念既可以指 AI 作为辅助者,帮助科学家做研究,也可以指 AI 主动、独立承担科研任务。
AI Scientist 一直是头部 AI labs 的重要研究课题:
去年末,Transformer 作者 Llion Jones 参与创立的 Sakana AI 推出首个全自动 AI 科研系统,这个系统能够独立完成从创意生成、编码、实验执行到撰写科学论文的整个研究流程;
今年 2 月,Google 推出了基于 Gemini 2.0 构建的 multi-agent 系统 AI co-scientist,可以协助科研人员做各种繁琐的科研任务,包括科研选题、文献检索和实验设计。
今年 5 月,前 Google CEO Eric Schmidt 投资的 AI lab FutureHouse 推出了四款 AI scientist agent,一个月后,他们又宣布自己的 AI 系统 Robin 在 2.5 个月时间内发现了一种治疗干性年龄相关性黄斑变性(dAMD)的新候选药物。
02:08 AI+生物领域在发生什么?
09:07 AI scientist 和一般的 agent、AlphaFold 等底层模型有什么不同?
11:40 FutureHouse 声称用 agent 能开发了出新的 dAMD 药物
15:04 通用 agent 做不好 AI scientist 是因为缺少合适环境和专家 know-how
20:07 Biomni 的核心是打造了一个 agent 能够执行大量研究任务的环境
26:34 Biomni 是完全依赖 LLM 的能力来使用工具、软件和数据库的
31:55 AI Scientist 是使用 AlphaFold 的 Agent 系统
33:50 AI scientist agent 未来进步的方向是环境和应用落地
37:21 数据是生物领域最大的瓶颈
40:23 Biomni 的使用场景和目标用户有哪些?
43:05 AI Biology 的 benchmark 有很多探索方向
48:37 AI for Science 也会出现自己的 Cursor、 Devin
49:59 到 2050 年,一个 agent 可能就能创造价值十亿美元 Biotech 公司
53:16 Big Pharma 们的 AI 实践:左手 AlphaFold,右手 ChatGPT
57:12 AI scientist 的进展与 AlphaFold 这样的科技突破同样令人兴奋
>> AI4Science 图谱,如何颠覆 10 年 x 20 亿美金成本的药物研发模式
>> 巨头博弈下,agent 的机会和价值究竟在哪里?
>> OpenEvidence,医疗领域诞生了第一个广告模式 Chatbot
>> Flagship 创始人:AI for Science 的下一步是 Multi-agent
>> Chai Discovery:OpenAI 投资的 AI4Sci 公司,AlphaFold 最快追赶者
>> Anthropic 创始人最看好的领域,AI for Science 深度解读
AlphaFold: Google DeepMind 开发的AI 模型,主要用于蛋白质结构预测,最早在2018年推出,2024年5月发布了 AlphaFold3,将技术扩展到蛋白质折叠之外,能以前所未有的精度准确预测蛋白质、DNA、RNA、配体等生命分子的结构及相互作用。它直接改变了上一代版本的核心架构,用“扩散模块”取代了上一代中非常重要的“结构模块”,标志着AlphaFold在技术上的又一次飞跃。
Biomni: 斯坦福大学最近发布的一个生物医学领域的通用 AI agent,整合了 150 种专业工具、59 个数据库和 105 种软件,可以执行生物医学子领域的各种研究任务,打破了传统科研流程中碎片化、低效的壁垒,显著提高了科研效率;
干实验和湿实验: 干实验通常指不直接操作生物材料的计算或理论工作,比如用计算机进行基因序列分析、建模模拟等;湿实验是指在实验室中直接操作生物样品(如细胞、蛋白质、DNA)进行的实验,如 PCR、培养、染色等。
CRISPR 技术: 一种基因编辑工具,能在特定 DNA 序列上进行高效、精准的剪切和修改,广泛用于基因功能研究和疾病治疗开发。
Virtual cell: 是使用多模态、生物与分子数据训练的神经网络模型,目的是在计算机环境中模拟细胞在不同状态下的行为与功能,为预测细胞动态和治疗响应提供虚拟实验平台。
FutureHouse: 由前谷歌 CEO 埃里克·施密特支持的非营利组织,成立于 2023 年,目前已推出了一系列专门用于科学研究的 AI agent
GWAS: Genome-Wide Association Study,即全基因组关联研究,这是一种通过比较大量个体的基因组变异与表型差异,寻找与疾病或性状相关的遗传位点的方法
CRISPR 实验: 指应用 CRISPR-Cas 系统对特定 DNA 进行剪切、修饰或调控的实验,常用于基因敲除、基因敲入或基因表达调控,广泛应用于基础研究、疾病模型构建及潜在治疗开发
Michael Snyder Lab: 斯坦福大学 Michael Snyder 教授领导的研究实验室,该实验室在个人化医疗、基因组学以及利用可穿戴设备进行大规模健康数据监测等前沿领域的研究中处于世界领先地位。
Scanpy: 一个基于 Python 的开源分析工具包,专门用于处理和分析单细胞 RNA 测序(scRNA-seq)数据。它是生物信息学领域进行单细胞分析的主流软件之一,能够帮助研究人员对细胞进行聚类、识别细胞类型、发现新的生物学标记等。
Oracle: 指理想化的、能为某个特定问题提供绝对正确或黄金标准的模型或系统。
pLDDT Score: 这是 AlphaFold 2 输出的一个关键指标,表示模型对所预测的蛋白质结构中每个氨基酸残基位置的置信度,分数越高,代表模型对该局部区域的结构预测越有信心,结构也更可能可靠。
AlphaEvolve: 这是 DeepMind 2025 年推出的进化式 coding agent,通过不断生成、评估和优化代码,能够自主改进算法并发现新方案,目前已在矩阵乘法、数据中心调度和芯片设计等领域实现突破。
Popper: 这是柯鑫作为核心作者开发的一个 multi-agent 系统,设计灵感源于科学家 Karl Popper 的可证伪性原则,目的是自动化“假设生成-实验验证”的科学发现循环:由一个 agent 负责从海量数据中提出科学假设,另一个 agent 则负责设计实验来验证或证伪这些假设,从而大规模地挖掘潜在的科学洞见。