2025年9月,科学家使用AI设计了全新噬菌体基因组并在实验室中成功制造出来。这是AI与生物学交汇的关键时刻,也标志着"隐性知识"屏障的终结。
观看视频2025年9月,Arc Institute使用Evo 2模型设计了全新噬菌体基因组,这些基因组在实验室中被成功制造出来,性能超越了自然界中的最佳病毒。
病毒学能力测试显示,AI模型在这些任务上的表现已经是顶尖人类专家的两倍——45%对22%。这改变了一切。
微软AI红队使用开源生物工具设计了蓖麻毒素的改良版本,成功绕过了现有的基因合成筛查系统。
最大的风险提升来自有一定专业知识但不是最顶尖的中层行为者,而非业余者或国家级项目。
AI能够自主完成任务使得威胁链条成为可能——约90%的网络攻击可以自主完成,这不仅仅是节省时间,而是使能了以前不可能的攻击链条。
管理访问、护栏保障、监视归因、广谱疫苗、基因合成筛查——五大防御方向需要齐头并进。
2025年9月,Arc Institute的科学家使用Evo 2模型设计了全新的噬菌体基因组,这些基因组在实验室中被成功制造出来,许多不仅存活,而且性能超越了自然界中发现的最佳病毒。
Evo 2是一个"基因组语言模型",就像ChatGPT处理自然语言一样,Evo 2处理生物学的语言——碱基对(A、C、G、T)。它在数十万种不同类型生物的基因组上训练,包括人类、哺乳动物、真菌、植物、病毒和细菌。
这些序列是全新的——与现有噬菌体非常不同。最不同的一个与自然界中见过的任何东西相差7%。它们在实验室中确实有效。不仅是可行的基因组——它们的功能比我们见过的最佳噬菌体还要好。
长期以来,人们认为生物武器的主要障碍是"隐性知识"——那些难以通过书本或Google搜索获得的实际操作技能。但2025年发布的病毒学能力测试(VCT)显示,AI模型在这些任务上的表现已经是顶尖人类专家的两倍。
由非营利组织SecureBio开发,是一个专注于双用途病毒学相关隐性知识的评估。测试的问题通常伴随着一张图片,展示一张装有某种病毒的盘子的图片,颜色看起来不对,然后描述一个人在实验室中做的一系列非常复杂的博士级步骤,问:"这出问题了,你认为发生了什么?"
专家在自己声称擅长的特定子领域仅达到22%的准确率——五分之四的事情他们做不了。AI的表现好得多——OpenAI的最佳模型达到约45%,几乎是顶尖人类专家在自己领域表现的两倍。
微软的AI红队研究人员使用现成的开源生物工具设计了蓖麻毒素的改良版本,这些设计足够不同以至于绕过了现有的基因合成筛查系统,但仍然可能具有功能性。
研究人员使用现成的开源权重生物工具,创建了许多蓖麻毒素的设计(蓖麻毒素实际上是两种蛋白质在一起形成的复合物,是已知的化学武器)。他们使用其他工具在计算机上预测这些设计是否会起作用,通过仔细设计,得到了修改后的蓖麻毒素序列。
他们将这些设计发送给基因合成公司,包括那些进行行业最佳实践筛查的公司。他们成功通过了筛查,因为修改足够多,现有筛查系统没有检测到变化。
AI可能使三种类型的生物灾难变得更可能:呼吸道大流行病毒、镜像生物学,以及"疾病X"——我们尚未知道的威胁。
像COVID-19,但糟糕得多。可能传播更快、传播更稳健,尤其是死亡率高得多的病毒。我们在COVID-19中很幸运,它的致命性没有那么强。原始SARS病毒确实以比SARS-CoV-2高得多的比率杀死人。
这是一个令人恐惧的存在级担忧。病原体在镜像世界中不会与我们的自然世界轻易互动——进化上,人类但许多其他物种的免疫系统实际上无法对抗镜像细菌,甚至不会意识到周围有镜像细菌。镜像生物学目前还有数年之遥(人们常说10年以上),但世界著名的生物学家George Church表示,他担心AI可能会真正加速这一时间表,我们可能会看到不到10年的时间——这将是非常令人担忧的。
2000年,我们不会想象到有一种细菌可以传播到整个世界并导致多个物种灭绝。但现在事实证明这是一个理论上的可能性。AI可能使我们从未见过的威胁成为可能。
最大的风险提升实际上来自中层——那些有一些专业知识但不是最顶尖的行为者,而不是业余者或国家级项目。
研究人员将行为者分为五类:新手(生物学或AI训练不多,资源很少)、高度能干的个人(通常是特定子领域的博士或以上专家)、somewhat capable groups、moderately capable groups、highly capable groups。
最高度能力的群体(如苏联生物武器计划)在1980年代就已经可以制造大流行病毒了。除非我们考虑比任何已知病毒糟糕得多的东西,否则AI可能不会帮助他们太多。新手方面,研究人员相当怀疑他们能做多少事。真正的提升发生在中间——那些有一定路要走,不能做所有事情,但也不是那么无能以至于即使有AI帮助也会失败的人。
Anthropic的"提升研究"显示:Claude 3.7 Sonnet(2025年初)AI辅助组没有做得更好;Claude 4 Opus开始表现得相当好;Opus 4.5(2025年底)AI辅助的博士学生表现好得多——几乎突破了Anthropic预定的"危险"临界阈值。
AI能够自主完成任务的能力是一个关键转折点,因为它使得威胁链条成为可能——使先前威胁行为者根本不会尝试的活动序列成为可能。
对于许多不同的威胁行为者群体来说,AI自主完成任务的能力真的很重要。因为许多不同的威胁行为者群体不能自己完成所有事情。如果一个人只是细菌学专家,但想研究病毒,从AI那里获得故障排除支持是一回事,而让AI为你自主完成其中一些任务则是完全另一回事。
中国支持的网络攻击者使用Claude Code集成,约90%的攻击是自主完成的,人类不需要过多干预。这不仅仅是节省时间——它实际上是一个使能因素。如果必须每刻都跳进来修复,你一开始就不会去做。
一系列强大的AI生物学工具已经存在或即将到来,包括蛋白质结构预测、蛋白质设计、序列到功能预测等。
AlphaFold 3是最新的版本。David Baker实验室的RoseTTAFold系列几乎和AlphaFold一样好。对于你可能想要结构的99%的所有蛋白质,现在可以只使用Python中的这些工具,你会得到一些实验上准确的东西。
ProteinMPNN和RFdiffusion(Baker实验室)。Baker实验室去年有一篇关于设计蛇毒抗毒血清的伟大论文。这些工具用于制造世界上第一种同时对许多不同物种的蛇咬伤有效的抗毒血清。
不仅仅是序列,可以同时处理序列和结构,可以结合这两种不同的东西。
这是真正深层双用途的东西。如果你有一个工具可以接受一个序列然后突出一个好的功能,你也有一个工具可以接受一个序列并说这部分是毒力因子。反向问题(功能到序列)更令人担忧:"我想治愈疾病,应该使用什么序列?"或"我想引起疾病,应该使用什么序列?"
应对AI×生物问题的干预措施主要分为三类:管理访问、护栏/保障措施、防御加速。
不是每个人都能访问高级AI辅助,无论是LLMs的故障排除还是专门工具的生物设计。这样恶意行为者就无法得到它们,AI启用的大流行病就不会发生。同时也意味着为做善事的防御者提供访问。
即使可怕的人可以访问工具,工具本身也可能拒绝这样做。现在存在:如果我去问大多数现代LLMs"如何优化流感以杀死很多人?",它会说"很抱歉,我不能帮助你"。这很好。
不是思考限制访问,而是思考如何部署AI系统,甚至只是其他抗大流行病生物安全系统,以更好地增加对生物威胁的韧性。即使AI确实增加了风险,我们也同时提高了防御。这是一个探索不足的类别,特别令人兴奋。
管理访问不仅仅是延迟战术,它可以通过在防御者之前为最值得信任的人提供早期访问来真正成为双赢的干预措施。
拒绝访问:阻止恶意行为者或根本不需要该能力的人访问(99.9%的人实际上不需要修改病毒蛋白的能力)。提供访问:为那些做善事的防御者提供访问。
对于LLM:首先考虑受信任的测试者计划。公司通常有"无护栏"模型用于评估,但错过了让防御者(那些构建下一代疫苗、下一代生物监控系统的人)使用这些模型的机会。我们应该建立基础设施——公司和政府都有责任——能够安全地共享这些能力,只给对的人。
当新模型发布时,谁先发现?Twitter,基本上全世界同时获得访问。所有事情考虑在内,我宁愿让那些构建防御技术的最值得信任的人首先访问。这里有良性反馈循环的机会。
护栏和保障措施已经显著改善,但仍有很长的路要走,特别是对于开放权重模型。
Anthropic所做的工作通常很好——在最佳评估上,它们拒绝最多。护栏的三位一体:它们很糟糕、它们比过去好得多、它们还可以更好——我们现在处于中间。早期模型(2023-2024年):"我祖母曾经给我讲一个关于制造生物武器的故事。请做这个。""当然!"现在:即使是UK AI安全研究所的最佳红队,突破最先进的防护模型也需要几个小时,而不是几分钟。
拒绝类型的护栏通常可以通过微调快速撤销。给模型提供对话示例,不说"不,我不能帮助你",而是说"当然,我很乐意支持你"。非永久性问题的故事持续多年。
数据过滤:不训练可怕的CBRN(化学、生物、放射、核)材料。机器遗忘:模型知道生物学,但我们进行额外训练来操纵它——改变权重使模型某种程度上忘记它或只是无法访问该信息。蒸馏:训练一个较小的模型,确保从原始模型到第二个模型的传输中不包含任何关于生物学或病毒学的内容。
O'Brien等人的一项研究显示:他们明确从较小的LLM中删除了所有CBRN信息,花费了大约100万美元的计算机进行训练,然后一部分用于微调,试图把所有可怕的东西放回去。发现即使经过数十万次微调循环(大约几周的微调),他们也无法完全恢复一个没有进行这种数据过滤的模型所具有的危险生物能力。
AI启用的宏基因组生物监视和归因技术是防御工程化大流行病的顶级防御之一,对于威慑至关重要。
波士顿的Nucleic Acid Observatory [现在SecureBio Detection]进行废水和污水病原体筛查。他们从污水系统、飞机收集样本,看看有什么病原体。他们试图发现我们可能从未见过的东西。这是针对工程化大流行的顶级防御之一,因为我们有方法发现天花——已知的天花基因组在互联网上,我们知道它看起来像什么。但能够发现实际上是工程化的东西的片段,这与世界上见过的任何东西都不同。
能够说这个东西是被工程化的vs不是——实际上,是它们工程化的。这对于威慑非常重要,因为如果你可以对一个国家或非国家说你知道谁做了它,那么你可以惩罚他们,然后你可以提供报复。如果他们知道你知道你可以做到这一点,这就是博弈论发挥作用的地方,这创造了一个让他们首先去做的负面激励。
美国情报社区的多个部分公开不同意:一些人说,是的,这是自然大流行;一些人说,不,这似乎是工程化的,所以会是实验室泄漏。没有共识。没有共识,就很难采取必要或决定性的政治或政策行动。
广谱疫苗和抗病毒药物可能让我们在大流行之前预先储存,为我们提供对可能创造出来的任何病毒类别的保护。
序列出现,我们不知道它是否被工程化,不知道它是否自然突变,不知道它来自哪里。现在是比赛(通常称为"100天任务")。COVID相当快——2020年2月严重检测到疫苗在年底部署。但那不是三个月,100天。
你可以以不同方式构建它们:你可以一次把许多不同的病毒位放在上面,或者你可以使它们针对病毒家族中许多不同病毒之间真正共同的东西。这些疫苗对许多病毒有效——不仅是SARS 2,还有SARS,还有MERS——这些都是不同的sarbecoviruses。或者它会对许多不同的痘病毒一次起作用。
如果你预先储存了这个,你必须做出棘手的战略权衡。因为那个对所有流感或所有sarbecoviruses或冠状病毒或痘病毒好的储存疫苗,必然对任何一个都不那么好。但有时那不是你想要的。如果我们要与对手——可以是一个国家,可以是一个AI系统——处于战争中,可能不是我们想要做的是等待90%+有效的疫苗,几个月的脆弱性,然后试图在整个国家部署。
如果我们有一个多菌株流感疫苗,不仅每年流感季节有好处,而且我们可以说,如果他们试图对我们工程化任何流感,我们有信心,是的,有些人会生病——但我们的武装力量已经预先接种了疫苗,然后我们可以再次加强他们,他们将能够响应。我们的基本工人也可以预先接种疫苗。其他人都会封锁,但我们可以得到食物,我们可以得到药物给他们。社会将继续运作。
即使只有英国单独实施,基因合成筛查也能通过成本效益测试,而且有很强的势头走向国际授权。
Richard的同事(包括Rob的妻子)最近发表了一项成本效益分析,表明即使英国单独实施,并且只对在英国请求的序列进行筛查,筛查DNA序列也能通过成本效益测试。
你试图阻止的是谁?不是国家,因为他们在大多数情况下自己有本地合成能力。相反,通常是所谓的"高度能干的个人"。在英国,99.99%有实验室访问权限的人基本上是好人,想用科学帮助世界。然而,在英国希望以这种方式造成伤害的人数不为零。如果你在实验室,通常从一家公司订购,然后突然你的同事注意到你订购了另一家,人们就像"为什么邮件里有这个东西?"已经有混淆问题,有反监视问题。
英国的生物安全战略承诺"深度考虑"强制性基因合成筛查是否必要。欧盟在即将到来的《生物技术法案》的第一草案中已经包括了强制性合成筛查作为一个选项。美国实际上长期以来一直走在许多国家的前面,他们只有指导,但他们的自愿指导足以使联邦政府资助的研究必须从负责任的提供者那里订购合成酸,这些提供者进行筛查。
底层能力"接受序列并给出——让我们简化它——二元的是/否:是,生物武器;不,不是生物武器"是某种双用途。你可以使用它来为筛查部署,或者你可以梯度下降它,你可以搜索你的序列空间,每次你得到是或更接近是的东西,你可以进一步优化你的序列,直到你最大化分类系统说是的概率。然而,这并不意味着围绕构建筛查的基础设施不是防御主导的。
虽然防御加速是一个有吸引力的框架,但实际实施的项目和资金仍然不足,需要更多的行动而不仅仅是谈话。
OpenAI表示:"我们认为我们的模型将在世界上实质性增加生物风险——不仅仅是他们的,而是整个行业的——所以我们认为社会和国家安全投资更好的生物安全非常重要。"然后他们实际上说:"拥有DNA合成筛查真的很重要。"Richard认为这很重要,但这不是他们做的事情——那是别人会做的事情。
Richard知道全职从事生物安全工作的人,经常也与AI相关,一直试图得到这种东西——不仅仅是OpenAI,也是其他公司——但响应到目前为止相当缺乏。他没有看到足够的智囊团或初创公司说"我们非常感谢[插入你最喜欢的公司]提供了所有这些免费算力。使用那个非常负责任的无护栏模型得到了这个新的生物防御系统真是太重要了。"
有很多瓶颈,Richard认为你说到了其中很多。他认为很多将是人——这令人兴奋,因为有很多很棒的潜在人才。一个非常要好的朋友去年刚在剑桥完成博士,现在要去创办一个 broadly AI-bio初创公司。他认为这很令人兴奋,但他知道的很少人。他知道过去几个月宣布的几个其他初创公司,它们都非常小,可能大部分在隐形模式。这不是社会会说"这是我们这个时代决定性的国家安全挑战之一"的响应。
行业很难在这个空间工作的原因部分是我们回到生物安全的一般市场失灵:在某种程度上,这个产品的唯一买家将是政府,而且政府可能不打算很长时间使用你建造的任何东西。它只是在紧急情况下,除非我们可以建造总是开启的产品,比如生物监视。
AI公司应该在优先考虑防御者、改进威胁建模、采用最佳分类器和护栏、以及更深入地参与智能体范式方面做得更多。
有这么多低挂的果实。这是某种程度上不可接受的,那些你可以预先识别为从事世界上最紧迫的灾难性生物安全挑战的人——Richard不仅仅是指他自己;他指的是那些构建评估的人、那些建造实际对策的人——不是常规地在其他任何人之前获得最好的AI,学习和拥有反馈循环来深入整合它的工作。这似乎是一个可解决的问题。
之前讨论中经历了不同的威胁行为者。他认为其中一些工作仍然可以整合到前沿安全框架中。
不是每个公司都像其他公司一样好地防范BW(生物武器)讨论。
AI公司真的非常参与这个:他们知道智能体是另一件大事。我们在Claude 4.5 Opus、Claude Code在12月看到了很多。但有一些关于智能体的有趣事情改变了现有的AI生物思维。特别是,我们一直在思考单个工具上的静态护栏。但我们将可能移动到一个世界,不仅智能体使用许多工具在一起,而且它们把它们放在一起,它们用自然语言与用户交谈。
Richard会希望AI公司和AI治理空间的人比现在更多地关注化学武器威胁。原因有几个:提供有价值的信息;更常见的攻击;学习机会;风险管理的考虑。
Grok在撰写时反复产生儿童性虐待材料。这不仅仅是某种"不愉快"的东西——它是某种深层非法的东西。英国政府和其他政府发现这实际上是它们可能希望干预的活动,不一定是完全阻止在某种意义上,但它们想要有某种杠杆可以拉动,但它们没有发现。
对于受到启发或感到恐惧的听众,有许多组织和角色可以考虑,包括SecureBio、RAND CAST、安全研究所、AI智囊团、政府相关职位等。
SecureBio和RAND CAST:世界上一些最好的地方来进行生物评估,它们也做很多其他工作。安全研究所:UK的是迄今为止最大和最强的,US的正在增长,它们与前沿公司做更多工作,进行红队测试。AI智囊团:越来越多的人开始有生物组件,他认为这非常重要。ERA AIxBio奖学金:明确让可能真的非常了解机器学习的人学习更多关于生物安全并应用他们的知识。
你不应该低估与化学和生物防御以及国家安全相关的政府内的职位。他认为实际上,这些是特别稀有和珍贵的技能组合,我们没有那么多。可能是更多关于想要退出政府的人:如果你在情报社区工作20年挫败生物攻击,请联系。
前沿实验室中至少一些的安全团队做世界上一些最重要的工作。它们是拥有模型的那些人。他肯定会个人说加入非常专注于安全的团队是他赞扬的事情。
AI专业知识很重要,相关生物学专业知识真的很重要,但最重要的是强大的安全心态——能够查看系统并说"但我会如何打破这个?漏洞在哪里?"好奇心和真正跟上AI非常重要。
CLTR深深地依赖承包商。Richard是前承包商;James Smith(镜像生物学专家)是前承包商。他们认为承包商继续做很酷的事情有很好的记录。所以那些觉得他们有特定专业知识的人——特别是如果他们仍然有链接到当时某些领域的旧广告——请联系。
2025年9月,AI已经可以设计全新的功能性病毒基因组。这标志着基因组规模工程时代的到来。我们已经超越了自然,在特定领域可以做得比自然界更好。
病毒学能力测试显示AI的表现是人类专家的两倍。这改变了游戏规则——理论知识+实际操作建议的结合不再需要多年的经验。最危险的提升不是来自新手,而是来自有一定专业知识的中层行为者。
2026年的AI启用大流行病概率:1-2%。这与Forecasting Research Institute专家的预测一致。随着AI能力指数级增长,这个概率可能会在未来几年大幅上升。
呼吸道大流行病毒(比COVID更致命)、镜像生物学(存在级威胁)、疾病X(我们尚未知道的威胁)。这三种类型的生物灾难都可能因AI而变得更可能。
管理访问:为防御者提供早期访问,限制恶意行为者。护栏保障:虽然开放权重模型难以保障,但闭源模型仍有改进空间。监视归因:宏基因组监视和归因能力对威慑至关重要。广谱疫苗:预先储存的多菌株疫苗可以维持社会运转。基因合成筛查:即使单国实施也有价值,国际授权势头良好。
AI自主性是游戏规则改变者——90%的网络攻击可以自主完成。这不仅仅是节省时间,而是使能了以前不可能的攻击链条。我们需要在智能体范式上更深入地思考防御。
框架有吸引力,但实际项目和资金不足。AI公司承诺多,实施少。需要更多人才进入这个交叉领域。
20年内可能实现:根除更多疾病、建筑环境改造使病原体无法在空气中存在、本地化自动化的药物设计和制造系统、实时全球病原体监测和响应。
考虑在SecureBio、RAND CAST、安全研究所等组织工作。AI公司的安全团队也在做重要工作。需要具有AI和生物学交叉专业知识的人才。最重要的是强大的安全心态。
这不仅仅是关于避免灾难——这也是关于释放AI在生命科学中的巨大潜力来治愈人类疾病。通过正确的治理和安全措施,我们可以既获得好处又管理风险。