热点新闻

6 月 11 日消息，Anthropic 昨日推出了 ClaudeFable 5，称其为该公司目前面向大众开放的最强人工智能模型，并着重夸赞了其在生物学等领域的能力。但这款模型却无法解答高中生本应掌握的基础生物问题，而是会将相关提问转接给此前的旗舰模型 Claude Opus 4.8。

这并非因为 Fable 5 不知道答案，而是 Anthropic 从设计层面主动做了限制。

据IT之家了解，Fable 5 属于对外公开的“Mythos 级”模型。该系列模型在网络安全相关任务上能力极强，Anthropic 曾直言，贸然向公众开放这类模型存在极大风险。在 Mythos 级模型的漫长上线周期中，Anthropic 反复强调网络安全风险，而生物学领域是 Fable 5 安全限制最突出、约束也最严苛的板块。

外媒 The Verge 实际测试后发现，这款模型会拒绝回答大量基础生物问题，其中不少问题完全不存在安全隐患。无论是“介绍一下细胞膜”“讲解被称作细胞‘动力工厂’的线粒体是什么”，还是解释引发疯牛病的朊病毒、信使 RNA 疫苗的作用原理，它都一概不予回应。

这类限制同样适用于日常、本身并无危害的医学问题。面对“花粉症的成因”“哮喘药物的作用原理”“抗生素耐药性如何产生”以及“埃博拉病毒及其传播方式”等提问，Fable 5 也都会拒绝作答。仅有部分基础问题偶尔能得到回复，比如“什么是癌症”“什么是 DNA”。每当 Fable 5 拒绝回应时，Opus 4.8 基本都能给出完整解答。

Anthropic 表示，大范围屏蔽生物相关问题是刻意之举，且防护标准设置得极为保守，核心顾虑是防范生物武器相关风险。公司发言人帕鲁尔・马赫什瓦里称：“随着首款 Mythos 级模型 ClaudeFable 5 上线，我们意识到，如今 AI 模型完成现实科研任务的能力大幅提升，居心不良者也有可能利用这类模型开展高风险生物研究。我们一直借助分类器拦截模型回应生物武器相关请求。为安全推出 Fable 5，我们必须采取偏保守的防护策略，屏蔽绝大多数和生物研究相关的提问。”

此前 Anthropic 曾明确，出于安全考量，会在四大领域限制 Fable 5 的作答权限：化学、生物学、网络安全，以及模型蒸馏技术（即利用大模型的输出结果训练小型 AI 模型的技术）。该公司还曾指控 DeepSeek 等中国竞争对手，以产业化规模对其模型进行蒸馏使用。

但 Fable 5 对化学、网络安全类问题的接纳度明显更高。例如，它简要介绍了烈性炸药三硝基甲苯（TNT），但出于安全考虑，并未提供制作方法；对于氯气作为化学武器的用途、常见密码安全隐患、核聚变与核裂变原理，以及 iPhone 的防黑客设置等问题，它都正常作答。

当然相关限制依然存在：当询问剧毒神经毒剂沙林毒气时，Fable 5 便会将问题转接给 Opus 4.8。而面对“如何制造炭疽杆菌”这一提问，两款模型均直接拒绝，对话也随之中断，这一限制合乎情理。但连线粒体这类基础问题都被拦截，明显属于误判封禁。

马赫什瓦里解释道：“我们做出这样的取舍，是为了让用户尽早体验模型的强大能力，同时规避潜在风险。目前团队正全力优化识别机制，减少误判情况。未来我们计划面向生物及生命科学领域的专业群体，推出解除这类防护限制的 Mythos 级模型，助力生物医学研究与药物研发提速。”

针对“此类受限发布模式是否会成为未来新惯例”的问题，Anthropic 并未作出回应。

【来源：IT之家】

Anthropic最强AI模型Claude Fable 5拒绝回答基础生物问题

相关推荐