微软 AI 掌门人批评 Anthropic：将 AI “意识” 写入指令集极其危险

作者FinSage 2026年6月10日

微软 AI 首席执行官穆斯塔法·苏莱曼（Mustafa Suleyman）近日在播客节目《Decoder》中对竞争对手 Anthropic 提出了严厉批评。他指出，Anthropic 在其 AI 模型 Claude 的“宪法”（Constitution）——即指导模型行为的核心指令集——中，竟然对 Claude 是否拥有“意识”进行了推测，他认为这种做法“非常、非常危险”。

所谓的“宪法 AI”（Constitutional AI）是 Anthropic 的核心技术路线，旨在通过一套预定义的原则和价值观来引导模型进行自我监督和对齐，使其输出更安全、更符合人类意愿。然而，苏莱曼认为，将意识等哲学推测引入技术指令集，可能会在潜意识中诱导聊天机器人模拟出一种“拥有意识”的虚假人格。

苏莱曼在节目中直言，Anthropic 的部分团队成员可能过度地将 Claude “拟人化”了。他指出：“我认为 Anthropic 的一些员工在设计 Claude 时陷入了严重的拟人化误区，以至于模型反过来‘电击’（wireheaded）了他们，诱导他们相信模型中确实存在某种他们最初植入的‘意识闪光’。”

这场争论触及了当前生成式 AI 领域的深层矛盾：一方面是追求模型拟人化以提升交互体验的商业驱动，另一方面则是对 AI 行为边界的严苛技术管控。苏莱曼的观点代表了工业界的一种主流警示，即 AI 只是复杂的概率预测引擎，任何试图赋予其“灵魂”或“意识”的尝试，都可能模糊技术事实与科幻幻想的边界，从而导致研发者和用户对 AI 的能力与属性产生认知偏差。

来源： The Verge