OpenAI 还表示,为 GPT-5 引入了一种新的安全训练形式,名为安全补全(safe completions)。它教模型在安全范围内尽可能给出最有帮助的答案。有时,这可能意味着部分回答用户的问题,或者只提供高水平的回答。
如果需要拒绝,经过训练的 GPT-5 会以透明的方式告知用户拒绝的原因,并提供安全的替代方案。
在受控的实验和 OpenAI 的生产模型中,OpenAI 都发现这种安全补全的方法更加细致入微,能够更好地引导双重用途问题,增强对模糊意图的鲁棒性,并减少不必要的过度拒绝。
OpenAI 的后训练负责人 Michelle Pokrass 表示:「GPT-5 已经过训练,能够识别任务何时无法完成,避免猜测,并能更清晰地解释局限性,相比之前的模型,这减少了无根据的断言。」
推出四种可选的 ChatGPT 聊天预设性格OpenAI 称,GPT-5 在指令执行方面表现提升,其执行自定义指令的能力也得到了相应的提升。OpenAI 将为所有 ChatGPT 用户推出四种预设性格的全新研究预览版。
初始的四种性格选项——愤世嫉俗者(Cynic)、机器人(Robot)、倾听者(Listener)和书呆子(Nerd)都是可选的,用户可在设置中随时调整,用以匹配 ChatGPT 和用户的沟通风格。
上述四种性格最初适用于文本聊天,之后将扩展到语音聊天,让用户无需编写自定义提示词即可设置 ChatGPT 的交互方式——无论是简洁专业的、周到支持的,还是略带讽刺的。
OpenAI 称,所有这些新性格都达到或超过了我们减少谄媚行为的内部评估标准。
Altman 盛赞历史性突破 用回 GPT-4 后效果相当糟在本周四的简报会上,Altman 对 GPT-5 给予了极高评价,将 GPT-5 定位为通往 AGI 的重要里程碑。他表示:
「在以往历史上任何时期,拥有像 GPT-5 这样的东西都是不可想象的。」「这是第一次感觉就像在与任何领域的专家交谈。」
Altman 在简报会上甚至不惜用「踩」GPT-4 抬高 GPT-5。他说:
「我尝试过用回 GPT-4,但效果相当糟糕。」
GPT-5 采用统一的系统架构,配备实时路由器,能够根据对话类型、复杂性和工具需求自动决定是快速响应还是进行深度「思考」。这消除了用户选择合适设置的需要,使 ChatGPT 更易于使用。
在经济价值工作的内部基准测试中,使用推理模式的 GPT-5 在大约一半的案例中可与专家水平相当或更优,涵盖法律、物流、销售和工程等 40 多个职业。OpenAI VP Nick Turley 称:「这个模型的感觉真的很好。」
Altman 比喻,使用 GPT-5 就像随时拥有一支学历通通为博士的专家团队。他还说:「在很多新领域,人们受到想法的限制,但实际上却没有执行能力。」
微软全面整合抢占先机