Open AI 发布防止 LLM 越狱的研究 训练LLM优先考虑特权指令,避免越狱的措施包括: 造成这种漏洞的一个主要原因是,LLM往往无法区分来自系统的指令和来自不可靠用户或第三方的文本,对它们给予相同的优先级处理。 为此,我们设计了一种指令优先级系统,明确规定了在不同优先级指令发生冲突