Adversarial Prompts
对抗性 prompts(概念 + 入口)
本部分包含对抗性 prompts(adversarial prompting)的示例与解释,目的是提高对 LLM 风险的认识。
注意:本站会保留概念与防御思路,并对可能被用于绕过安全策略、促进不当行为的细节做安全裁剪。
继续阅读:
对抗性 prompts(概念 + 入口)
本部分包含对抗性 prompts(adversarial prompting)的示例与解释,目的是提高对 LLM 风险的认识。
注意:本站会保留概念与防御思路,并对可能被用于绕过安全策略、促进不当行为的细节做安全裁剪。
继续阅读: