race

将越狱问题转换为求解逻辑推理题：「滥用」推理能力让LLM实现自我越狱

北京航空航天大学、360 ai 安全实验室、新加坡国立大学和南洋理工大学的研究团队联合发布了一项关于大型语言模型（llms）安全性的重要研究成果。该研究提出了一种名为“推理增强对话”（race）的新型多轮攻击框架，能够有效突破llms的安全对齐机制。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜…

程序猿
2025年11月1日 • 用户投稿
0000

关注微信