跳到主要内容

AI 安全

AI 安全是本站更长远的研究方向。

这一区汇集模型行为、智能体系统、工具调用、提示注入，以及 AI 嵌入到真实产品之后所暴露出的安全问题。

当前涉及的主题包括:

提示注入 / 越狱(jailbreak)
工具调用 / 智能体安全
记忆、检索、MCP 与浏览器自动化带来的风险
模型行为分析
红队方法
AI 产品的安全评估

材料还在被慢慢整理成更清晰的结构。某些页面属于基础概念;另一些则是绑定到具体攻击面或系统设计的窄主题笔记。