跳到主要内容

AI 安全

AI 安全是本站更长远的研究方向。

这一区汇集模型行为、智能体系统、工具调用、提示注入,以及 AI 嵌入到真实产品之后所暴露出的安全问题。

当前涉及的主题包括:

  • 提示注入 / 越狱(jailbreak)
  • 工具调用 / 智能体安全
  • 记忆、检索、MCP 与浏览器自动化带来的风险
  • 模型行为分析
  • 红队方法
  • AI 产品的安全评估

材料还在被慢慢整理成更清晰的结构。某些页面属于基础概念;另一些则是绑定到具体攻击面或系统设计的窄主题笔记。