经得起长会话的 System Prompt
- Sam Wilson
- Prompt 工程 , System Prompt
- 10 May, 2026
每个团队都精心写过 system prompt,然后忘掉它。模型在前几轮里遵守它,之后开始忽略——不是因为 prompt 写得差,而是因为对话历史在模型注意力里压过了 system 指令。到第十五轮时,你已经是另一个系统,不再是测试覆盖过的那个。
漂移真实的样子
格式先垮:被要求总是以 JSON 回复的模型,开始加歉意开场白。语气接着垮:一个”专业、简洁”的角色变得健谈。拒答策略也松动:模型对边界情况的立场,随用户施压时间变长而越来越软。任何单轮都不戏剧化——是累积漂移破坏了生产行为。
真正能锚住的模式
每 N 轮在 system prompt 或前置 user 消息里重新注入关键约束。把 system prompt 写短——长 prompt 会被模型内部表征汇总,被汇总的约束就失去了牙齿。用 20 轮以上的对话来测试,而不是 3 轮的顺利路径。你不衡量的漂移,就是上线之后还在漂移的那个。
System prompt 不是放所有你希望模型记住的话的地方。它是放那些必须在对话里活下来的东西的地方。