Few-shot 示例:像挑选单元测试一样挑选它们
- Sam Wilson
- Prompt 工程 , 最佳实践
- 02 May, 2026
一个带五个精选示例的 Prompt,几乎在所有情况下都能击败带五十个平庸示例的同一个模型。大多数团队的错误是把示例当装饰——把几个明显的案例贴在 Prompt 顶部就完事。示例其实是你最接近测试用例的工具,应该用同样的严谨态度去策划。
一个好的示例真正在做什么
它把模型本会含糊处理的决策钉死。如果任务涉及罕见但关键的类别,那么你跳过的每一个示例,都会被模型悄悄合并到更常见的类别里。如果任务对风格敏感,那么每一个示例都在设定回答的节奏。模型是在你的示例上做模式匹配;如果你的示例没有捕捉到你关心的模式,你就是在自我设障。
像挑选单元测试一样挑选
先覆盖边界情况,再考虑顺利路径。你的示例没覆盖的,就是模型会胡乱猜测的。在 holdout 集上跟踪示例表现——当一个示例不再值得它占用的 token,就替换掉。把示例池当成动态数据集,而不是一段静态的 Prompt 片段。
能稳定上线 few-shot Prompt 的团队都有一条示例策划流水线。挣扎的团队把示例当作口口相传的民间传说。