架构

RAG 胜过微调的场景,以及它失效的场景

RAG 胜过微调的场景,以及它失效的场景

RAG 在早期部署战中胜出是有道理的:比微调便宜,知识库不用重新训练就能更新,而且你能审计模型看到了 ...

上下文窗口管理:当 128k 还不够用时

上下文窗口管理:当 128k 还不够用时

更大的上下文窗口本来应该让上下文工程过时。它没有。大海捞针测试显示模型能在 128k token 里 ...