架构

RAG 在早期部署战中胜出是有道理的：比微调便宜，知识库不用重新训练就能更新，而且你能审计模型看到了 ...

更大的上下文窗口本来应该让上下文工程过时。它没有。大海捞针测试显示模型能在 128k token 里 ...