Performance

上下文窗口管理:当 128k 还不够用时

上下文窗口管理:当 128k 还不够用时

更大的上下文窗口本来应该让上下文工程过时。它没有。大海捞针测试显示模型能在 128k token 里 ...