Caveman:砍掉 AI 80% 废话,一个让编码助手闭嘴干活的开源利器

你坐在终端前,盯着 Claude Code 输出一段长达 300 字的解释,来回答一个只需要 30 字的问题。你知道这段文字花了你多少钱——每一个 Token 都是按量计费的,而其中大半是”您的思路非常好”、“让我补充说明一下”、“希望这对您有帮助”这类问候和客套。而你已经习惯了。问题是:你到底在为 AI 的什么买单?

这不是个别现象。有开发者做过统计:同是解释一个 React 组件重渲染 Bug,普通模式跑了 1180 Token,Caveman 模式只烧了 159 Token,结果完全对等——直接砍掉 87%。GitHub 上一个名叫 Caveman 的项目,只做了一个决定,就拿到了 44.8K Star:把模式切到极简,拒绝一切社交润滑。

Caveman 的思路粗暴到令人感动。它不修改模型参数,不换架构,不做精调。它只做一件事:在 System Prompt 里告诉 AI,“你不是文明人,你是野人。别寒暄,别铺垫,别总结。直接说事”。听起来像开玩笑,但效果是真实的。强制模型进入简洁模式后,研究发现准确率不仅不降,反而因为卸下了”维护礼貌人设”的认知负担而略有提升。

它不是一刀切。Caveman 给了三档压缩强度。Lite 模式精简填充词,保留完整句式,适合正式记录和对外文档。Full 是默认态,砍冠词、碎片化表达、纯野人风格,日常开发沟通和查错时最顺手。Ultra 直接进入电报模式,大量缩写和符号替代,追求极致的 Token 省钱。更关键的是,它分得清什么是废话什么是代码:技术名词、函数名、文件路径、代码块全部原封保留,只把自然语言里的虚词和修饰成分碾碎。

想象一个典型的下午:你连续调试三个 Bug,每个要来回三四轮。认证中间件过期问题的排查跑了 704 Token,PostgreSQL 连接池配置居然烧了 2347 Token,React 错误边界组件实现干到 3454 Token。切换到 Caveman 后,这三个数字分别变成 121、380 和 456。一小时高密度对话的 10 万 Token 变成了不到 2 万。省下的不是钱——钱只是表象。真正省下的是打断你思路的等待时间,是翻屏找关键信息的注意力开销。

三个场景最能说明它的价值。场景一:你接到一个陌生报错,只想快速知道根因和修复方式,不需要副陪词汇和延伸阅读。Caveman Full 模式给一个碎片化的技术结论,半句话切入正题。场景二:你在做代码审查,需要 AI 逐段扫描安全隐患。Caveman 的压缩比约为 41%,明显低于常规问答场景的 80%+,因为代码审查本身就需要完整的逻辑链条——这说明压缩不是盲目砍,而是从”有没有必要说”的维度评估每一句。场景三:你在写对外同步的技术文档,需要精炼但完整的句式。Lite 模式保留语法框架,只是剔掉了纯粹的语气词和重复表述。

但 Caveman 也有局限。它不适合需要自然对话温度的场景,比如新手学习、面试模拟、头脑风暴。在需要解释性上下文的复杂架构讨论中,过度压缩可能丢失推导步骤。Ultra 模式的缩写习惯可能让其他团队成员看不懂你的聊天记录。另外,它依赖 System Prompt 级别的约束,不是一个硬编码的截断器——某些模型可能比另一些模型更”听话”。说到底,它只是一个 Prompt 技巧的外包,效果取决于底层模型对指令的服从程度。

Caveman 的安装简单到一行命令。Claude Code 用户可以直接通过插件市场装:claude plugin marketplace add JuliusBrussee/caveman,然后 claude plugin install caveman@caveman。Cursor、Copilot、Windsurf、Cline 等工具走通用路径:npx skills add JuliusBrussee/caveman。装好之后,在对话里敲 /caveman 就切入野人模式,说 stop caveman 就回到文明世界。切换强度也只是一句话的事:/caveman ultra。

你对 AI 的每一次付费里,有一半是情绪价值。敢砍掉这一半的人,开发效率才算真正翻页。

GitHub: https://github.com/JuliusBrussee/caveman

相关文章

Claude Code 2.1.136:当 AI Agent 的安全阈门从‘相信’变成‘验证’

Claude Code 2.1.136:当 AI Agent 的安全阈门从‘相信’变成‘验证’

你让 Claude Code 在 auto mode 下跑一个长任务,回来发现它把你的 AWS credentials 写进了日志文件。或者更糟:它在你没看到的一个弹窗里点了 "允许",然后把一个安全 ...

用经典编程规则喂饱你的 AI 编码 Agent

用经典编程规则喂饱你的 AI 编码 Agent

AI Coding Agent 写代码的速度远超人类,但它们不天然知道什么代码算是好代码。没有明确约束,Agent 产出的代码在 demo 里看起来功能完整,三个月后在维护追索里看起来一团乱——函数过 ...

Agent Harness:为什么你的模型不是问题所在

LangChain 在 TerminalBench 2.0 上从 30 名开外飙到了第 5 名。他们没有换模型。同一个 LLM。同样的参数。唯一改变的是包裹在模型外面的那层软件——Harness。 ...

Vibe-Trading:把交易想法变成可回测研究的个人金融 Agent

Vibe-Trading:把交易想法变成可回测研究的个人金融 Agent

你问一个交易问题,LLM 可以给你一段漂亮解释。问题是:它没有数据、没有回测、没有报告、没有复现实验路径。你得到的是观点,不是研究。 金融 Agent 最危险的地方,不是它不会说话,而是它太会说话。 ...

Postiz Agent CLI:把 28 个社交平台的发布权交给你的 AI

你写了一个能读 RSS、能总结论文、能生成配图的 AI Agent,结果发现最后一英里卡住了:它没法把内容发出去。 不是技术问题,是生态断层。大多数社交媒体平台只给人类设计 UI,API 文档散落在 ...

Agent 不是眼瞎,是你没给装眼睛:3 分钟用 XCrawl 打通数据层

Agent 能背出 42 万字的投资框架,能识别 Rug 项目,能写策略代码。 但 markets 在每秒变化,它的知识停留在昨天。 这不是 Agent 不够聪明。是你喂数据的方式还停留在石器时代 ...