OpenClaw 终于长出手和眼：Peekaboo v3

John Doe
Agent , 工具
11 May, 2026

OpenClaw 之前能接消息、能调 Agent、能把结果送到各个聊天渠道，但缺一双手和眼睛。Agent 在聊天框里给建议容易，要它实际操作桌面上的按钮、菜单、弹窗、输入框，之前没有可靠的本地执行层。Peekaboo v3 就是来补这一层的——它在停更多月后正式回归，发布当天就一日三更，v3.1.0、v3.1.1、v3.1.2 接连推出。

把桌面变成 Agent 能理解的工作场域

Peekaboo 的核心是一套 macOS 自动化工具：截图、识别窗口、读 UI 元素、找按钮、点按、打字、滚动、切应用、操作菜单。传统脚本最怕环境变化——按钮位置换一下、窗口遮一下、弹窗突然出现，脚本就像踩空楼梯。Agent 更麻烦，因为它要边看边想边操作，任何一步看错都会一路歪下去。Peekaboo 不只是截一张图给模型看，而是把图里的控件、窗口、文本、按钮关系整理成带结构的桌面地图——AI 看到的不是一片像素，而是可追踪、可复盘、可继续操作的现场记录。

从消息系统到操作系统的边缘

OpenClaw 最初解决的是连接问题：人从哪里发消息，消息怎么进来，Agent 怎么处理，结果怎么回去。Peekaboo 解决的是执行问题：Agent 接到任务后，能不能看到真实桌面，能不能找到可操作对象，能不能一步步推进。加上 Peekaboo 之后，OpenClaw 的角色开始变化——它不再只是多渠道消息网关，而有机会成为本机环境里真正能办事的系统。一句话概括，OpenClaw 管「谁来找我」「要做什么」「交给哪个 Agent」，Peekaboo 管「屏幕上有什么」「按钮在哪里」「这一刀该往哪儿落」。

Agent 需要的不是更聪明的建议，而是一双能看清桌面并动手操作的眼睛和手。Peekaboo 补上的正是这个。

Caveman：砍掉 AI 80% 废话，一个让编码助手闭嘴干活的开源利器

John Doe
Agent , 开发工具
06 Jun, 2026

你坐在终端前，盯着 Claude Code 输出一段长达 300 字的解释，来回答一个只需要 30 字的问题。你知道这段文字花了你多少钱——每一个 Token 都是按量计费的，而其中大半是"您的思路非 ...

Postiz Agent CLI：把 28 个社交平台的发布权交给你的 AI

John Doe
工具 , Agent
09 May, 2026

你写了一个能读 RSS、能总结论文、能生成配图的 AI Agent，结果发现最后一英里卡住了：它没法把内容发出去。不是技术问题，是生态断层。大多数社交媒体平台只给人类设计 UI，API 文档散落在 ...

Claude Code 2.1.136：当 AI Agent 的安全阈门从‘相信’变成‘验证’

John Doe
安全 , Agent
09 May, 2026

你让 Claude Code 在 auto mode 下跑一个长任务，回来发现它把你的 AWS credentials 写进了日志文件。或者更糟：它在你没看到的一个弹窗里点了 "允许"，然后把一个安全 ...

用经典编程规则喂饱你的 AI 编码 Agent

John Doe
Tooling , Agent
07 May, 2026

AI Coding Agent 写代码的速度远超人类，但它们不天然知道什么代码算是好代码。没有明确约束，Agent 产出的代码在 demo 里看起来功能完整，三个月后在维护追索里看起来一团乱——函数过 ...

Agent Harness：为什么你的模型不是问题所在

William Jacob
Agent , 架构
11 May, 2026

LangChain 在 TerminalBench 2.0 上从 30 名开外飙到了第 5 名。他们没有换模型。同一个 LLM。同样的参数。唯一改变的是包裹在模型外面的那层软件——Harness。 ...

Vibe-Trading：把交易想法变成可回测研究的个人金融 Agent

Smars
Agent , 金融研究
18 May, 2026

你问一个交易问题，LLM 可以给你一段漂亮解释。问题是：它没有数据、没有回测、没有报告、没有复现实验路径。你得到的是观点，不是研究。金融 Agent 最危险的地方，不是它不会说话，而是它太会说话。 ...

查看更多 →