Dexter:为金融研究而生的自主 Agent

Dexter:为金融研究而生的自主 Agent

金融研究是一个天然适合 AI Agent 的领域——数据公开、步骤可结构化、输出是分析而非行动。但多数通用 Agent 在这个场景里会暴露两个问题:碰到的数据格式太多太杂,每步都要重新理解上下文;缺少金融领域的验证逻辑,把错误的数字放进正确的报告里。Dexter 是 virattt 开源的自主金融研究 Agent,24.5k stars,定位可以概括为”为金融研究定制的 Claude Code”。

它怎么工作

Dexter 把一个复杂金融问题拆成结构化的研究步骤,逐步执行——调收入表、拉资产负债表、读现金流,做完一步自己检查结果再决定下一步。不是简单的 ReAct 循环:它有任务规划层(把”分析苹果公司过去五年的盈利能力”分解成具体子任务),有工具执行层(调用 Financial Datasets API、Exa 搜索),有自我验证层(检查数据完整性和逻辑一致性)。每次调用的完整记录写进 scratchpad 文件,方便回调查错。底层的 LLM 可以换——OpenAI、Anthropic、Google、xAI 都支持,本地也能跑 Ollama。

不是 demo,能真用

安装就是 git clone + bun install + 配 API key(Financial Datasets、Exa、OpenAI),然后 bun start 进入交互模式。它还带一个完整的评测套件——LangSmith 追踪、LLM-as-judge 打分、可以按随机采样跑。WhatsApp gateway 让你在手机上和它聊天,发条消息给自己就能让 Dexter 去查数据。440 次提交、23 个 tag、每月还在加新工具——这不是一个周末项目,是一个在生产节奏里维护的开源系统。

Dexter 证明了 Agent 在垂直领域可以走多远——当通用 Agent 还在规划怎么写邮件时,它已经在分析苹果过去五年的自由现金流趋势了。

相关文章

Claude Code 2.1.136:当 AI Agent 的安全阈门从‘相信’变成‘验证’

Claude Code 2.1.136:当 AI Agent 的安全阈门从‘相信’变成‘验证’

你让 Claude Code 在 auto mode 下跑一个长任务,回来发现它把你的 AWS credentials 写进了日志文件。或者更糟:它在你没看到的一个弹窗里点了 "允许",然后把一个安全 ...

用经典编程规则喂饱你的 AI 编码 Agent

用经典编程规则喂饱你的 AI 编码 Agent

AI Coding Agent 写代码的速度远超人类,但它们不天然知道什么代码算是好代码。没有明确约束,Agent 产出的代码在 demo 里看起来功能完整,三个月后在维护追索里看起来一团乱——函数过 ...

Agent Harness:为什么你的模型不是问题所在

LangChain 在 TerminalBench 2.0 上从 30 名开外飙到了第 5 名。他们没有换模型。同一个 LLM。同样的参数。唯一改变的是包裹在模型外面的那层软件——Harness。 ...

Vibe-Trading:把交易想法变成可回测研究的个人金融 Agent

Vibe-Trading:把交易想法变成可回测研究的个人金融 Agent

你问一个交易问题,LLM 可以给你一段漂亮解释。问题是:它没有数据、没有回测、没有报告、没有复现实验路径。你得到的是观点,不是研究。 金融 Agent 最危险的地方,不是它不会说话,而是它太会说话。 ...

Postiz Agent CLI:把 28 个社交平台的发布权交给你的 AI

你写了一个能读 RSS、能总结论文、能生成配图的 AI Agent,结果发现最后一英里卡住了:它没法把内容发出去。 不是技术问题,是生态断层。大多数社交媒体平台只给人类设计 UI,API 文档散落在 ...

Agent 不是眼瞎,是你没给装眼睛:3 分钟用 XCrawl 打通数据层

Agent 能背出 42 万字的投资框架,能识别 Rug 项目,能写策略代码。 但 markets 在每秒变化,它的知识停留在昨天。 这不是 Agent 不够聪明。是你喂数据的方式还停留在石器时代 ...