tools··4 分钟阅读

Orpheus 团队真正在用的 AI 工具

一年生产环境下来,活下来的 AI 工具清单。还有一份更长的——试过然后被淘汰的。

YC

Yunzhui Cai

发布于 2026年5月13日


大部分 AI 工具盘点都是"未来感"的。这份是实际在用的。

下面是我们做 Orpheus 每天在用的工具,附诚实的备注 —— 替代了什么、在哪儿会断。清单故意短。我们试过然后淘汰的清单更长。

每天在用的

Claude —— 几乎一切跟脑子有关的事

API、chat、Claude Code 都在用。写代码、review PR、总结会议、查不熟的库。Claude 跟其他选择之间的可靠性差距,是团队现在最大的生产力倍数

Cursor —— IDE 层的编程

行内编辑、函数级重构、环境感知补全。跟 Claude Code 互补(参见 Cursor vs Claude Code)。

Cloudflare Workers AI —— 应用内推理

需要在请求路径里跑小模型时,跑在这里。便宜、快、不用搞 GPU。不适合 frontier 模型 —— 那个走 Anthropic。

Linear —— 让 AI 能读的任务管理

本身不是 AI 工具,但它的 API 是**让 agent 看到"团队正在干什么"**最干净的方式。要总结一周时,我们把 Linear 喂给 Claude。

Granola —— 不浪费时间的会议记录

录音、转录、总结。总结质量好到我们不再单独发会后纪要邮件

试过然后淘汰的

GitHub Copilot

编辑用 Cursor 取代,其他用 Claude 取代。Copilot 本身没问题。对手进步更快

各种 "AI agent" 平台

我们试过四个不同的 agent 框架,想自动化内部运营。全部死在同一个问题上:出错的时候,debug agent 比直接写脚本难。现在一次性的 agent 任务用 Claude Code,周期性的用 Python 脚本。

大部分 AI 写作助手

长文写作,带个好 prompt 的裸 Claude 干掉每一个 wrapper。试过四个。一个都没付费

"AI 收件箱"工具

前提 —— 让 AI 管邮件 —— 听上去好,直到你意识到漏一封邮件的代价是不对称的。我们手动 triage。

我们怎么评估新工具

三个过滤器,按顺序:

  1. 它替代了我们现在花时间的某件事吗? 不是"它酷不酷"。不替代工作的工具,只是多加一个 tab

  2. 这周会用三次以上吗? 不会就边际价值低,被切换上下文的成本压过去。

  3. 能 5 分钟内拔掉吗? 工具依赖是真实的。锁你进专有格式的,要审第二遍

门槛故意设高。大部分 demo 完看上去惊艳的工具,接触真实工作的时候就活不下来

关于我们自己卖的东西

Orpheus 本身也是一个 AI 工具 —— 把口语变成可搜索的文字。我们内部也在用。"做自己产品的客户"这种纪律,本身就是一道过滤器。如果我们自己不会付费,就不该卖


季度更新。三个月前的版本,大概率已经不对了

继续阅读