AI Agent Practices

以下内容整理自 YouTube 视频那些 Agent 神文没告诉你的事：照着做，系统只会更烂，由 Gemini 协助总结，并经过细微修改。

在传统软件开发中，先设计好完美的架构是美德。但在 AI 领域，这可能是一个巨大的陷阱。

API 优先原则：如果一个任务（如写个标题、总结文章）能通过一次 API Call 解决，千万不要用 Agent。
Workflow vs. Agent：如果任务步骤是固定的，且不需要用户中途参与（如自动视频剪辑流），请使用 Workflow（工作流）。只有当流程需要人的偏好介入，或者功能多到前端 UI 放不下时，才需要对话式 Agent。
反向叠加：AI 本身就是非确定性的系统，在它上面搭一层精致的架构，等于是在不确定性上叠加了另一层不确定性。

完美的架构不是设计出来的，而是根据需求一步步演化出来的：

Baseline 第一：不要一上来就用 LangGraph 等重型框架。先用最基础的 SDK 跑通核心逻辑，知道任务的 baseline 在哪。
Prompt 由简入繁：不要一上来就写万字说明书。先给简单的指令，看它在哪里出错，再针对性地添加限制条件或示例（Few-shot）。
能力不足再加工具：当 Prompt 无法解决问题时（比如它需要搜索实时信息），再引入 Tool。你会发现每加一个工具，Agent 都会变聪明一点，这才是真正的“涌现”。

当你的 Agent 开始变得复杂，你会遇到性能持续下降的问题。这时才需要引入大厂文里的“高级货”：

上下文隔离（Context Engineering）：如果让 Agent 同时处理设计和写代码，上下文会互相干扰。通过 Sub-agent 架构，让不同角色只看到自己需要的那一小撮信息。
内存 vs 外存：
- 内存：这轮对话结束就消失。
- 外存：跨轮次保存的状态（如 Todo List），防止 Agent 迷失方向。
传“指针”不传内容：在不同 Agent 之间传递长代码或大数据时，不要让它反复读写（烧 Token 且易出错），而是通过文件系统传递路径或引用。

对于长任务 Agent，如果它失败了，你必须知道它死在哪一步。

不要只存结果，要存全过程：工具调用的顺序、每步消耗的 Token、哪些上下文被浪费了。只有回头读流程，你才知道如何把任务规划得更快、更省钱。

那些大厂的“毕设级”架构图确实精妙，但它们是经过无数次实验后的终点，而不是你开发的第一步。

不要一上来就追求架构的优雅。先跑起来，让需求推着系统去进化。