Py学习  »  机器学习算法

这里的“强化机制(reinforcement)”不是指机器学习里-20251128090706

黄建同学 • 1 周前 • 33 次点击  

2025-11-28 09:07

这里的“强化机制(reinforcement)”不是指机器学习里的强化学习(reinforcement learning),而是 在 agent 循环里人为注入的“额外提示消息”,用来引导、修正、稳定 agent 的行为。 它是一种 工程技巧,不是算法。 比如,在 agent 执行工具后,把工具结果 + 必要的、人为补充的信息一起塞回 agen...
这篇文章《Agent Design Is Still Hard》写的太好了,值得逐行细读!
看完的6个感受:
1. 如果你自己写 agent,建议尽量直接用底层 SDK(而不是高层抽象);
2. 明确缓存策略 — 尤其是对大模型 + 多步骤任务,非常关键;
3. 引入强化机制(reinforcement) 和 sub-agent / sub-inference,以提高 agen ...全文
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/189767