如何让OpenClaw变得顺手?

未来的哇咔咔5 分钟阅读

理想的助手是什么样的?

  1. 被动相应的外包团队(60分可用)
    • 能按照模板生产标准质量的内容;
    • 能按时执行和交付;
    • 7x24在线,随叫随到。
  2. 有主动能力的实习生(80分满意)
    • 根据指令“记住”关键信息并进行自动检索和使用;
    • 能探索和执行目标清晰、路径不清晰的任务;
    • 主动跟进、汇报。
  3. 合伙人(90分超预期)
    • 有脑子:想的多、记的牢、不盲从、懂取舍;
    • 执行力强:能完成构思、执行、迭代的逻辑闭环;
    • 有价值观,什么该做什么不该做能自行做判断。

默认的OpenClaw对应什么层级?

  1. 60分的能力大部分做的很好;
  2. 80分的能力大部分做的没那么好;
  3. 90分的能力几乎不存在。

把OpenClaw配置到什么程度比较好?

  1. 先对自己进行定位(60、80、90)
    • 能不能把自己的任务描述清楚:可以把固定工作,比如写模板日报、做固定信息抓取等工作交给外包团队;
    • 敢不敢让别人完成一个半成品工作:需要招一个实习生完成自己心中有数但没时间完成的工作;
    • 任务难度较高需要呼叫支援:需要更高的认知和执行力辅助自己完成任务。
  2. 再对任务做定位(60、80、90)
    • 固定工作流,有手就行;
    • 成熟方法论,执行个大差不差就行;
    • 挑战性工作,目标模糊、路径模糊。

如何从60分配置到80分?

60分的配置

  1. 将openclaw连接到IM工具,比如飞书,让agent随叫随到;
  2. 创建多个workspace,设置不同的agent负责不同的任务;
  3. 使用message机制定制cron任务,让agent按时按要求交付任务;
  4. 使用heartbeat机制,完成固定任务的检查和汇报。
  5. memory、user、soul等文档配置保持默认即可,作用只是提供对话的稳定性,并不影响任务执行。

从60到80分

  1. 使用memory机制收集关键信息
  • 显式提醒:不要太寄托于模型的理解和整理,就像是给实习生分配任务,难免三令五申,显式强调一句“记住xxx”比让他自己感知自己总结的效率高得多。这方面默认设置就可以了;
  • 显式查询:openclaw自带了memory的搜索机制,需要激活配置。使用的时候可以强调一下搜索记忆;
  • 延长会话有效时长:要求agent改一下配置,会话有效期延长到1小时或者更久,当前主流模型本身的上下文长度已经足以应对明确的任务执行。如果还不够,可以显式要求agent查询session记录;
  • 没必要在memory机制上打太多补丁。memory来自于对话,对话中绝大部分的内容都没什么用,信息密度太低了,即使用了一般的向量处理技术也是积累一大堆垃圾数据。有重要的信息就主动提醒一句记录,比绝大多数工程补丁都要好用。如果实在要深度使用,建议使用下文的知识库机制来处理memory。
  1. 自建知识库让agent在你的框架下工作
  • openclaw并没有知识库这个模块,但在任务探索和执行时会用到大量的高信息密度的文档,这些文档比起memory更值得投入精力去管理和优化;
  • 知识库需要三步建设:创建文档空间、文档自动转向量库、语义查询和结果注入。创建文档我推荐就在/workspace下面各自管理,做好备份机制就行,增删改查效率都很高;文档转向量库需要用到本地模型,需要注意自己的电脑性能和文档的数据结构选用合适的模型;语义查询和结果注入可以使用类似chromadb-memory这种插件;
  • 涉及到自动化的部分可以使用heartbeat机制或者cron机制进行控制;
  • 每个人的知识库管理都有很多自己的偏好,所以具体的配置还需要自己探索,以上只是个思路。
  1. 深入了解心跳、cron、session机制
  • 知道如何管理与Agent对话的上下文,高效沟通;
  • 如何准确给agent发消息/让agent给你发消息、agent之间如何通信。
  1. 准确稳妥地使用skill,知道每一个skill的机制和局限
  • 必要skill:搜索、信息获取、浏览器操作;
  • 辅助skill:发现find-skills、审查skill-vetter;
  • 专业skill:鱼龙混杂,比如图片生成、金融咨询等,注意网络安全;
  • 增强skill:自动化处理memory、管理心跳和cron任务、node能力接入等;
  1. 附录如果不能直接修改后台配置,配置效果很可能无法达到80分的水平。

从80到90分

  1. 需要大量的文本资料,包括项目成员的偏好和项目本身的核心流程(基础信息的超级加强版);
  2. memory自动整理、蒸馏、存储、查询、注入机制;
  3. 知识库自动整理、蒸馏、存储、查询、注入机制;
  4. 精简但准确的skill和多元的node能力;
  5. 综合的工作方法论(元能力),比如搜索、总结、测试、迭代等方面;
  6. 更稳定的心跳和cron机制。

哪些事情比较重要?

  1. 判断自己的角色和任务的性质,再决定要把任务配置到什么程度,把60分用好也很不容易;
  2. 理解openclaw的机制比装一堆技能重要,它的逻辑框架很好,但当前工程框架并不能承受重度冗余的配置;
  3. 场景比工具重要;
  4. 流程比模型重要:模型永远是失忆的,再强的模型在长而复杂的任务上都会束手无策。方法论永远是金手指;
  5. 模型比token重要:烧token的效果很可能不如清空会话重新执行的灵光一现,压缩再压缩就是浪费再浪费。