Openclaw是成熟的AI助手吗?
最近openclaw火出圈之后,很多人大呼agent协同阶段真正到来了,但我从自己的感受出发,我的结论是它走在一个正确的方向上,但是框架还有明显的缺陷。个人拥有全能AI助手的阶段确实马上就要到来了,但不是此时此刻。
Openclaw为什么爆火?
因为它补充了之前chatbot和claudecode这些工具缺失的一个逻辑闭环:主动唤醒。
openclaw有很多机制上的融合,但我觉得最重要的就是心跳机制。第二则是agent驱动的定时任务。有了这两样,agent的能力就被彻底唤醒了,可以“自主”地进行任务的持续性执行。
这毫无疑问是个“aha moment”,就好像是你的WPS有一天突然给你发微信“我发现有一个表格有公式错误,我打算修复它,要执行吗?”虽然你自己也可以用WPS编辑,但是它主动找你的这个瞬间,是非常有冲击力的。而且从生产力的角度来说,也很有意义。
openclaw的产品形态得到市场认可,本质就是“供需关系”的拨乱反正:agent能力极强(供给),但没有释放出口;一部分用户已经成为agent重度用户(需求),但由于缺少自动化机制,使用agent的效率始终无法突破一个头两只手12个小时。
Openclaw比其他工具更好用吗?
Openclaw的优势在于闭环了“自动化调用agent”的逻辑,从解决问题的能力上来说,它并没有比其他agent工具更强,甚至肯定是比不过其他综合工具的,比如claudecode、codex、manus。
换句话说,它是站在巨人的肩膀上,有取舍地构建了一个新的“产品”。就好比拼多多站在中国电商基建的基础上,创新性地以比价为切入点拿下了下沉市场,但你说它的商品更好服务更好吗?并没有。
为什么其他厂商没有这么做?
有可能是顶级技术能力掩盖了产品需求洞察。
其实在我看来,Anthropic这种公司能做出来claudecode也挺神奇的,这种产品的诞生绝对不是规划出来的,只能是企业文化催生出来的自由探索的产物。因为一年前从技术人员的角度看来,这种东西太低效了,甚至显得有些“胡闹”。
但这才是真正的产品需求洞察,它来自于实践的需要,与理论推导没有必然的关联。
回到openclaw的问题,为什么大厂没有做出来?
答:对于claudecode的一般用户,做不出来;对于有技术能力的用户,他们有Ralph循环这些工具,早就实现了自动化和24小时运行。
然后,这个需求就掉进了夹缝中,被忽略了。
下一个“aha moment”是什么?
预测最难的点在于没有范式,有了范式就可以继续推导了。
中国互联网公司的产品经理非常多都是商科毕业(包括我自己),做做沟通工作、项目经理还可以,但是做这种范式推导,确实是不太够用。所以我们看到,这一轮openclaw的流量,国内公司的承接方式都是“上云”“一键部署”,纯纯吃流量,一点也不消化,但这并没有什么意思。
作为产品经理,我是没资格说话的。但是好在我是一个高频用户,我的痛点是清楚的:openclaw的记忆机制和知识库机制还完全达不到自动化AI助手的标准。
一开始使用openclaw会很惊喜,因为真正有一个24小时在线的助手了。但是马上你就会发现,它的“记性”并不好:说过的话一会就忘、消息发送频道混乱、定时任务忘记执行、技能使用丢三落四······
这些不是模型能力和通知机制的问题,这是框架的工程能力不到位。比如没有自动化整理memory的机制、没有本地数据库的蒸馏、搜索、注入机制。这些可以用skill打补丁,但代价就是维护成本越来越高,token消耗越来越恐怖,能力表现越来越差。这些并不能也不应该通过模型能力升级来自然解决,是实打实缺失的基础能力。
所以下一个惊喜时刻是什么?是超强的记忆和稳定性。
如何才能让用户觉得“aha”呢?
这需要在交互层面做功,比如主动来个“一周总结”,比如在沟通的时候提供给多种选项,比如显式地说明自己综合了哪些信息、参考了哪些资料完成的任务。尽量减少黑盒,让流程和信息透明起来。
如果做范式推导,结论也是大差不差:agent的终局就是自己优化自己,实现递归进化,突破通用图灵机的局限。但是在此之前,必须把通用图灵机的结构搭建扎实:如何I/O、如何存储、如何设计状态等。openclaw的创新点就是在I/O和状态设计,确实还在可以范式推导的范围内。
这个基础框架搭建的路还没有走完,状态设计和无限存储的方面,还有很多工程问题要解决。能用和好用,好用和商用,还是有很大区别的。
至于本地还是云端、微信/钉钉/飞书,这些都是无关紧要的事情,但却是产品经理们的“甜区”。
那些天花乱坠的agent团队,是真的吗?
我觉得水分比较大。
原因很简单,当前的openclaw的自动化机制在记忆和知识库管理方面非常薄弱,如果强行打补丁,那信息冗余度会非常高,不太可能同时胜任高自由度的探索工作和高稳定性要求的执行工作。 在这种情况下,一个agent负责多个任务不现实,负责多个角色更不现实。组合一堆agent、给出非常固定的工作执行流程进行协同(类似软连接的n8n、coze工作流),这是可以的。但是如果想像真人一样讨论、探索、立项、执行、交付,不太可能,看看得了,别那么焦虑。
使用token暴力解题是一个值得期待的方向,但是当前的基础框架不太能支撑,可能80%以上的token都是在浪费。如果自己也不太知道如何解决,浪费的比例接近于100%。
对于所有人,最重要的事情都是寻找自己的应用场景、构建成熟的工作流,而不是追逐用不上的“先进工具”。
如何学习使用这些工具?
- 找一个场景,边用边学;
- 早点行动。