EvoOne:我想做的,不是聊天 Bot,而是半主动的超级个人助理
开年以来,OpenClaw一直很火爆,但是当你真的部署了一下,你会发现它只是看着好用,实际上可以说是完全的黑盒。的确,它可以帮我做一些事情,但是真用起来就会发现问题很多,比如说我让他去帮我抓一下热点新闻,的确可以做,但是具体怎么做的,用了什么工具,我都一概不知,更何况对于用户来说,需求是多变的,没准我发布任务的时候是想抓下最近的人工智能新闻,但是我突然又想去看看最近的政治新闻,我就只能等他傻傻的把人工智能新闻抓完,然后再去抓政治新闻。而且,在他干活的时候,他完全无法向我汇报情况,确认需求,所以说这太死板不可控了。
于是乎我就去搜寻了市面上开源的Agent框架,ZeroClaw,NanoBot......,我基本都试了一下,但是说实话,都没有很符合我的需求,因此我打算自己做一个Agent,就基于目前最轻量,也是最贴合我的技术栈的项目 NanoBot 来进行改造。
这个项目我起名叫 EvoOne
我想做的,并不是一个只会陪我聊天、接命令的 bot。我真正想做的,是把 NanoBot 改造成一个能长期围着我转的超级个人助理。再往远一点说,它应该是“数字个体”的雏形,不过现阶段我不想把话扯太远,先把一个足够像样、能长期为我服务的半主动个人助理做出来再说。
我不要电子木头
这个东西的核心,从来都不是“会不会聊天”,也不是“能不能调几个工具”。这些能力当然要有,但它们都不是重点。重点在于,它能不能理解我的生活语境,能不能从日常对话里识别出真实需求,能不能在我没把话说全的时候,主动往前补半步。
我不要那种必须我一句一句下命令的电子木头。我要的是一个能从上下文里听懂事,并且会自己接住事情的系统。
比如我跟它说,3 月 1 号要返校,晚上有晚自习,2 号开课了。普通的 bot 最多陪我吐槽两句,或者主动询问我是否需要帮我设定提醒。虽然看起来已经是可以帮助到我了,但是这种东西离“助理”其实还差得很远,更别提什么数字生命了。
如果是我理想中的 EvoOne,它应该能意识到这里面已经出现了未来事件,也出现了潜在的提醒需求。然后它还应该继续发现一个问题:我并没有告诉它晚自习几点开始,这说明信息是不完整的。那它就应该自己去查学校官网或者相关信息,把这个时间补全。补完之后,再结合“返校”“晚自习”“第二天开课”这些条件,帮我整理出一套合理的提醒和计划,比如什么时候开始收拾东西,什么时候该出发,什么时候该到校。
重点不是它会不会设提醒。重点是它能不能从不完整的信息里发现缺口,补上缺口,再把这些信息转成行动。只有做到这一步,它才配叫像样的 Agent。
我要的不是全自动,而是半主动
所以我真正想追求的,并不是那种失控式的“全自动”,而是受控的“半主动”。
什么意思?就是说,它不需要我每次都明确说一句“帮我做这个”,但它也绝对不能擅自乱搞。它应该能从聊天里识别潜在任务,判断哪些事情值得推进,然后在合理边界内往前走半步,把该补的信息补上,把该做的动作做掉。
对我来说,这已经是一个合格个人助理最核心的标准了。
如果硬要给这种能力分级,我觉得可以用 L1 到 L5 来分级:
L1:命令执行器:你不明确下命令,它就不动。只能执行显式任务,不算真正的助理。
L2:被动助理:能听懂一点上下文,也知道你在说现实事件,但通常还是要先问你一句,要不要帮你处理。
L3:弱主动助理:在信息基本够用时,能自动做一个低风险动作,比如顺手加个提醒、记个待办,但处理不了太多不确定性。
L3.5:半主动个人助理:能从闲聊里抓到高价值隐式任务。信息不全时,不会乱猜,也不会直接卡死,而是先做保守、低风险、可修正的动作。这已经是“合格个人助理 Agent”的门槛。
L4:强主动个人助理:不只是顺手做一步,而是会主动补信息、拆前置任务、检查冲突、持续跟进,并且尽量少打扰你。已经很像真正的助理。
L5:高自治数字个体雏形:能跨任务、跨时间长期运转,维护你的状态、习惯和目标,还能在边界内持续优化自己。这个阶段已经不只是助理,更接近“数字个体”。
不过我想做的也没有太复杂,我想要的大概就是 L3.5 的效果。
真正关键的不是模型,是系统层
在架构上,我现在比较倾向于把整个系统拆成三层:工具层、系统层、模型层。
工具层就是它的手脚,负责浏览器、命令执行、文件处理、搜索、提醒、计划任务这些实际操作。模型层是它的大脑,负责理解、推理、判断和生成。
但真正最关键的,其实是系统层。
因为系统层决定了它是不是“一个活着的助理”,而不是一堆能力拼起来的壳。系统层要负责的东西很多,比如上下文管理、长期记忆、任务提取、计划编排、权限边界、状态持久化、日志审计,以及后续的自我更新流程。
模型只是脑子,真正决定这个东西能不能长期稳定运行的,是系统层这副骨架。脑子换代很快,骨架没搭好,一切都只是热闹。
我想要让Agent能自主进化,而不是等着喂饭
之所以这个项目叫EvoOne,不仅仅是因为它是个人助理(One),更是因为它得会进化(Evolution)。
宽泛的来说,我现在更认可类似 Git 的双分支思路:stable 和 test。
稳定分支负责正常服务,测试分支负责试新功能、新策略和新改动。Agent可以自主的在 test 分支里生成修改、测试可用性、提交 PR,我来决定是否合并。合并之后,再通过我预设好的流程重启服务。
这样它就具备了持续成长的能力,但整个成长过程依然是受控、可审查、可回退的。
Agent只是我的代理,而不是独立个体
它最好运行在一台单独的机器上,和我的主力机器隔离。这样它就有自己的活动空间,可以去做很多更深入的操作,但不会直接把我的主力环境搞炸。
它当然可以拥有比较高的权限,但前提是它必须按我的习惯做事,尽量贴合我的工作流和系统使用习惯,而不是完全自由
没有审计和回滚,再聪明也只是高风险玩具
另外一个我非常在意的点,是审计、记录和回滚。
这个项目不是做个聊天玩具,而是做一个可能长期运行、甚至能参与自维护的个人系统。所以它干了什么、改了什么、执行了什么命令,都应该尽量有日志、有记录、可追溯。最好关键操作还能做审计,出了问题能快速回退。
EvoOne 想成为的东西
所以说到底,EvoOne 的目标其实可以概括得很直接:
基于 nanobot 这个相对轻量、真实、可深度改造的底座,逐步把它从“能聊天、能调工具”的 bot,改造成一个以我为中心、能理解生活语境、具备半主动能力、拥有 stable/test 受控进化 机制,并且可审计、可回滚的超级个人助理。
它的近期目标,是先做成一个真正合格的半主动个人助理。至于更远的方向,再继续往“数字个体”那个方向演化。
这事现在看起来还挺远,但我觉得方向至少是清楚的。
先把它做出来,再说别的。