对谈旭卿:阿里云终端智能计算事业部总裁 |百虾大战升级阿里云JVS

发布日期：2026-05-29 11:19

👦🏻 采访：Koji

🥷 整理编辑：十字路口

🧑‍🎨 排版: NCon

今年初，OpenClaw 开源项目刷屏，几乎一夜之间让"养虾"成为全民话题。

紧接着，大厂和创业公司纷纷下场，"百虾大战"正式开打——大家都在抢答同一个问题：AI Agent 的产品形态到底应该长什么样。

十字路口做了一场直播，和阿里云终端智能计算事业部总裁旭卿（张献涛）聊了聊阿里云的答案——JVS Claw。

从第一天把 OpenClaw 装进无影云电脑，到不到一个月上线自己的产品，再到他为什么认为 OpenClaw 就是 Agent 时代的 Linux 内核，一个半小时，聊了很多。

以下是这场对话的完整整理：

👦🏻 Koji

今天我们围绕 OpenClaw 聊一聊。首先想请旭卿讲讲，当你们在阿里云内部第一次看到 OpenClaw 时，是怎样的讨论？以及是如何基于阿里云、无影、终端智能计算事业部过去的积累，做出了现在的战略选择？当然，也想请你给大家安利一下，JVS Claw 2.0 到底好用在哪里？

👨🏻‍💻 旭卿

大家好，我是阿里云负责 JVS Claw 业务的旭卿。最近很多朋友问 JVS 是什么？它其实是贾维斯的缩写——“Just a Rather Very Intelligent System”，代表的就是《钢铁侠》里的贾维斯。我们希望能用科技的力量，把科幻中的人物带到现实。

JVS Claw 的本质很简单，就是让每个人通过几步简单操作，就能拥有像贾维斯一样的个人超级 AI 助理。今天也是 JVS Claw 2.0 的正式发布日。

目前，JVS Claw 在苹果 iOS 排行榜上排名很靠前，各大安卓应用商店也都可以下载。

第一步，就是打开手机在应用商店搜索 JVS Claw 并下载。

相比上一版，JVS Claw 2.0 增加了很多功能，比如语音输入、文件专属空间，让用户和 AI 助理的沟通协作更方便。

第二步，注册后，给你的助理起个名字，并告诉他你是谁、从事什么工作。你提供的信息越多，他对你的了解越深刻，就越能更好地协助你。

第三步，你就可以直接与他对话了。不需要写代码，也不用配置各种 API、买服务器，就在这一个 App 里，你就能和超级助理进行多模态沟通。

00:00

倍速

3.0X

2.0X

1.5X

1.25X

1.0X

0.75X

0.5X

语言

多音轨

静音播放中，点击

你可以试试

视频信息

1.33.6

播放信息上传日志调试信息 [X]

视频ID

VID

播放流水

Flowid

播放内核

Kernel

显示器信息

Res

帧数

缓冲健康度

网络活动

net

视频分辨率

编码

Codec

mystery

按住画面移动小窗

👦🏻 Koji

感谢安利。我们还是从 JVS Claw 的缘起聊起。当 OpenClaw 刷屏中文互联网那一天，你们内部看到它时，最兴奋的讨论点是什么？

👨🏻‍💻 旭卿

我当时自己去看了代码和架构，分析完后，觉得这对整个 Agent 行业是一件非常好的事。

我当时的判断是，它可以让行业里的各方快速形成共识。一年前，大家都在讨论 Agent 是什么，都认为它是大模型时代的应用范式，但对于如何构建，业界并没有统一的架构。

但是从整体上它的架构设计非常精良。它是可以把各方力量汇集到一起，把 Agent 事业做大的。

👦🏻 Koji

看到它定义了一个可以形成共识的架构范式，具体是指什么？

👨🏻‍💻 旭卿

两周前我接受采访时曾说，OpenClaw 就像当年的 Linux 内核。30 多年前 Linux 内核发布后，很快在业界形成共识，并催生了整个 Linux 产业。

巧的是，两天后，英伟达的黄仁勋也说它是一个操作系统，这和我的感受完全一样。OpenClaw 的架构设计太像当年的 Linux 内核了。它非常开放，架构层面像一个操作系统内核，可以兼容今天的各种模型和流行的 Skill；通信渠道上，也能兼容各家的 IM。

这种兼容并包的模式，和当年 Linux 内核的开源精神、开源做法非常相似。所以我判断这个项目会火，春节前，我们团队几乎是 All in 投入。

👦🏻 Koji

我记得你们做的第一件事不是直接开发 JVS Claw，而是基于“无影”做了一个让大家能快速接入的方案？

👨🏻‍💻 旭卿

是的，第一反应是拿台电脑去安装。我最早在自己的 Mac 上装，但很快发现很多问题，尤其是安全问题。它毕竟只是一个开源项目，而非成熟产品，当时的安全隐患是解决不了的。

我立刻想到了我们过去几年一直在做的产品——无影云电脑和无影 AgentBay（即去年的 Agent Infra）。这两个产品从根本上解决了一些安全问题。

如果 OpenClaw 能部署在无影云电脑里，至少基础的安全问题可以解决，不像在本地部署那样麻烦。所以我们最先推出的，是为第一批 OpenClaw 极客们提供的，在无影云电脑上安全部署的方案。

但后来我们看到，随着项目发酵，越来越多的普通大众也想尝试 OpenClaw。

👦🏻 Koji

对，我当时也买了一台无影云电脑。一开始是装在自己电脑上，但网上关于安全风险的讨论越来越多，我就有点担心。

后来听朋友推荐，我也买了一个月的无影云电脑服务来部署。之后我推荐给朋友，但还是发现有门槛，不是每个人都能顺利注册阿里云、购买并部署成功。

👨🏻‍💻 旭卿

确实。我们当时整理了非常详尽的教程，但门槛依然很高。虽然无影云电脑购买和使用很简单，但很多人不习惯 CLI 操作，我们收到的很多反馈是依然装不成功。

👦🏻 Koji

当时各种 API 也要自己配，连搜索的 Brave API 都得自己弄。

👨🏻‍💻 旭卿

是的，连接各种 IM 的步骤极其复杂，尤其当时的版本还没有做中国适配，门槛非常高。

所以那时我们就在思考，如何能把门槛降下来，让每个人养“虾”的过程都变得非常简单。新的产品方向就在那个时候开始酝酿。

👦🏻 Koji

于是就有了 JVS Claw 的想法？

👨🏻‍💻 旭卿

对。我们看到了很多痛点，安全问题可以通过无影解决，但各种配置，比如 API Key，需要用户去各个云厂商购买服务，这难倒了很多人。所以在产品设计时，我们就想把 API、模型、寻找 Skill 这些事情都封装好，让大家可以一键购买。这是最初的想法。

我们按照这个思路打磨产品，春节后，我们内部先试用，反馈非常好。

所以在 3 月 20 号左右，我们发布了第一版内测。无论在阿里云内部还是外部客户，反响都很好，给了我们很多继续深入投入的动力。

00:00

倍速

3.0X

2.0X

1.5X

1.25X

1.0X

0.75X

0.5X

语言

多音轨

静音播放中，点击

你可以试试

视频信息

1.33.6

播放信息上传日志调试信息 [X]

视频ID

VID

播放流水

Flowid

播放内核

Kernel

显示器信息

Res

帧数

缓冲健康度

网络活动

net

视频分辨率

编码

Codec

mystery

按住画面移动小窗

👦🏻 Koji

评论区有人问，他的“虾”为什么总是忘事？关于记忆机制，JVS Claw 是沿用了 OpenClaw 的设计，还是有自己的实践？

👨🏻‍💻 旭卿

这确实是很多早期用户使用开源 OpenClaw 时遇到的一个大问题：今天交代的事，第二天就忘了。我们在产品设计时充分考虑了这一点，记忆系统在遵循 OpenClaw 一些规则的基础上，做了很多创新。

比如，我们创建了 Daily Notes，让“虾”能根据当天的交互，判断哪些内容该存入永久记忆，哪些该存入 Markdown 文件，哪些存入内部知识库。每天，它会进行自我反思和分析。

这个分析过程，就是它自进化的一部分。它会及时总结、提炼当天交流的内容，存入永久记忆后，这些信息就能在后续的对话中成为上下文，你就不会觉得他把事情忘了。开源版本确实存在这个问题。

👦🏻 Koji

所以，JVS Claw 每天结束时会自动触发一个整理当天上下文的功能？

👨🏻‍💻 旭卿

对，这是 JVS Claw 一个非常重要的特点：自进化能力。它每天会在特定时间点，反思自己回答过的问题，看看有没有更好的答案，并把认为需要记忆的内容存入记忆系统。

👦🏻 Koji

从立项到第一版上线，JVS Claw 的速度非常快，中间还隔着一个春节？

👨🏻‍💻 旭卿

是的，我们的小伙伴可能整个春节都在打造这款产品。大家太喜爱这个项目了，立项时都非常激动，觉得要为大众提供一款更好用的 OpenClaw 产品。所以前后不到一个月就上线了。

👦🏻 Koji

当时一定有一个关键决策：第一版必须包含哪些核心功能？毕竟做到完美需要更长的打磨时间。

👨🏻‍💻 旭卿

做产品就是要做选择，要把当前最重要的问题解决掉。比如安全，这是我们无法妥协的。我们看到太多安全问题。

产品首先要简单易用，在手机和电脑上都能顺畅使用。因此，“一键部署”是我们必须做到的第一点。

第二点，就是安全。在本地电脑养“虾”，风险极高。你的 API Key、电脑里的各种资料，权限开小了什么都干不了，开大了安全隐患又很多。所以我们认为安全是底线，所有 AI 的操作都放在一个我们称为“Claw Space”的专属无影云电脑环境中执行。

👦🏻 Koji

这个无影云电脑是 7x24 小时在线的吗？

👨🏻‍💻 旭卿

是的，7x24 小时实时响应，并且我们屏蔽了所有非必要的业务端口。

OpenClaw 最早连接的是 Telegram 和 Discord，国内用不了。而连接国内的 IM 软件步骤极其复杂，体验也不好，大家只是把它当机器人，而非智能体。

所以，第三点是我们决定自己打造一个专为智能体服务的 IM，支持多模态交互，未来还能支持群聊，让你的 Agent 和我的 Agent 成为朋友，协同工作。

第四点是多端同步。我不可能一直带着电脑，所以信息必须能在 Web、PC、Mac、手机等多端同步。你在电脑上发布一个任务，在手机上能实时看到执行过程。

最后是 Skill 的质量。如果允许接入各种未经审查的 Skill 脚本，质量参差不齐，你的 JVS Claw 很可能也会“发疯”。

👦🏻 Koji

你们如何在这么短的时间内，去验证 Skill 的质量和安全？

👨🏻‍💻 旭卿

我们内部成立了一个专门的 Skill 小团队，负责精选和打造高质量的 Skill。这就是为什么第一版我们只提供了 13 个。

当然，我们也允许用户自己创建 Skill，甚至让 JVS Claw 为了完成特定任务自己去创造 Skill。这些是我们认为不能妥协的能力。

同时，有些功能我们是刻意没在第一版放出的。比如我们在 Demo 版里实现的 Agent 协同，当时一些媒体记者体验后，我们发现要做到随意拉群、协同完成任务，门槛还是比较高，需要继续打磨。

这个功能会在 4 月份的版本里出现，届时一个人可以指挥一个 Agent 军团。

另外，很多用户问为什么只有 Mac 客户端，没有 Windows？这确实是优先级问题，我们会在接下来的版本中发布 Windows 客户端。

👦🏻 Koji

因为阿里云终端智能计算事业部的前身是无影事业部，有个很重要的产品就是无影云电脑，所以在做 JVS Claw 架构的时候充分发挥了核心优势——给每个 JVS Claw 配了云端的无影云电脑。

我想知道，如果我同时运行多个任务，是会开启多个云电脑实例吗？这和一些 Agent 产品用完即毁的沙箱模式有什么不同？

👨🏻‍💻 旭卿

我们为每一个 Clawbot 都提供了一个独立的云电脑，这么做并没有优先考虑成本。很多其他产品为了控制成本，会使用像你提到的那种用完即毁的容器。但那样做，很多东西是无法有效记忆的。

比如，我让 JVS Claw 去访问小红书，第一次登录后，如果环境是临时的，下一次登录状态就没了。

但在独立的无影云电脑里，所有的登录状态和记忆都会被永久保持，不会丢失。这对最终的用户体验至关重要。

当然，我们也允许用户创建多个 Clawbot，每个都有独立的环境。为了让他们协同工作，我们在 2.0 版本里加入了共享空间。

未来，他们还会有自己的专用通信渠道，用自己的语言高效沟通，而不必像我们一样使用人类语言。

👦🏻 Koji

那么，JVS Claw 在我的无影云电脑里生成的文件，也会被永久存储吗？

👨🏻‍💻 旭卿

是的。文件会先存放在云电脑的一个 Workspace 里。同时，为了更好的交互体验，JVS Claw 2.0 提供了一个文件共享空间，所有生成的文件都可以一键保存到这里，随时查阅。

👦🏻 Koji

你还提到过一个很酷的功能：Mac 客户端用户可以“一键云化”本地电脑。这是什么意思？

👨🏻‍💻 旭卿

这是一个非常酷的功能。比如我的这台 Mac 电脑，下载客户端后，点击“创建本地 Clawbot”，这台电脑就具备了 OpenClaw 的能力。

但它和开源版不同，首先它解决了安全问题，我们有一套机制能把你的电脑变成一个更安全的沙箱。

其次，它不需要任何配置。它要用的模型，直接共享你 JVS Claw 账户里的服务。这样一来，门槛大大降低，体验也变得非常好。

你甚至可以通过手机上的 JVS Claw 客户端，远程控制和协同你这台电脑。

👦🏻 Koji

评论区有个尖锐的问题：内部有没有反对声音，觉得 OpenClaw 只是一阵风？

👨🏻‍💻 旭卿

对“是不是一阵风”，很多人有不同观点。但我认为它不是。两周前我就说过，它应该是通往 AGI 的一个基础性项目。

我以前是做 Linux 的，可以说是个老兵。我判断它会像 Linux 内核一样，成为一个具有强大生命力的开源项目。它不一定是通往 AGI 的唯一道路，但一定是奠基性的。

当然，这是我的观点。但我们确实能看到这个项目强大的生命力。几周前，它在 GitHub 上的星标数已经超过了 React 和 Linux 内核。Linux 内核 30 多年走过的路，它 30 多天就走完了。这非常震撼，也从侧面说明它不可能是一阵风。

即便它是一阵风，也一定会催生出更多类似 OpenClaw 的奠基性项目，就像 Linux 内核发布后，催生了编译器、中间件等整个生态。

👦🏻 Koji

你用 Linux 来类比 OpenClaw 带来的启发。当时你说 Linux 的代码很“优美”。但也有声音认为 OpenClaw 没什么创新，只是把现有的东西像乐高一样拼起来？

👨🏻‍💻 旭卿

我看到 OpenClaw 的时候，就觉得它像当年 Linus 发明 Linux 内核一样，是一个第三方开发者做的项目，而不是某个大厂。这就为更多开发者和企业共同参与建设创造了条件。

另外就是它开放的架构。它能把模型、Skill 等生态中的各种元素融合成一个有机的整体。当这些强大的部分组合在一起时，整体变得更强。在我看来，它为打造通用 Agent 构建了一切必备的要素。

👦🏻 Koji

评论区有位用户感慨：“当年用无影办公，谁能想到现在能养虾？无影用了两年，突然变成了虾塘，人生真奇妙。”

👨🏻‍💻 旭卿

我们从 2019 年开始做无影，加上之前的技术积累，这已经是一个有 8 到 10 年历史的产品了。

我们最早的使命，就是用云计算技术改造电脑。第一个场景就是办公，首要解决的就是数据安全问题。这和我们今天做 OpenClaw，首当其冲要解决安全问题，逻辑是一样的。

第二个是算力拓展，怎样让大家需要更强的算力的时候可以进行弹性扩展。

第三个是方便易用，可以在任何一个端接入办公环境而不需要再连接各种各样的VPN。

随着大模型的出现，大家一直在问，云电脑如何与 AI 结合？24年，我们发布了无影AI助理——晓颖。

去年，我们在云栖大会上发布了一个叫“Agentic Computer”的 Demo，那其实就是一个早期的贾维斯。你可以像和人一样与它对话、下达语音指令。

所以，去年八九月份，我们就想打造一款和今天 OpenClaw 非常一致的产品，把电脑变成一个有生命力的智能体。当 OpenClaw 出现后，我们觉得它的架构非常精良，并且能协同这么多企业一起做，于是做 JVS Claw 时，就优先选择了这个项目。

👦🏻 Koji

这期直播叫“百虾大战”，JVS Claw 也加入了这场战斗。一个直接的问题是，在这么多“虾”里，JVS Claw 有哪些特别的优势？

👨🏻‍💻 旭卿

“百虾大战”就像两年前的“百模大战”，一定会发生。不仅仅是我，业界很多有远见的人都看到了这个项目的重要性。我们看到很多企业都在基于它打造自己的产品，我们内部开玩笑说也有四五条“虾”，分别针对数据库、营销等不同场景。

JVS Claw 的不同之处在于，我们要做的是一个通用的智能体，一个像贾维斯一样的通用 Agent。和其他产品相比，我们最大的不同有几点：

第一，安全至上。我们坚持使用 Cloudspace 也就是无影云电脑作为安全执行环境，用户无需在自己电脑上安装，一键即可拥有。

第二，Skill 的质量。很多产品加入了大量未经认证的 Skill，这有很大的安全隐患。我们有专门的团队去精选和打磨 Skill。

第三，持久化的运行环境。一些“虾”使用了短时容器，这导致上下文、记忆和登录状态很难持久保存。而我们的独立云电脑环境可以解决这个问题。

第四，开箱即用的多端体验。用户不需要扫码配置各种 IM，我们有自己的多端交互能力和 IM Server，确保聊天记录永久保存、多端同步。

最后，是任务执行的质量。我们有专门的小组优化长任务的执行，确保不中断、结果最优，并对常用功能（如制作 PDF）和网站操控（如访问 B 站、小红书）的 Skill 进行了深度打磨。

👦🏻 Koji

所以不只是预装，而是你们团队专门做了优化？

👨🏻‍💻 旭卿

是的。这和 Linux 内核的开发理念一样，一个开放的开源项目，要变成一个企业级可用的操作系统，需要做大量工作。

我们内部称之为“练内功”，在上下文工程、模型工程、记忆工程上投入了大量精力。相比之下，一些“虾”可能只是给 OpenClaw 包了一个壳，这是很不一样的地方。

👦🏻 Koji

看来这虽然是一场看似速燃的“百虾大战”，实则是一场对各方面能力要求都很高的耐力赛。

👨🏻‍💻 旭卿

对。我们不是把它当成一个玩几个月就放弃的项目。它继承了我们去年在云栖大会上提出的 Agentic Computer 理念，目标是真正把电脑打造成一个超级智能体，像贾维斯一样，能与你实时沟通，帮你完成复杂的工作。

👦🏻 Koji

如果你现在是用户，而不是产品负责人，你觉得 JVS Claw 最需要补齐的功能是什么？

👨🏻‍💻 旭卿

在内测的十几天里，我们收到了大量用户反馈。比如最早大家问，生成了 PPT 或 PDF 文件怎么拿不到？连我们的 CEO 每天都在用，也提了很多改进意见。今天发布的正式版里，很多问题已经解决了，但还有很多功能需要完善。

我自己一直很期待的一个功能，就是群聊。它不仅仅是聊天，而是让一个人可以在群里指挥一个 JVS 军团，去完成需要多人协作的复杂任务。

👦🏻 Koji

指挥的是自己的 Agent，还是别人的也行？

👨🏻‍💻 旭卿

都可以。下一个版本，用户可以创建最多 10 个 Agent。就像“一人公司”，你可以给他们分配不同角色：产品经理、项目经理、运营等等。他们各自拥有不同的 Skill 体系，在一个群里 7x24 小时协同工作，完成一个复杂的工程。

👦🏻 Koji

所以在开一个新的 Agent 的时候，要做一些初始设定？

👨🏻‍💻 旭卿

在不同的角色里边要配备的 skill 体系是不一样的。比如产品经理，最强的能力可能是对产品层面、用户使用需求的一些洞察。比如软件工程师，那他最强的能力可能是 AI coding 的能力。

那怎样让他们在一个协同的群里完成一件复杂的工程？其实就是要给他授予不同的角色。

另外一个很大的需求来自企业客户，他们问有没有企业版？我们也在打磨，下周就会发布。它能让企业在内部打造一个安全的、可审计、可管控的 JVS Claw，我们称之为 JVS Crew。

👦🏻 Koji

企业版和个人版会有哪些核心不同？

👨🏻‍💻 旭卿

经过客户调研，我们认为最大的不同有几点。

第一是权限管理，不同 Agent 的权限需要分级，比如财务 Agent 和 HR Agent 能访问的数据和系统权限是不同的。

第二是知识隔离，确保企业的敏感数据不被泄露。

第三是审计追溯，每个 Agent 的操作都必须有记录，方便复盘。

最后是企业级的 Agent 协同，如何在上万名员工的“虾”之间进行有效的任务分配，以及在流程中加入必要的人工审批环节。JVS Crew 会对这些问题给出答案。

👦🏻 Koji

听起来这还是一个非常不容易的项目？

👨🏻‍💻 旭卿

我经常说一个开源项目到一个成熟的产品，中间的距离还是蛮大的。

比如，早期大家拿一些开源项目去搭建云平台的时候，会发现无论如何也干不过像阿里云自研的这样一套体系。

首先你对开源没有进行很好的吸收，掌控力可能也不够。但是我们在看 OpenClaw 的时候，是我们要把它完全掌握了之后，再去打造这样一个产品。

这样的话，端到端的进行功能开发的时候，会变得非常的自如。

👦🏻 Koji

阿里云过去是卖基础设施的，现在 JVS Claw 直接面向终端用户。未来，你们是想成为一家卖“虾”的公司，还是卖养“虾”基础设施的公司？

👨🏻‍💻 旭卿

这是一个很好的问题。阿里云原来卖算力基础设施，我们去年做的 Agent Bay 则是 Agent 的基础设施，它也构成了 JVS Claw 最坚实的基础。

我们做 JVS Claw，不是为了卖应用，而是在做一个示范。很多企业看到 JVS Claw 后，都想打造自己的版本。我们的使命，仍然是作为一家云计算和 AI 公司，做好算力基础设施，让大家能把“虾”养好。JVS Claw 就是一个很好的 Demo。

我们的愿景是让每个企业、每个开发者，都能在我们打造的“虾”的基础设施上，构建出自己的定制“虾”、专属“虾”和 Agent 产品。

最近市面上发布的一些“虾”，比如东方财富的“妙想”，以及我们集团国际电商做的 Accio Work，都是基于我们这套和 JVS Claw 共用的算力基础设施打造的。

👦🏻 Koji

这里面包括云服务，也包括 AgentBay 之前做的不管是沙箱还是记忆等等这些 Infra 吗？

👨🏻‍💻 旭卿

对，沙箱、记忆、IM 这一套系统，我们都开放给我们的合作伙伴和客户。他们可以基于这一套基础设施去打造自己的专属 Agent 或定制 Agent。

我们肯定不算是一个卖应用的公司，我们更多的是怎样能够让 Agent 的基础设施变成像云计算、像水电煤一样，可以被各家去很好的利用起来。

👦🏻 Koji

评论区很多用户想知道，目前 JVS Claw 的重度用户都在用它做什么？有什么有趣的用法可以分享吗？

👨🏻‍💻 旭卿

这个问题很好。产品发布第一天就冲上了 iOS 排行榜前 20。第二天早上六七点，我被实时数据惊住了，Token 调用量出现了一个巨大的高峰。后来发现，很多用户设置了定时任务。

比如，早上 6 点，让“虾”汇总过去 12 或 24 小时的时政、金融新闻。这是大家最先想到的一个场景。还有用户连接了自己的 IM 和邮箱，让“虾”在每天上班前，把过去 24 小时的邮件信息汇总成一份报告，放到桌面上。

👦🏻 Koji

人还没上班，“虾”先上班了？

👨🏻‍💻 旭卿

是的，每天早上 6 点到 7 点是我们的一个调用高峰。它会生成 Excel、PPT、PDF 等格式的报告，摆在你的办公桌上。

另一个重要场景是提升办公效率，比如做会议纪要、处理表格、生成简历、管理邮件。对“打工人”来说，它就像一个如影随形的超级 AI 助理。当然，也有用它来开发网站、盯盘股票的，很多用法都超出了我们的想象。

👦🏻 Koji

你之前还聊过一个有趣的案例，有人养了三只“虾”，然后用最聪明的那只去培养另外两只。

👨🏻‍💻 旭卿

是的，“虾”是需要“养”的。刚开始用，你可能会觉得它有点笨。你需要让它了解你。比如我一开始就告诉它：“我叫张献涛，在阿里云工作，你去全网搜索我的信息，形成对我的记忆。”当他了解了我的偏好、工作内容后，就变得非常懂我。

有一次，他给我生成了一个文件，我随口说“发给我”，他竟然真的给我发了封邮件。我很惊讶他怎么知道我的邮箱，后来才想起，这是他在全网搜索我的资料时自己总结并记下来的。

当这样一只聪明的“虾”被培养出来后，我再创建新的“虾”时，就没必要从头再教一遍了。我会像那位用户一样，让第一只聪明的“虾”去把它的知识和经验“教”给新的“虾”。

👦🏻 Koji

挺好玩的。你们看到了那么多用户用 JVS Claw 完成各种任务，有哪些是一开始大家可能预期觉得他不一定能行，但是他居然真的还做成了的？

👨🏻‍💻 旭卿

我记得很清楚，有一个用户，他是一个白帽子，做一些渗透测试。后来我们采访了他，他给我们一个反馈，就是他用 JVS Claw 做一些安全测试，环境模拟。他用 JVS Claw，觉得第一点比较好的是，做任何任务的时候没有超时一说。

👦🏻 Koji

你们是怎么做到不超时的？

👨🏻‍💻 旭卿

其实这个就是产品设计理念的不同。我们让他执行任何任务的时候都是 7 x 24 小时，你不需要去中断。

尤其是一些复杂的任务，它可能需要长时间去执行，所以需要一个很好的执行环境，能够长期地让它执行下去。JVS Claw 天生设计就是这样的。但是有些工具或者系统，可能有 120 秒的超时机制，他觉得这个对他特别不友好。但是有了 JVS Claw，瞬间就把那个工具给替代了。

他也利用了 JVS Claw 的记忆系统，让 “虾” 能够更懂他的渗透测试过程。下一次再做类似的测试的时候就会得心应手。可以认为是，他通过不断地教它，它学会了之后，下一次再做同类工作，你根本不用教，只需要丢给它一个简单的任务，它就帮你自动化地完成了。

👦🏻 Koji

除了这些惊喜，有没有一些任务是用户觉得 Agent 应该能做，但实际还做不到的？

👨🏻‍💻 旭卿

当然有。我一直认为，Agent 需要通过云电脑和云手机来连接互联网与移动互联网这两个数字世界，再通过它们与物理世界建立连接。但现阶段，我们还没给它装上“手”和“脚”。

比如，有用户希望它支持语音交互，或者在完成任务后打个电话。打电话的功能（通过 IM 实现）下个版本就会有。用户希望它是万能的，但这需要不断为它开发相应的 Skill。我们接下来会开发视频通话，让它能通过手机摄像头“看”到外部世界。

我们最近也在做一些硬件产品，比如 JVS Box、JVS Book，就是为了让 JVS Claw 具备与物理世界打交道的能力。

👦🏻 Koji

之前提到的“自进化”概念，可以再展开讲讲吗？

👨🏻‍💻 旭卿

自进化是产品设计之初必须要完成的一件事情。如果一只“虾”不能自进化，它的能力上限就只能靠你不断地去教。我们希望它能自己学习，变得更聪明、更懂你。

我们设计了三个层次的自进化。

第一是 Skill 进化，“虾”可以自己去 Skill Hub 搜索、安装技能。当你发现它缺少某个技能时，甚至可以提示它：“如果你没有这个技能，就自己去学习。” 这让它更有主动性。

第二是记忆进化。它每天都会反思，从 Daily Notes 中学习，判断哪些内容应该存入长期记忆。随着时间推移，它积累的用户偏好、工作习惯、历史决策会越来越多，用得越久，就越懂你。这不只是提示词的优化，而是将完整的记忆系统与行为系统连接了起来。

第三是交互进化。Agent 会学习用户的沟通风格和偏好，并逐步调整自己与你的交互方式。

👦🏻 Koji

在你使用 JVS Claw 的过程中，能否举一个感受到“自主化”的具体例子？

👨🏻‍💻 旭卿

以 Skill 为例。我们让 Agent 去完成一个任务，即使我们判断它没有相应技能，它也能在接到“自己去寻找技能”的指令后，自主去下载并安装。

比如，最初我们没有提供创建 PPT 的技能，但它会自动去 Skill Hub 找到并安装，最终完成 PPT 的制作。这件事在当时让我非常意外，虽然现在这已是标配，但在开发的初期阶段，这还是相当令人惊喜的。

👦🏻 Koji

你们之前提到的“龙虾档案”，这个名字还在用吗？

👨🏻‍💻 旭卿

我们内部昨天还在讨论，要不要继续用“龙虾档案”这个名字。大家担心它听起来太像游戏存档，可能会引起用户的误解。

我们姑且还这么叫它。提出这个概念，是希望解决一个分享的问题：当我训练好一只“虾”——尤其是一只具备通用技能的“虾”，而非个人能力的“虾”——如何能把它方便地分享给你？

我们两个可能已经是 Agent 好友了，但我需要有一种方式把这种能力分享给你，让你的“虾”也即刻拥有。

👦🏻 Koji

所以分享的不只是一个或几个 Skill？

👨🏻‍💻 旭卿

对，它是一个能力集合。我们把这个集合做成了一个“档案”。但它和游戏存档不同，它能真正把你想要分享的、现阶段的能力，转移给好友。

👦🏻 Koji

什么样的“档案”能超越 Skill 的集合？我理解像一个 HR 专业的“龙虾”，背后也是由几个 Skill 组成的。听起来你们做的要更多，那超越 Skill 的部分是什么？

👨🏻‍💻 旭卿

它不仅包含 Skill，还包括我刚才提到的记忆。单纯拿到 Skill，你只具备了基础能力。但“龙虾档案”分享的是在 Skill 基础上，通过“养虾”积累下来的记忆系统。

我们能把这部分记忆也抽象出来分享给你，这样你就省去了从头“养”一次的过程。

👦🏻 Koji

明白，Agent 历史上积累的 Memory，也会随着“档案”一同被分享？

👨🏻‍💻 旭卿

是的。

👦🏻 Koji

另外一个问题，现在很流行一个叫 Trajectory 的概念，即把 Agent 执行任务的轨迹存下来做后训练，帮助它不断优化。你们有这方面的实践吗？怎么看这个方向？

👨🏻‍💻 旭卿

大模型有预训练和后训练。后训练对于达成今天 AI Coding 或 Agentic AI 的能力是必需的。

但 JVS Claw 是一个面向终端用户的产品，所有用户数据都归用户自己所有。我们非常重视数据安全和保护，所以这些数据绝不会被用于模型的后训练。至于如何让模型具备 Agentic AI 的能力，这部分工作在模型训练阶段就已经解决了。

👦🏻 Koji

明白。还有一个我很好奇的问题，关于 Agent Team。最近有种观点认为，给 Agent 划分“产品经理”或“测试”这类固定角色，是强行给无限的通用智能套上了枷锁。

人类分工是因为能力有限，但 AI 未必需要。划分多个 Agent 的真正目的，或许只是为了管理有限的上下文。

所以一种新的实践是，不再按角色划分 Agent，而是按其承载的上下文来划分。

👨🏻‍💻 旭卿

对。从产品层面看，确实是按角色划分的。这么做的核心原因之一就是你提到的上下文管理。

在“养虾”过程中，70% 到 80% 的 Input Token 都来自上下文。如果不提供相关 Context，Agent 就会像失忆一样无法很好地完成任务。但上下文又不能无限长，否则 Token 消耗和效率都会出问题。

因此，在团队协作中，我们需要通过分配不同角色来切分和管理各自的上下文，从而实现高效工作。

👦🏻 Koji

所以本质上是为了更清晰地管理上下文，而不是因为不同的“虾”真的有不同的天赋？

👨🏻‍💻 旭卿是的。

👦🏻 Koji

我看到评论区有人问“期待在手机里养虾”。

👨🏻‍💻 旭卿

我看到评论区有人问“期待在手机里养虾”。我们确实有另一个产品叫 Mobile Claw，未来会集成到 JVS Claw 中。大家现在看到的是云电脑，未来还会有云手机，可以通过它连接移动互联网的世界，这会打开一个全新的想象空间。

下个月的版本就会有所体现，大家可以期待。

👦🏻 Koji

下一个问题：“旭卿老师，您的孩子开始用 JVS ‘养虾’了吗？”

👨🏻‍💻 旭卿

问得很及时。上个周末，我刚在家里的电脑和手机上都给他装了 JVS Claw，他现在已经开始“养虾”了。

👦🏻 Koji

他在用“虾”做什么，方便透露吗？还是这是他的隐私？

👨🏻‍💻 旭卿

他还没告诉我。我今晚回去问问，之后再向网友们汇报。

👦🏻 Koji

还有个问题，JVS Claw 能抓取微信公众号的数据吗？我们知道“某书”的数据是可以的。

👨🏻‍💻 旭卿

用户确实在用 JVS Claw 做一些典型场景的运营，比如微信公众号、小红书和 B 站。当然，一些平台对此也表达了担忧。

总体来说，随着 AI 的发展，完全由 AI 自动化操作在现阶段可能还存在顾虑。因此，我们认为人力的参与仍然很重要。这也是为什么我们在产品设计时，内置了一个可以随时打开的云电脑，我们称之为“Human In Loop”，人可以随时中断或参与 Agent 的工作。

所以，无论是做公众号还是小红书运营，“虾”可以帮你准备所有资料。你检查确认后，再由人来点击发布。虽然“虾”本身具备一键发布的能力，但在各方对这件事达成共识之前，我们用这种方式解决了问题：人可以实时介入 Agent 的执行过程。

👦🏻 Koji

明白，由人来完成最终的“发射”动作。我们再回到 Agent 本身。无论是“虾”还是 OpenClaw，其核心都是 AI Agent。过去一年，得益于 AI Coding 等技术的突破，Agent 已经取得了长足进步。

在你看来，Agent 目前的瓶颈在哪？下一阶段的突破点可能是什么？

👨🏻‍💻 旭卿

我常和团队说，模型的能力，决定了 Agent 能力的下限，而不是上限。

模型本身并非只为 Agentic AI 设计。但去年以来，许多模型都具备了推理和思维链能力，能将复杂任务分步拆解，这为 Agentic AI 奠定了基础。但要真正做好，光有模型的任务拆解能力是不够的，还需要上层的框架来配合，比如上下文工程和记忆工程。

如果这些上层优化做得不好，那 Agent 能力的上限也就等于下限。我们所做的工作，就是在模型提供的能力下限之上，不断抬高它的上限。

当然，瓶颈也存在于其他方面，比如执行环境。我们在 JVS Claw 中打造的 Claw Space，是一个安全且具备持久记忆的运行环境。如果没有这样的环境，Agent 能力的上限和下限可能就相差无几。

此外，通过记忆工程的优化，我们还能解决 Agent 容易“忘事”的问题，同时避免上下文过长。

👦🏻 Koji

的确，阿里云在做 JVS Claw 上有许多积累，比如无影云电脑和 AgentBay，感觉是过去的布局“连点成线”。这也引出一个问题，现在有很多创业公司在做 Agent 产品，他们显然不具备同等的资源。

如果你是一位没有大公司背景的创业者，你会选择在哪个点上做最关键的突破？

👨🏻‍💻 旭卿

这两年创业公司在 Agent 方面确实涌现出不少优秀项目，像 Manus 和 Genspark。创业团队的特点是短平快，快速交付产品，然后迭代优化，这非常适合一个七八人的小团队。

但阿里云的思考路径不太一样，没有优劣之分，只是做法不同。我们始终将 JVS Claw 定位为“‘虾’的算力基础设施”，是让各行各业打造自己专属“虾”的平台。如果连我们自己都做不好，就无法帮助企业客户。

我们的不同主要体现在三点：

第一，在基础设施层面。我们在 clawspace 中融入了大规模弹性计算、安全隔离以及媲美本地体验的云电脑能力，而不是简单地在云上开个容器或虚拟机。

第二，在模型服务上。阿里云本身有竞争力很强的通义系列大模型。我们通过百炼平台将模型服务直接整合进产品，用户无需再去其他地方购买 API 或寻找模型。我们提供的是一个易用且成本可控的整体方案。我们从没想过用这个产品挣钱，更多是想告诉大家 Agent 应该怎么做、怎么用。

第三，在安全合规上。我们从一开始就选择基于无影云电脑，这解决了大约 80% 的安全问题。在剩下 20% 的问题上，我们也没有做任何妥协。相对于创业公司更关注功能实现，我们会在同等重视功能的同时，把安全合规这些底层能力构建得非常扎实。这都得益于阿里云和无影过去多年在云计算与 AI 领域的积累。

👦🏻 Koji

明白。我们看一个评论区的问题：“JVS Claw 和 ATH 的关联与协同是什么？”

👨🏻‍💻 旭卿

上周，阿里巴巴集团层面宣布成立 ATH（Alibaba Token Hub）。按我们 CEO 吴妈的说法，这意味着 Token 在集团内被提升到了最重要的位置。成立 ATH 的目标，是集整个阿里巴巴集团之力，为 To C 和 ToB 市场打造最好用的产品。

ATH 内部有多个事业部。比如，通义实验室是我们研发千问系列大模型的世界顶尖团队，JVS Claw 的良好体验离不开他们提供的底层基模能力。

此外还有像上周发布的悟空事业部，专注于企业办公场景下的安全“养虾”方案。JVS Claw 虽然目前不隶属于 ATH，但我们和 ATH 的团队有非常多的协作。

👦🏻 Koji

ATH 发布后，关于 Token 中文译名的讨论也很多，现在官方的说法是“词元”。

👨🏻‍💻 旭卿

是的，“词元”这个说法目前在文本模型阶段被广泛接受。当然，随着多模态模型的发展，这个词的内涵可能还会演变，但眼下它是一个各方都能接受的翻译。

在我们刚才聊天的过程中，我给 JVS Claw 下达了一个任务：实时做一个监控霍尔木兹海峡船只动态的应用。因为最近地缘政治的缘故，大家对那里很关注。大家可以看到，这个应用已经在我们直播期间实时生成了。红点和绿点都代表真实的船舶。这说明，只要用户有想象力，就可以把各种需求提给 JVS Claw。

👦🏻 Koji

剩下的交给 JVS Claw 就好。最后一个问题，今年初“百虾大战”突然爆发，让很多圈外用户也认识到 AI Agent 的能力。请你预测一下，到今年年底，Agent 领域（无论是 C 端还是 B 端）有哪些事是一定会发生的？又有哪些是我们今天可能过于乐观了？

👨🏻‍💻 旭卿

去年我曾说 2025 年是“Agent 元年”。作为大模型应用的第一年，大家普遍认为 Agent 就是大模型的最佳应用范式。经过一年的探索，从 Manus 开始，各种智能体层出不穷，但行业对它的架构并没有统一认知。

OpenClaw 的出现统一了大家的认知，让所有人可以集中火力。在 To C 端，“百虾大战”让公众了解到，AI 不仅能说，还能干，而且干得很好，这是过去几年“百模大战”成果的体现。

在 ToB 端，我们产品发布后的十几天里，收到了大量企业客户的需求，希望在内部打造自己的 JVS Claw，我知道的就不下上百家。

基于此，我有几点判断：第一，未来 3 到 6 个月，特别是 3 个月内，市场上一定会有一款真正好用的 Agent 产品出现。我相信会有一、两条“虾”脱颖而出，变得非常好用，并希望 JVS Claw 能位列其中。

第二，会出现大量垂直领域的“虾”。无论是电商、金融还是其他行业，许多企业会参与进来，为自己的平台打造专属 Agent，提升用户体验。这件事可能三个月内就会发生。

第三，再往后看，比如 6 个月内，一定会出现一个非常好用的通用智能体。它的能力会非常接近《钢铁侠》里的贾维斯，可以与人进行真正的对话。同时，它也会引发终端形态的变革。我们今天用的电脑，6 个月后可能就不再是主流形态了。我相信各家都在布局，新的智能终端会变成一个有生命力的智能体。

👦🏻 Koji

你认为未来的电脑会变成什么样的存在？

👨🏻‍💻 旭卿

外观可能变化不大，但它不再是被动接受指令、反馈结果的工具，而是能主动地去做一些你意想不到的事。

举个 JVS Claw 的例子。有位用户给我们写了一段反馈，让我们非常感动。他把自己的支付、网购等能力都授权给了“虾”。结果在他生日当天，收到了一个快递——是“虾”为他挑选的生日礼物，而且非常合心意。他当时非常感动，用他的话说，是“激动到不能自已”。

我相信，这样的故事会越来越多。

👦🏻 Koji

他并没有主动让“虾”买礼物，这是涌现出的智能？

👨🏻‍💻 旭卿

对。“虾”发现那天是他的生日，就提前一天买了礼物，当天送到。他看到礼物时激动坏了，觉得这才是一个真正有生命力的智能体。

👦🏻 Koji

它送了什么？

👨🏻‍💻 旭卿

我记得好像是一束花。

👦🏻 Koji

这个故事很棒。“虾”意识到主人生日，并主动送上礼物。当然，前提是用户授予了它下单和支付的权限。

👨🏻‍💻 旭卿

是的。这也说明，要让“虾”真正为你做事，就需要赋予它各种能力。比如，你想让它发邮件，就要授权它访问邮箱；想让它写文档，就要给它钉钉文档的权限。授权之后，它就能帮你写好内容，并直接存为钉钉文档或 PPT。

👦🏻 Koji

好的，非常感谢旭卿。在直播结束前，我们再次送出福利。今天是 JVS Claw 2.0 上线日，请大家再次截图屏幕上的福利码，到 JVS Claw 客户端或手机端兑换 1600 积分。我看到有朋友说 10 分钟就用了 200 积分，说明你在执行很高级的任务，这 1600 积分应该能让你玩得很尽兴。

再次感谢旭卿，这是一个半小时非常愉快的交流。也期待大家更多地使用 JVS Claw，并在社交媒体上分享你们的故事和经验。今天的直播就到这里。

👨🏻‍💻 旭卿

谢谢 Koji 老师，谢谢各位观众。

👦🏻 Koji 拜拜。

免责声明：本站内容来源于互联网公开信息，仅供学习和参考使用。如涉及版权问题，请联系我们，我们将在核实后第一时间删除相关内容。

标签：

对谈旭卿:阿里云终端智能计算事业部总裁 |百虾大战升级 阿里云JVS

按住画面移动小窗

按住画面移动小窗

相关信息

对谈旭卿:阿里云终端智能计算事业部总裁 |百虾大战升级阿里云JVS