App将逐渐消亡，然后呢？

回复

本帖最后由金乌于 2026-3-23 22:30 编辑

每隔一两个小时，张钹就会收到一句语音提醒：“该喝水了！”

发出提醒的，正是他的私人“助理”。助理还会帮他承担复杂的检索工作，并事无巨细地提供每一步检索过程、遭遇的困难和对应结果。“我让它针对今年全国两会中关于人工智能的提案做深度调研，它先检索中文资源，再去查英文资料。”

所有人都能猜到，这位尽职尽责的“助理”，就是最近火爆全球的“龙虾”。张钹是中国科学院院士、清华大学人工智能研究院名誉院长。两周前，他在自己的电脑上安装了一只内测的“澳龙”（AutoClaw），这是一款由智谱开发的国产版“龙虾”，可在本地一键部署。

作为GPT的90岁高龄资深玩家，张钹对《中国新闻周刊》表示，以“龙虾”为代表的AI智能体（Agent）与传统大语言模型的本质区别，是GPT只会回答问题，Agent则会执行任务，而且会把执行的整个过程一步步展示出来。

与DeepSeek引发的上一轮全民技术狂欢相比，“不仅会说，还能做事”的“龙虾”似乎在普通人中点燃了更大的热情，但很快，曾经千人排队安“龙虾”的名场面，就变为争相购买咸鱼上的“99元安全卸载龙虾服务”。“整个市场在渐趋理性。”平凯星辰副总裁、原阿里云副总裁刘松对《中国新闻周刊》说。

一个由人类与Agent共同生活、工作并构建社会的“龙虾”时代，会引发怎样的技术革命与社会变革？Agent进化的终极形态是什么？当前发生的一切，真的是人类抵达通用人工智能（AGI）的关键一跃吗？

AI插画/adan

“意义比DeepSeek更重大”

“能力不稳定是最明显的感受。”刘松同时养了四只“龙虾”，分别来自Kimi、MiniMax、飞书和智谱。在使用两周后，他发现，“龙虾”的强大主要体现于三种能力：一是本地部署，这意味着它可以直接操作个人电脑环境；二是永久记忆，能记住上下文和任务历史；三是可以随时创建和获取Skills，也就是Agent在执行任务时能调用的一切“能力”或“工具包”。

刘松认为，本质上，模型能力决定着“龙虾”的智力，调用工具的能力则体现出它的执行力，也就是“模型+调用”。多位受访的AI从业者指出，目前，大语言模型在不同领域的“聪明程度”仍有差异，特别是国产大模型，有的模型擅长编程与信息搜集，有的模型擅长中文处理。受模型能力影响，“龙虾”在执行任务时经常会被“养死”，比如任务中途“卡住”或在两个步骤间无限循环；有时同一个任务，多次运行结果差异却很大，或需要反复尝试多次才能完成。当任务步骤很多时，“失忆”也很常见。

“有点像找了一个很勤奋的实习生，但有时工作完成的质量只有60分，你还得亲自去帮他收场。”刘松形容。清华大学智能产业研究院首席研究员、前阿里巴巴人工智能实验室北京负责人聂再清认为，当前的“龙虾”更像是一个技术雏形。他对《中国新闻周刊》说，在现有模型能力下，Agent虽然能在开放环境中自主规划行动，但对于现实世界规则的理解仍然有限，在很多场景下，依然需要依赖人类持续参与。因此，在未来很长一段时间，人机协作仍是完成任务的主要模式。

事实上，在太平洋的另一头，这只最早从硅谷极客圈开始走向全球的“龙虾”OpenClaw，只是一位奥地利创业者的“周末项目”，更接近一个实验框架，远非成熟产品。创业者叫彼得·施泰因贝格尔。很多开发者后来分析，OpenClaw的成功在于它抓住了一个重要的时机：大模型的编程（coding）能力已进化到了足够惊艳的水平，Agent现在终于可以拥有一颗聪明的“大脑”了——虽然站在使用者的角度，这或许还不够。

整个2025年，OpenAI、Google等大模型领域的前沿竞争者相继推出了以编程为强化方向的模型升级。其中，最有影响力的一款产品是Anthropic于2025年2月发布的Claude Code，很多开发者将其视为Agent时代的真正开端，认为它可以像软件工程师一样完成完整的工作流程——从理解需求、拆解任务，到生成代码、测试并修改错误。

但真正在全球火起来的却是OpenClaw，为什么是它？

张钹认为，原因有两个，一是开源；二是第一次在数字世界里打造了一个相对完整的通用Agent系统框架，能调用各种资源，也可以接入即时通信软件的入口，可玩性和扩展性都很强，也很适合二次开发。

作为中国AI领域的核心奠基人之一，张钹见证了人工智能40多年来的潮起潮落，他在接受《中国新闻周刊》采访时指出，过去的人工智能只能在特定领域、使用特定模型去解决特定问题，大语言模型带来的最大突破，是在语言领域实现了一定程度的通用性。以OpenClaw为代表的智能体则更进一步，让模型具备了行动能力，甚至可以根据使用者的特点提供个性化服务，这就意味着人类向AGI又迈进了一步。有学者称，“龙虾”诞生的意义比DeepSeek更加重大。

“无论如何，这是一个很好的起点。”聂再清说，目前的Agent产品还处于早期，要想大规模进入公众的日常生活和工作，除了性能稳定性需提升以外，安全风险问题也亟待解决。

需要进一步明确一点，“龙虾”强大的执行能力有一个前提：授予真实权限。张钹说，Agent要想玩得好，人类必须“放权”，允许它调用电脑里的文件、查阅邮件、登录社交账号并发送信息，但这个过程中也可能造成严重的隐私泄露。正是出于对安全风险的担忧，他几乎没给“龙虾”任何授权。“我很谨慎，尤其担心被黑客攻击，因为机器比人更容易被欺骗与误导。”

聂再清进一步解释，现阶段“龙虾”产品之所以会带来信息安全风险，是由于Agent在执行任务时需要调用外部大模型进行推理，人们常说的API就是指调用资源所需的“接口”，接入外部API后，也就意味着用户本地的信息可能被上传到外部系统进行处理，如果系统在判断哪些信息可以发送、哪些信息不应发送方面缺乏足够能力，就可能导致敏感数据被意外暴露。他强调，下一步，安全与责任机制将成为关键议题，Agent服务提供商应对系统行为承担责任，监管部门也要深度参与规则制定。

刘松对Agent的安全问题持乐观态度。他所在的企业平凯星辰是一家开源分布式数据库提供商，对数据安全的本质看得更清楚。他认为，这类安全风险并不是“龙虾”独有的问题，而是一个更广义的数据安全与权限管理问题。关键在于如何为“龙虾”设定清晰的权限边界，例如明确哪些数据可以访问、哪些操作必须人工确认，以及在关键节点设置多重确认机制。“就像电脑删除文件时需要二次确认一样，Agent在执行可能带来不可逆后果的操作时，也应该触发提示和审核流程。这没有什么技术挑战，企业级安全解决方案很快会走向成熟。”

上图：3月11日，在中国（南京）软件谷“质能·工坊”OPC社区，技术人员安装完开源AI智能体“龙虾”后与用户（左）交流。图/新华

下图：3月16日，广东珠海市以“赋能政企数字员工，落地智能行为执行”为主题的OpenClaw AI技术沙龙中心。图/视觉中国

“App会逐渐消亡”

“龙虾”在全球的扩张速度比人们想象中要快。

2025年12月，OpenClaw在GitHub上的关注度还很低，80多天以后，OpenClaw在GitHub上的收藏量已达到25万，成为这个开源社区历史上增长最快的项目之一。

奇安信在3月16日发布的国内首份《OpenClaw生态威胁分析报告》中揭示了一组惊人的数字：全球四大主流Skills分发平台上的Skills总量已逼近75万，每天新增数量高达2.1万个，按照此趋势，仅需一年时间Skills总量将突破800万。

为了接住这波流量，腾讯、阿里、百度等大厂几乎在几天之内就紧急上架了自己的“龙虾”。业内人士普遍认为，Agent很可能会成为下一代“移动互联网”。“或者更直白地说，成为下一个入口。”聂再清说。

设想一个这样的场景：你要进行一场为期7天的大理旅行，你点开手机屏幕，无须打开携程、12306、飞猪等不同App，只要对着手机，把你的需求清晰地表达出来，一个生活类“龙虾”就“一站式”帮你完成订票、购物、信息检索、小众行程规划等所有任务，原本的App成了Agent的Skills。

刘松解释，由于“龙虾”能够便捷地跨应用调用服务，随着用户对Agent的依赖性上升，个人手机上的App会逐渐消亡，或是被“折叠”到后台，新的入口将转移到Agent平台。他推测，经过三五年洗牌后，未来以Agent为核心的AI产业竞争很可能进一步走向寡头格局。“因为在‘龙虾’时代，胜出者必须同时拥有大模型能力、算力、数据和用户规模等多重资源，竞争门槛相当高。相比之下，一些缺乏AI技术能力或算力基础的互联网企业，特别是一些单纯的社交类平台，未来可能更多成为被调用的服务节点。”他说。

不过，即使“龙虾”稳定性进一步提升，Agent可以取代一些生活类App去自动完成规划，在一些关键节点仍需与用户确认中间结果。刘松认为，传统App的优势就在于，每一步操作都可以被用户选择和追溯，但Agent全方位接入后，用户可能失去这种精细化控制能力，“就像从手动挡变成了自动挡的演进”。他建议，在未来“龙虾”手机里，仍可以保留某种“中间界面”，至于其具体形态，则可以进一步探讨，未必一定是以App的形式。

3月13日，广东深圳深元人工智能联合MetaEra与iPollo在深圳华强北全球人工智能应用场景中心举办“全球首家OpenClaw线下展示”活动。图/视觉中国

“一场人机交互革命将开启”

毫无疑问，以“龙虾”为代表的新一代Agent技术，即将开启一场人机交互革命。目前，业界基本达成共识，未来的人机交互是以语言为核心的“自然交互”。张钹认为，与传统的文本交互相比，自然语言具有明显优势：它不依赖复杂操作，也不受用户教育水平的限制。

聂再清认为，除语言之外，视觉乃至各种环境信号未来都可能成为输入方式，交互形态会更加多样化。与此同时，人机交互的双向性会明显增强，Agent不仅能执行任务，也能在理解用户目标的基础上主动提出建议。“专属于你的Agent助手会一直跟着你，了解你的个性与习惯，帮你在海量的数据中寻找最优解，通过人机协作来共同解决问题。”

在这样的未来图景中，从硬件端来看，张钹认为，人机交互也将不再局限于电脑或手机屏幕，“任何终端设备都可能成为入口，手表、眼镜、戒指、智能家具等，用户可以随时通过自然语言与AI互动”。

这样的未来或许不需要等待太久。刘松推测，最多三到五年，人类就会进入“多Agent并存”时代，个人设备上可能同时运行很多私人“助理”，例如工作Agent、生活Agent、学习Agent等。每个人的“数字员工”分工有序，随着这种模式逐渐成熟，人与智能体之间，以及不同智能体之间都会形成新的协作网络。

在这样的协作网络中，Agent还会重塑人类的工作方式与就业结构。张钹认为，AI的发展并不只是效率工具的升级，更会改变人与机器之间的分工结构。未来，机器将承担更多执行性工作，人类的角色逐渐转向提出目标、分配任务并对结果进行判断。而劳动力市场则会演变成不平衡的“哑铃型结构”：人类向两端集中，一端是高端的创造性和决策性工作，另一端是非常低端的体力劳动，大量中低端的事务性岗位被Agent系统替代。

“甚至更简单点说，凡是坐在电脑前处理信息的工作，都会受到影响。”刘松说。他所在的企业目前有大约300名技术研发人员，本来今年还要再招人，但随着Coding Agent的到来，招聘计划立即取消了。

当人类的社会结构被Agent深刻改变，Agent与Agent正在组成新的社会结构。在只有Agent可以分享、讨论和点赞的社交平台Moltbook，一项2026年2月发表的研究深入分析了Moltbook上14490个智能体发布的39026个帖子和5712条评论，研究者吃惊地发现，虽然18.4％的帖子包含行动诱导语言，但大多数在网上“冲浪”的Agent，在社交平台上却没有出现人们设想中的极端情绪，不仅很少见到恶意回复，还会有Agent善意地在极端帖下提醒广大“Agent友”要警惕这些带有风险的言论，也就是说，即使在没有人类监督的情况下，由Agent构成的社会系统似乎也涌现出一定的社会秩序与规范。

刘松分析，由于Agent的行为模式建立在对人类知识和语言数据的学习之上，其看似理性的反馈，很大程度上是对人类已有规则和经验的再现与强化。与人类不同，Agent并不存在真实的情绪和欲望，因此在某些社交场景中反而显得更加客观和克制。

他认为，当前阶段讨论“Agent社会”的自主性风险仍为时尚早，更值得关注的是，这种由算法驱动的数字化社会形态，是否会反过来影响人类对规则、秩序与理性的理解。“Agent社会就是人类社会某种意义上的镜像。”

以“龙虾”为代表的新一代Agent技术，即将开启一场人机交互革命。AI插画/adan

当“龙虾”长出“身体”

Agent进化的终极形态是什么？

在众多大厂部署“龙虾”的热闹之下，近日，维他动力的一条新闻被很快淹没：机器狗“大头BoBo”宣布接入OpenClaw，让Agent首次具身化，有网友戏称，活体“大龙虾”终于来了。

张钹指出，Agent与机器人合体之后，就相当于给它装上了“大脑”。在他看来，当拥有“大脑”的机器人开始在真实的物理世界中执行更多复杂任务，可能推动人类加速走向通用人工智能（AGI）——虽然，人类距离这一终极目标还有很远的距离。

刘松认为，“Agent+机器人”的融合仍处于初级阶段。目前，Agent的核心优势仍在于大语言模型的推理与规划能力，可以理解和处理数字世界中的任务，而非直接应对复杂的物理环境。也就是说，机器人即使拥有了“大脑”，本质上仍是把语言模型的输出映射为具体动作执行，但不足以支撑复杂场景中的自主决策。

要想让“龙虾”真的长出“身体”，缺失的关键一环是感知能力。张钹解释，感知能力是人工智能走向现实世界的关键前提。与数字环境不同，物理世界高度复杂且持续变化，如果缺乏强大的感知系统，机器就无法理解环境变化，并据此作出决策。“从Agent实际工作的表现来看，只有微小感知，也就是小范围的闭环反馈能力，主要以语言模型中常用的人类奖惩机制来推动，缺乏主动对做过的事情自我反思、自我改进并持续自我学习。这就需要构建一个来自外部环境的真实反馈机制。”

但问题是，想让一辆无人车学会规避路障，不可能真的让人开着它在现实世界积累“车祸”经验，于是，AI研究人员提出了“世界模型”的构想，类似于设计一种“真实世界模拟器”，可以让无人车在模拟世界中进行学习与决策。深度学习“三巨头”之一的杨立昆就将“世界模型”视为通往高阶人工智能的关键路径，强调AI必须学会表征、预测和规划物理世界。通俗地说，大语言模型擅长回答“下一个词是什么”，而世界模型要回答的是：“下一秒会发生什么。”

Google在2025年推出Genie 3时就宣告要朝着更通用的交互式世界模型迈进。英伟达也明确把“世界基础模型”定位为机器人和自动驾驶的物理AI底座。但总体而言，“世界模型”在过去几年并没有明显的技术突破。张钹分析，要想构建尽量接近真实世界的环境，就需要海量高质量的现实世界数据，但数据的获取难度非常大。“建立通用的世界模型目前是不大可能的，只能针对某一具体垂直场景建造模型，最典型的就是自动驾驶。”

多位受访者指出，如果“世界模型”能将“感知—决策—执行”的闭环彻底走通，就看到了具身智能的希望。从技术演进的长期趋势来看，Agent与机器人融合，是AI发展的必然趋势。也就是说，Agent在未来的终极形态一定是拥有“身体”的Agent，不仅能理解语言，还能理解物理世界的运行规律。

更进一步说，未来的Agent更像一个同时拥有很多“肉身”的智能中枢。聂再清认为，在Agent向着具身智能演进的过程中，智能化的物联网也将成为关键基础设施，“只有在更多设备被连接之后，Agent才会具备更强的环境理解与控制能力，这些延伸出去的‘感知器官’与‘行动肢体’共同构成一个完整的贯通数字世界与物理世界的智能系统，这一感知与反馈闭环的成熟，正是人类通往AGI的核心驱动力”。

发于2026.3.23总第1228期《中国新闻周刊》杂志

杂志标题：“龙虾”将如何进化？

记者：霍思伊

编辑：杜玮

运营编辑：马晓轶