中经记者 李静 北京报道
3月27日,在2026中关村论坛年会上,来自中国大模型与AI基础设施的顶流人才聚集在了一场圆桌论坛上。
这场圆桌由月之暗面创始人杨植麟担任主持,智谱华章CEO张鹏、无问芯穹联合创始人兼 CEO夏立雪、小米MiMo大模型负责人罗福莉,以及香港大学助理教授、博士生导师、Nanobot团队负责人黄超共同参与。
《中国经营报》记者注意到,几位来自AI产业界的技术人才,对谈中没有客套的寒暄,话题涵盖从“龙虾(OpenClaw)”引发的行业巨震,到开源生态的暗流涌动;从推理成本的飙升焦虑,到Agent时代的算力重构。
在这场思想的碰撞中,他们不仅揭示了未来12个月大模型从“陪聊”到“干活”的进化路径,更抛出了那个让所有人既兴奋又焦虑的问题:当Token用量迎来百倍爆发,我们准备好了吗?
谈“龙虾”:Agent重塑人机交互
圆桌开始,话题聚焦在近期刷屏的“龙虾”身上。这不仅仅是一个产品的更新,更被视为AI行业应用的分水岭。
对于这波Agent浪潮,张鹏认为,其核心在于让AI从“简单的对话”进化为“真正干活”。
他指出,“龙虾”对模型能力提出了极高要求,需要模型具备长时间的思考、规划,以及处理海量上下文的能力。这也直接导致了智谱近期对GLM推理模型的提价策略。
“因为干复杂的活,意味着推理成本的指数级上升,回归商业价值的正常逻辑是行业良性发展的必经之路。”张鹏回应道。
夏立雪透露,自今年年初“龙虾”爆火以来,其公司处理的Token量几乎每两周翻一番,累计增长达10倍,这种爆发速度上一次出现还是在3G手机流量普及时期。
夏立雪认为,过去的云基础设施是为“人类工程师”设计的,而Agent时代需要的是为“AI”设计的基础设施。他甚至用“分钟级”与“毫秒级”的对比来形容这种错位:人类发起任务是分钟级的,而Agent的思考和任务发起是毫秒级的。
“因此,未来的基础设施必须像Token工厂一样高效,甚至演变成一个能够自我进化、自我迭代的智能体。”夏立雪预测道。
罗福莉认为,OpenClaw的最大价值在于“开源”,这有利于社区深入参与。它把国内次顶级闭源模型的上限拉得非常高,在绝大部分场景下任务完成度已非常接近最新模型,同时又靠Skill体系保证了下限。同时,开源也点燃了社区对大模型之外Agent层的探索热情,让更多非研究人员参与到AGI变革中。
黄超则补充道,OpenClaw以即时通讯软件式的交互,赋予了智能体更强的“活人感”,降低了创建和使用Agent的门槛,未来更有望撬动整个工具生态。
算力与成本的挑战
随着AI从训练时代向推理时代迈进,模型技术迭代、商业价值回归与算力基建支撑成为行业发展的关键议题。
杨植麟将开源比作“脚手架”,认为它降低了普通人使用顶尖模型能力的门槛,让AI不再是程序员的专利。但他也直言,开源社区目前面临着推理算力的巨大缺口。
关于“算力焦虑”在圆桌讨论中被反复提及。张鹏坦言,由于任务复杂度的提升,完成一个任务的调用量可能是简单问答的十倍甚至百倍,这让算力成为制约行业发展的瓶颈。
夏立雪表示,当前的问题在于AI带来的暴增需求,对系统效率提出了优化的需求。“我们通过软硬件打通来解决,接入了几乎所有种类的计算芯片,连接国内几十种芯片和算力集群,提升转换效率,把中国打造成世界的Token工厂。”
他还描绘了一个宏大的愿景——“AI Made in China”,即利用中国的能源和制造优势,通过高效的基础设施,将能源转化为优质的Token输出全球。
但是,现有的云计算基础设施限制了Agent的发展,需要打造更智慧化的AI基础设施能适应Agent的高频需求。“在我们看来,基础设施本身也应该是一个智能体,能够自我进化、自我迭代,形成自主组织。”夏立雪补充道。
罗福莉指出,两年前,中国团队在算力受限,尤其是互联带宽受限的情况下,做出了模型结构的突破(如DeepSeek)。
“虽然现在国产芯片不再受限,但这种对高效率、低推理成本的探索依然重要。”罗福莉说道,OpenClaw越用越聪明的前提是推理Context。现在的难题是:怎么在1M或10M的长上下文中,做到成本够低、速度够快?“只有实现Long Context(长上下文)的高效推理,才能支撑起Agent在复杂环境中的自迭代能力,这将是未来竞争的关键战场。”
并且,罗福莉预测,随着Agent带来的推理需求爆发,今年对Token的需求可能会增长100倍,竞争维度将下探到算力、推理芯片甚至能源层面。
黄超认为,现在Agent在Memory方面,还存在信息压缩不准确、记不准的问题。在长线任务和复杂场景下,Memory会暴增,带来很大的压力。“我觉得未来的Memory应该走向分层设计,让Memory更通用。”
展望未来12个月
如果用一个词来描述接下来十二个月大模型发展的趋势,你会选择什么?
黄超的关键词是“生态”。他预见,未来的软件可能原生为Agent设计,整个技术栈需要向“Agent Native”模式演进,这需要开源社区、模型开发者、应用厂商共建,让Agent从“好玩的新鲜事物”真正沉淀为可靠的“数字同事”(Co-worker)。
罗福莉的关键词是“自进化”。她认为,强大的Agent框架激活了大模型此前未被触及的上限。在可验证的循环中,模型已能持续数天自主优化目标,如在科学研究中探索更优的模型结构。她预计,这种“自进化”能力将在1—2年内,将科学研究等创造性工作的效率提升数个量级。
夏立雪的关键词是“可持续token”。在他看来,现在整个AI的发展仍然处在一个长期持续推进的过程中,但一个非常现实的问题是:资源终究是有限的。
“能不能持续、稳定、大规模地提供token,让顶尖模型真正长期地服务更多下游场景,这是一个非常关键的问题。”在夏立雪看来,如果能够把中国在能源等方面的优势,通过Token工厂,可持续地转化成优质Token,并输出到全球,中国就有机会成为世界的“Token工厂”。
张鹏选择的关键词是“算力”。智能体框架,确实让很多人的创造力得到释放,效率也可能提升十倍,但前提是,大家得用得起,也用得上。
“两年前张亚勤院士在中关村论坛说过一句话,大意是‘没卡没感情,谈卡伤感情’,我觉得今天其实又有点回到了这个状态。”张鹏说道。
(编辑:张靖超 审核:李正豪 校对:颜京宁)