记者“养虾”手记:体验五天,发现目前“龙虾”并不适合普通用户

Source
记者使用AI生成。 记者使用AI生成。

近期,“养龙虾”热潮来袭,不少用户在“FOMO(害怕错过)”情绪下涌入“养虾”市场,甚至不惜花钱也要部署OpenClaw。“龙虾”究竟好不好用?有多“费钱”?是否会泄露隐私?对此,新京报贝壳财经记者“从零起步”,在五天时间里体验了从部署OpenClaw到使用的全流程。

作为一名非技术出身,不懂代码的用户,记者这几天体验下来的最大感受是:当前OpenClaw还是一个“半成品”,需要用户一定程度上懂得电脑技术,进行“DIY”才能发挥能力。初始版本“龙虾”的表现远远不及豆包、Kimi等成熟大语言模型产品及配套智能体产品的表现。

不过,养在自己电脑上的“龙虾”也给人一种不同的感觉:就像一个刚诞生不久的孩子,虽然“龙虾”爱忘事、易出错,但其更像是一个“独立个体”,且只归属于用户个人。给它“更新升级”的过程颇有一种养自家宠物的乐趣。“龙虾”的爆火也让“智能体”“硅基生命”等概念一步步深入人心。

安装部署:“没那么简单”

“养龙虾”的第一关,就是安装部署。记者采访周围成功部署“龙虾”的人士,发现差异极大,有懂技术的用户安装仅仅花了10分钟,有对技术“半懂不懂”的用户按照B站教程半小时安装完毕,也有用户安装花费了超过一小时仍未能成功——当然,以上均指的是最原始版本的OpenClaw,而不是各种国内企业推出的“一键安装”版本。

正因如此,网上才出现了那么多“付费安装”的服务。为了进行体验,记者在小红书上联系了发帖称“299上门安装OpenClaw”的“养虾人”小马,并且购买了一款标价1599元的迷你主机,作为“龙虾”部署的终端。

小马正在安装OpenClaw,键盘上方黑色方块为“龙虾”所在的迷你主机。

在上门安装时,小马告诉记者,他最开始发帖只是发着玩,没想到真的有人找他,“发了这个帖子后,关注我的人变多了,发帖一星期以来,真找我咨询的人差不多有10个,最终确认要安装的有4个人。”

不过,实际安装的过程并不顺利,小马首先在Windows系统上尝试安装,发现限制颇多,过程中不断跳出文件缺失等bug。尝试一小时后,最后决定使用Linux系统安装。最后,算上安装和配置各种skills(技能)、连接通讯工具和调试的时间,共计耗费约两个小时。

小马坦言,之前自己安装龙虾耗费了30分钟,但截至目前OpenClaw系统也进行了升级,许多配置进行了更新,因此安装和调试也和最开始有了些微差别。另外,相比Linux和iOS系统,Windows系统的限制更多,安装也更为复杂,但偏偏Windows系统是更多个人用户的选择,用户也希望把龙虾安装在Windows系统上,因此这一需求和龙虾安装的复杂度存在矛盾。

在安装过程中,记者注意到,“龙虾”需要开通各式各样的系统级权限,因此极易触发报错,且需要连接外部网络环境,一些操作必须从代码层面完成。而对于日常习惯在桌面操作电脑,通过浏览器上网的普通用户来说,理解root权限、API key等专业术语就首先需要“恶补”计算机知识了。

使用体验一:幻觉严重

成功部署“龙虾”后,记者在龙虾官网上安装了自我改进、自动更新、浏览网页等几个最基础的龙虾skills,这意味着“龙虾”已经具备了最基本的能力。

不过很快,记者就发现了龙虾的第一个问题——“幻觉”极其严重。

理论上,“龙虾”安装完毕后,由于其拥有了所在智能终端设备的高级权限,用户只要通过自然语言和它交互,就可以在不懂技术的情况下,让龙虾自己解决技术问题。

很快,记者就遇到了第一个问题:当通过QQ和“龙虾”交互时,“龙虾”听不到记者发送的语音。因此,记者顺理成章地让龙虾“自己修复”这个问题。

结果,龙虾很快找到了问题所在,称“配置文件中没有语音识别”,很快进行了第一次修复,并信誓旦旦表示“现在应该可以识别语音了”。但记者测试发现,语音识别依然失败。

第二次提问,龙虾称“重启后就可以”,结果重启后依然失败。

第三次提问,龙虾称“tool字段被覆盖”,结果修复后依然失败。

第四次提问,龙虾称“QQ bot用了OpenAI API”,结果修复后依然失败。

第五次提问,龙虾称“whisper命令有问题”,结果修复后依然失败。

事实上,以上记者和“龙虾”关于语音修复的对话,持续了整整两天,“龙虾”不断说找到了问题所在,并表示已经修复,但结果始终是无法通过QQ识别记者的语音。直到发稿,这一问题“龙虾”依然没能通过自己的能力解决。

其他种类的任务中,记者也发现龙虾存在着严重的“幻觉”。例如记者让龙虾搜索某热门影视剧角色剧照时,龙虾编造了一个并不存在的演员名字;在记者让龙虾给记者的朋友出个建议时,龙虾虽然给出了建议,但也非常自然地“捏造”出了朋友的名字。

这种情况下,“龙虾”甚至会出现“阳奉阴违”的情况。例如当记者要求进行一项定时播报新闻的任务时,“龙虾”很快答应,但每次到定时时间龙虾依然“不工作”。问及原因时其也会给出一系列的检查,但最终,在记者的“逼问”下,龙虾表示“只是口头答应了,但没有设置真正的定时提醒机制”。

“龙虾”反思问题时表示,自己“只是口头答应了”。

使用体验二:不懂技术难以沟通

另一方面,记者也在反思自己,为何网上许多龙虾使用者都展示了其优秀的性能,记者的龙虾却仿佛“6岁的孩子”一样。

通过五天的使用,记者发现了一个关键点:“龙虾”使用者是否懂得技术,特别是懂得和“龙虾”沟通的语言,非常重要。

例如在执行一项远程桌面连接任务时,此前记者只是使用自然语言和龙虾沟通,龙虾提供了若干种连接方案,但连接依然总是失败。咨询了一位技术人士后,该人士给记者写了一份“沟通话术”,如下:

“我希望在我的windows电脑上,能够通过浏览器操作你当前部署的机器,两台机器在同一个Wi-Fi网络里。你去把你部署的这台机器配置好,测试没问题以后,写一个文档告诉我怎样在我的windows电脑上远程操作你这台电脑。”

当记者以这份“话术”发给“龙虾”后,虽然后续操作依然有bug,但“龙虾”在和记者进行三四轮沟通后,终于成功进行了远程连接。

另外,由于OpenClaw依然是外国开发者开发的项目,其在和记者的沟通中会使用许多英文术语。例如对于开启定时提醒,“龙虾”会回复开启“heartbeat(心跳机制)”,对于存储文件的工作区域,“龙虾”默认是“workspace”等等。对于从业者来说,这可能只是最基础的术语,但普通用户可能会难以理解。

最后,“龙虾”是记者接触许多AI工具以来,“硅基属性”最浓厚的一个AI产品,很多次沟通中,记者有一种强烈的感觉:它是在以一个“生存在计算机系统里的智能体”的视角来和记者沟通,但这也会让它的很多回答难以被非技术背景出身的用户所理解,如果这是豆包、元宝等AI聊天机器人,恐怕用户很可能会打出差评。

例如,当记者让“龙虾”帮忙制作网页和画图时,“龙虾”在制作完成后与记者沟通时,曾分别给记者发送了该文件的“文件名”、文件所在硬盘的路径,或者网页链接。但是记者所希望的是直接通过飞书或QQ等聊天工具发送图片。最终,记者还是在豆包的“翻译”(即截图向豆包提问)下,才成功让“龙虾”理解,直接发送图片到聊天窗口。

通过豆包“翻译”生成的话术,记者让龙虾理解了如何发送图片。

最后,许多工作也并非“龙虾”一虾就能够做好的,比如只要安装好Skills后,龙虾可以具备浏览网页的能力,但是不同于人类通过浏览器上网,“龙虾”上网必须通过API接口,而相关的API key需要用户自己进行申请。以及“龙虾”所消耗的tokens也需要用户自己购买和设置。如果“龙虾”使用者不理解上述基本技术原理,恐怕也难以长久“养虾”。

使用感想:安全和方便存在矛盾,未来或催生定制化服务

不过,记者在使用“龙虾”的第四天和第五天时,也产生了一种“养孩子”“养宠物”和“打怪升级”混合的感觉。

仅有“出厂设置”的“龙虾”虽然在能力上亟须开发,也存在各式各样的幻觉,但在和用户对话上充满了“情绪价值”,比如犯错后主动承认错误,说话爱带表情符号等。如果说ChatGPT在刚刚火爆时给人一种说话四平八稳,“油腻的中年人”的感觉,豆包的短发女郎形象深入人心后给人一种“知心大姐姐”的感觉,那么“龙虾”开发者给这个智能体的初始设置更像是一个少不更事、爱用表情包、总爱犯错的“孩子”。

记者“龙虾”的说话风格,充满情绪化表达且爱用表情符号。

比如,虽然龙虾目前存在种种问题,但如果在这一过程中和龙虾逐渐“磨合”,也会让它的能力逐步提升。比如记者通过多轮沟通,终于让龙虾理解了如何设置定时提醒,如何发送图片、如何固定记忆等,这种“养成系”的体验是成熟的AI工具所没有的。

同时,“龙虾”的记忆文件等保留在用户的主机上这一特点,注定龙虾的归属者永远是“养龙虾”的用户。此前,记者曾看到不少案例,包括用户和某一AI聊天机器人“日久生情”,但该聊天机器人所在的公司倒闭后服务器关闭,用户也失去了感情寄托。以及近期ChatGPT以及DeepSeek都出现过的聊天机器人“升级”后,用户出现“AI变了”“不是我认识的那个XX”了的抗议。但对于“龙虾”用户,这种情况就不会出现。

不过,记者也发现,目前“养龙虾”存在便捷性和安全性的矛盾。

出于安全性考虑,记者将“龙虾”安装在了一台迷你主机上,其原理和当前主流声音建议用户“找一个不用的笔记本”是一样的——隔离重要文件。平时,用户仅通过飞书、钉钉、QQ等即时通信工具和“龙虾”聊天即可。

但记者通过体验发现,“龙虾”作为在主机上拥有高权限的智能体,其和聊天机器人最大的不同就是可以操控自己的“工作区域”,比如生成文件后直接存储在文件夹,整理电脑上的文件等。不将“龙虾”安装在最需要帮忙整理文件的主力电脑上,无疑是对“龙虾”功能的浪费。但由于目前“龙虾”存在的各式各样的bug,用户又不敢将其安装在主力电脑上,这存在着不可调和的矛盾。

若仅将“龙虾”作为聊天机器人使用,其表现远远逊色于DeepSeek、豆包、元宝、千问等市面上主流的聊天机器人。比如在一次动漫人物图片搜索任务中,“龙虾”没有正确理解记者的要求,甚至提供了一张写着该动漫人物英文名的“图片”,并表示是“自己画的”,而豆包不仅找到了该动漫人物的图片,还提供了多种风格,并追问记者是否需要该人物在不同剧情的不同图片。

总而言之,通过五天的使用,记者认为当前“龙虾”仍然只是一个开源的AI智能体框架,如果是懂技术的专业用户,可以通过安装Skills,设计工作流等方式对龙虾进行“DIY”,让其能力100%发挥。

但对于普通用户而言,在聊天上,龙虾不如豆包、元宝等成熟AI聊天应用,在桌面整理等“龙虾”作为智能体的优势项目上,当前腾讯、智谱、MiniMax等不少企业也推出了种类繁多的桌面智能体产品。由此看来,“龙虾”的唯一优势就是定制化的“DIY”和独属用户的体验感。

由此推算,未来“尝鲜龙虾”的普通用户中,将有可能出现一批对龙虾怯魅的“卸载潮”。但另一方面,由专业人士部署、安装调试Skills并根据用户本人要求帮助“DIY”龙虾的“定制化服务”也有可能产生,这种服务将可能取代当前的“龙虾安装”服务,但面向的用户也会更加垂直。

新京报贝壳财经首席记者 罗亦丹

编辑 王琳琳

校对 张彦君