谷歌PaLM-SayCan模型可让机器人更好地理解自然语言并执行复杂任务

Source

长期使用 Alexa、Siri、Google Assistant 等数字助理的朋友，或许已留意到这项技术正在变得愈加智能。与此同时，近年来的机器人技术也在突飞猛进。以谷歌为例，该公司有在演示一款乒乓球机器人，旨在训练其应对快速、自适应、且精确的任务挑战。Google 研究员接触科学家兼机器人技术负责人 Vincent Vanhoucke 表示：“在一鸣惊人之前，你必须勤学苦练”。

访问：

阿里云服务器精选特惠：1核1G云服务器低至0.9元/月

（图 via Haje Kamps）

在速度和精度之外，Google 还希望通过实验，攻克人类语言和机器人技术的交叉点。截至目前，这家科技巨头已在自然语言水平上取得了让人印象深刻的飞跃。

举个例子，你可能会对一个人说 ——“有空帮我从柜台拿一杯饮料吗？”

尽管对于人类来说，这句话的语境相当简洁。但是对于一台机器人来说，其中包含的信息量很可能将其绊倒。

因为‘有空’这词语可能不包含任何意义，也可能是趁着机器人正在干另一件时与之通过自然语言交互。

如果机器人过度理解了字面含义，它可能会回答一句‘当然可以’—— 即便用户并未明确要求它这么做。

若机器人更加钻牛角尖，它可能又会陷入该帮你拿哪一种饮料的纠结。

好消息是，Google 正在使用该公司的 NLP 系统拉解决一些问题。在 Pathways 语言模型（PaLM）的帮助下，机器人有望更准确地接收并理解人类的真实所想。

下一阶段的挑战，则是审视机器人能够切实做到哪些事情。比如让你让机器人拾取冰箱顶部的一瓶清洁剂时，它是否会小心安全地摆放到儿童不易接触到的地方。

不过在此之前，Google 还是会着眼于更加普适性的任务。简单的有‘向前移动一米’，稍微高级点的可以是‘去厨房拿一罐可乐’。

然后才是复杂多步任务的拆解执行，比如 ——‘啊哦，我不小心将可乐撒地板上了！能帮忙清理干净、并再给我拿一杯吗？’

对此，Google 选择的方案是利用语言“讲述”（Say）模型中所包含的知识，来帮助机器人确定并评估哪些高级指令“可否”（Can）派上用场。

在融汇了 PaLM 语言模型之后，Google 已将它重命名为 PaLM-SayCan，且正在自家实验室使用来自 Everyday Robots 的一些机器人（上图展示其已学会何时去充电休息）。

当然，在投入实际商用之前，这项技术显然还有相当多需要完善的地方，尤其是需要事先收集极其庞大的知识与技能数据集。