美国陆军研究实验室(ARL)的机器人操纵器RoMan在马里兰州的阿德尔菲实验中心考虑抓取和移动树枝的最佳方法。
中国AGV网(www.chinaagv.com)据美国电气电子工程师学会(IEEE )旗下旗舰出版物IEEE Spectrum的记者撰文所摘录,作者Evan Ackerman是IEEE Spectrum的高级编辑。自2007 年以来,他撰写了6,000 多篇关于机器人和技术的文章。他拥有火星地质学学位,擅长吹奏风笛。
“我可能不应该站得这么近。”当机器人慢慢靠近我面前地板上的一根大树枝时,我心里想。让我紧张的不是树枝的大小——而是机器人在自主运行,虽然我知道它应该做什么,但我不完全确定它会做什么。如果一切都像美国陆军研究实验室(ARL)的机器人专家所期望的那样进行,那么机器人将识别分支、抓住它并将其拖到一边。这些人知道他们在做什么,但我在机器人周围花了足够多的时间,无论如何我都向后退了一小步。
该机器人名为RoMan,意为Robotic Manipulator,大小与大型割草机相当,带有履带式底座,可帮助它处理大多数地形。在前面,它有一个配备摄像头和深度传感器的蹲下躯干,以及从最初在NASA 喷气推进实验室为DARPA 机器人竞赛开发的原型灾难响应机器人收获的一对手臂。RoMan 今天的工作是道路清理,这是一项多步骤任务,ARL 希望机器人尽可能自主地完成。操作员并没有指示机器人以特定方式抓取特定物体并将它们移动到特定位置,而是告诉RoMan“走开一条路”。然后由机器人做出实现该目标所需的所有决定。
自主决策的能力不仅是让机器人有用的原因,也是让机器人成为机器人的原因。我们重视机器人,因为它们能够感知周围发生的事情,根据这些信息做出决策,然后在没有我们输入的情况下采取有用的行动。过去,机器人决策遵循高度结构化的规则——如果你感觉到这一点,那就去做。在像工厂这样的结构化环境中,这很有效。但在混乱、陌生或定义不明确的环境中,对规则的依赖使得机器人在处理任何无法提前准确预测和计划的事情上是出了名的糟糕。
RoMan,以及许多其他机器人,包括家用吸尘器、无人机和自动驾驶汽车通过人工神经网络来应对半结构化环境的挑战——一种松散地模仿生物大脑中神经元结构的计算方法。大约十年前,人工神经网络开始应用于各种各样的半结构化数据,这些数据以前对于运行基于规则的编程(通常称为符号推理)的计算机来说非常难以解释。人工神经网络不是识别特定的数据结构,而是能够识别数据模式,识别与网络之前遇到的数据相似(但不相同)的新数据。事实上,人工神经网络的部分吸引力在于它们是通过实例进行训练的,通过让网络摄取带注释的数据并学习自己的模式识别系统。对于具有多层抽象的神经网络,这种技术称为深度学习。
尽管人类通常参与训练过程,即使人工神经网络受到人类大脑神经网络的启发,但深度学习系统所做的模式识别与人类看待世界的方式有着根本的不同。通常几乎不可能理解输入到系统中的数据与系统输出数据的解释之间的关系。而这种差异——深度学习的“黑匣子”不透明性——给RoMan 这样的机器人和陆军研究实验室带来了潜在的问题。
在混乱、陌生或定义不明确的环境中,对规则的依赖使机器人在处理任何无法提前准确预测和计划的事情时出了名的糟糕。
这种不透明度意味着必须谨慎使用依赖深度学习的机器人。深度学习系统擅长识别模式,但缺乏人类通常用来做出决策的世界理解,这就是为什么此类系统在其应用程序定义明确且范围狭窄时表现最佳的原因。“当你有结构良好的输入和输出,你可以将你的问题封装在这种关系中,我认为深度学习做得很好,”汤姆霍华德说罗切斯特大学机器人与人工智能实验室的负责人,并为RoMan 和其他地面机器人开发了自然语言交互算法。“对智能机器人进行编程时的问题是,这些深度学习构建块的实际规模有多大?”Howard 解释说,当您将深度学习应用于更高级别的问题时,可能的输入数量会变得非常大,解决该规模的问题可能具有挑战性。当这种行为通过一个170 公斤的双臂军用机器人表现出来时,意外或无法解释的行为的潜在后果要严重得多。
几分钟后,RoMan没有动静--它仍然坐在那里,思索着树枝,手臂像螳螂一样摆着。在过去的10年里,陆军研究实验室的机器人合作技术联盟(RCTA)一直在与来自卡内基梅隆大学、佛罗里达州立大学、通用动力陆地系统公司、JPL、麻省理工学院、QinetiQ北美公司、中佛罗里达大学、宾夕法尼亚大学和其他顶级研究机构的机器人专家合作,开发用于未来地面作战车辆的机器人自主能力。RoMan是该进程的一部分。
RoMan 正在慢慢思考的“清除路径”任务对机器人来说很难,因为任务太抽象了。RoMan 需要识别可能挡住路径的物体,推断这些物体的物理特性,弄清楚如何抓住它们以及最适合应用哪种操纵技术(如推、拉或举),然后做到这一点。对于一个对世界了解有限的机器人来说,这是很多步骤和很多未知数。
ARL 机动和移动人工智能项目首席科学家Ethan Stump 表示,这种有限的理解是ARL 机器人开始不同于其他依赖深度学习的机器人的地方。他说:“基本上可以要求陆军在世界任何地方开展行动。我们没有在我们可能开展行动的所有不同领域收集数据的机制。我们可能会被部署到地球另一边的某个未知森林。世界,但我们会被期望表现得和我们在自家后院一样好。”大多数深度学习系统只能在它们接受过训练的领域和环境中可靠地运行。即使域类似于“旧金山的每条可行驶的道路”,机器人也会做得很好,因为这是一个已经收集的数据集。但,Stump 说,这不是军队的选择。如果陆军深度学习系统表现不佳,他们就不能简单地通过收集更多数据来解决问题。
ARL 的机器人还需要对他们正在做的事情有广泛的认识。Stump 解释说:“在任务的标准操作命令中,你有目标、约束、关于指挥官意图的段落——基本上是任务目的的叙述——它提供了人类可以解释的上下文信息,并在需要时为他们提供结构做出决定以及何时需要即兴发挥。”。换句话说,RoMan 可能需要快速清除路径,也可能需要安静地清除路径,具体取决于任务的更广泛目标。即使是最先进的机器人,这也是一个很大的要求。“我想不出可以处理此类信息的深度学习方法。”Stump 说。
ARL的机器人在崎岖地形[上、中]中测试自主导航技术,其目标是能够跟上人类队友的步伐。ARL 还在开发具有操纵能力[底部] 的机器人,可以与物体进行交互,这样人类就不必这样做了。埃文·阿克曼
当我观看时,RoMan 被重置为第二次尝试移除分支。ARL 的自治方法是模块化的,其中深度学习与其他技术相结合,机器人正在帮助ARL 找出适合哪些技术的任务。目前,RoMan 正在测试从3D 传感器数据中识别对象的两种不同方法:UPenn 的方法基于深度学习,而Carnegie Mellon 正在使用一种称为通过搜索感知的方法,该方法依赖于更传统的3D 模型数据库。仅当您提前确切知道要查找哪些对象时,通过搜索进行感知才有效,但训练速度要快得多,因为每个对象只需要一个模型。当物体的感知困难时,它也可以更准确- 例如,如果物体被部分隐藏或颠倒。
感知是深度学习往往擅长的事情之一。ARL 的计算机科学家Maggie Wigness说:“计算机视觉社区使用深度学习在这些方面取得了疯狂的进步。”“我们在其中一些模型中取得了很好的成功,这些模型在一个环境中训练并推广到新环境,我们打算继续将深度学习用于此类任务,因为它是最先进的。”
ARL 的模块化方法可能会以利用其特定优势的方式结合多种技术。例如,使用基于深度学习的视觉对地形进行分类的感知系统可以与基于逆强化学习方法的自动驾驶系统一起工作,其中模型可以通过人类士兵的观察快速创建或完善。传统的强化学习基于已建立的奖励函数优化解决方案,并且通常在您不一定确定最佳行为是什么样子时应用。这对陆军来说不是什么问题,他们通常可以假设训练有素的人类会在附近向机器人展示正确的做事方式。“当我们部署这些机器人时,事情会很快发生变化,”威格尼斯说。”
深度学习面临的不仅仅是数据稀疏问题和快速适应问题。还存在稳健性、可解释性和安全性的问题。“这些问题并不是军方独有的,”Stump 说,“但当我们谈论可能具有杀伤力的系统时,这一点尤其重要。”需要明确的是,ARL 目前并未研究致命的自主武器系统,但该实验室正在帮助更广泛地为美国军方的自主系统奠定基础,这意味着考虑未来可能使用此类系统的方式。
深度网络的要求在很大程度上与陆军任务的要求不一致,这是一个问题。
Stump 表示,安全显然是重中之重,但目前还没有明确的方法可以让深度学习系统变得可验证安全。Stump 说:“在安全约束下进行深度学习是一项重大的研究工作。很难将这些约束添加到系统中,因为你不知道系统中已有的约束来自哪里。所以当任务发生变化或上下文发生变化时,很难解决这个问题。这甚至不是一个数据问题;这是一个架构问题。ARL 的模块化架构,无论是使用深度学习的感知模块,还是使用逆向强化学习的自动驾驶模块或其他东西,都可以构成更广泛的自主系统的一部分,该系统融合了军队所需的安全性和适应性。系统中的其他模块可以在更高级别上运行,使用更可验证或可解释的不同技术,并且可以介入以保护整个系统免受不利的不可预测行为的影响。“如果其他信息进入并改变了我们需要做的事情,那么那里就会有一个层次结构。这一切都以理性的方式发生。”
尼古拉斯-罗伊(Nicholas Roy)是美国麻省理工学院机器人技术小组的负责人,他自称是"有点像乌合之众",因为他对一些关于深度学习能力的说法持怀疑态度,他同意ARL机器人专家的观点,即深度学习方法往往不能处理军队必须准备应对的那种挑战。"陆军总是进入新的环境,而对手总是试图改变环境,所以机器人所经历的训练过程根本无法与他们所看到的相匹配,"罗伊说。"因此,深度网络的要求在很大程度上与军队任务的要求不一致,这是一个问题。"
作为RCTA 的一部分,从事地面机器人抽象推理工作的Roy 强调,当应用于具有明确功能关系的问题时,深度学习是一项有用的技术,但是当您开始查看抽象概念时,并不清楚深度学习是否是一种可行的方法。“我对如何以支持更高层次推理的方式组合神经网络和深度学习非常感兴趣,”罗伊说。“我认为这归结为组合多个低级神经网络来表达更高级别概念的概念,我认为我们还不了解如何做到这一点。”Roy 给出了使用两个独立神经网络的示例,一个用于检测汽车物体,另一个用于检测红色物体。它'与使用基于具有逻辑关系的结构化规则的符号推理系统相比,将这两个网络组合成一个更大的网络来检测红色汽车要困难得多。“很多人都在研究这个,但我还没有看到推动这种抽象推理的真正成功。”
在可预见的未来,ARL 将通过让人类进行更高级的推理和偶尔的低级建议来确保其自主系统的安全和稳健。人类可能不会一直直接参与其中,但我们的想法是人类和机器人在团队合作时更有效。当机器人协作技术联盟计划的最新阶段于2009 年开始时,Stump 说,“我们在伊拉克和阿富汗已经有很多年了,在那里机器人经常被用作工具。我们一直试图弄清楚我们可以做些什么来将机器人从工具转变为团队中更多的队友。”
当人类主管指出分支中抓取可能最有效的区域时,RoMan 会得到一些帮助。机器人对树枝实际上是什么没有任何基本知识,而这种缺乏世界知识(我们认为是常识)是各种自主系统的基本问题。让人类利用我们丰富的经验进行少量指导可以使RoMan 的工作更加轻松。确实,这一次RoMan 成功地抓住了树枝,并大声地将它拖过房间。
2024-11-29 10:55
2024-11-29 10:47
2024-11-20 09:20
2024-11-12 14:32
2024-11-02 07:33
2024-10-29 09:38
2024-10-21 09:32
2024-10-19 09:54
2024-10-19 09:53
2024-10-17 09:55