您的位置：首页 > 资讯 > 无人系统 > 行业资讯 > 正文

Anca Dragan CoRL 演讲解读：机器人与人类如何相互影响及更好协作？

2017-11-19 07:38 性质：转载作者：雷锋网来源：雷锋网

免责声明：无人系统网（www.youuvs.com)尊重合法版权，反对侵权盗版。（凡是我网所转载之文章，文中所有文字内容和图片视频之知识产权均系原作者和机构所有。文章内容观点，与本网无关。如有需要删除，敬请来电商榷！）

而且我们不能用一些线下训练的模型来用来套到实际的驾驶中，万一遇到之前那个不肯避让的二愣子卡车司机就麻烦了。所以需要对每个司机的行为进行具体的估计。

通过对人类司机驾驶轨迹的观察，可以推断出司机的驾驶风格：比较激进或者比较保守，并采取正确的策略，如判断对方是一个保守型的司机的时候，在其前面变道超车对方通常会避让。

像这种情况的激进型司机，无人车只能放弃变道。

而在十字路口的例子中，无人车需要判断这个司机是否注意其他车辆的动作。

在优化之外的紧急场景的系统协调策略又是怎样的呢？

当仅和最终用户交互的时候，无需考虑两个效用函数，只需要和人类站一边考虑U_H最大化即可。

上述讨论的很多都是机器人如何估计人类隐藏参数的研究，另一种方式则是人如何思考与机器人互动中的参数的推断，这方面的研究一直在进行，而且需要机器人有更多的表现力。对于不同人，机器人同样的动作也会产生不同的后果，即便人类无法正确推断机器人行为的时候，至少要让他们知道发生了什么事，你想做的是什么，为什么交互没有取得更好的结果等等。机器人需要注意这个更微妙的影响，因为它决定了人们是否了解机器人正在做什么，是否有信心在执行任务等。

然而我们（设计者）在为机器人指定效用函数的时候做的不怎么样，机器人的奖励值通常具有不确定性，这往往会带来出人意料的结果。

例如在OpenAI的一篇论文中，白色小船的目标是在游戏中获得尽可能多的分，但在这里白色小船却偏离了赛道打起圈子（因为能不断吃到宝箱）。

另一个例子，如果设定一个吸尘机器人的奖励函数是吸尽量多的灰尘，那么机器人会不会在吸完灰尘后把手机起来的灰尘倒出来，然后继续吸尘以达到最大的奖励值？

又或者，像迪士尼动画片米奇用魔法教一把扫把帮其挑水，最后这把扫把不断挑水（获得最大奖励值）把整个屋子给淹了一样；

让我们来分析一下这是如何产生的。例如小船游戏的例子，当设置得分为奖励值，当机器发现有两个策略：1）排名第一但仅获得20分；2）排名靠后但能获得50分，机器人选择的是后者。

这样，设计者需要改变奖励值（找到真正的奖励值）以使得机器人按预定目标进行决策，或者让机器人能够推测到设计者的真正意图。但二者均有不足之处。

另一个包含草地、灰尘、熔岩和最终目标的导航场景的例子。

假设训练时的状态，奖励函数是尽可能少走草地得分越高的话，结果会如上图所示（此时没有出现熔岩）。

策略1：设计师有基于指标的指示器，并建立从原始观察值到指标的分类器，此时将训练的模型放到有岩浆的例子中时，机器人往往会越过岩浆到达终点（并非想要的结果）

策略2：而如果设定反向激励，机器人会对训练时未出现的元素敬而远之，机器人不知道岩浆是好鸡还是怀，也可能如上图所示错过“金矿”。

通过以上例子，说明需要在训练环境的背景下对特定的奖励进行观察找到真正的奖励，而在执行中人类的指导则是找到真正奖励的关键（如迪士尼动画片中，米奇让扫把停止打水）。

这样，机器人可以从从丰富的指导模式中学习。

简单来说，如果机器人能够理解它可能对人类情绪造成的影响，就可以更好地进行决策，并在更广泛的领域于人类更有效进行协作，给我们生活带来更多便利与惊喜。

0赞 0踩

下一篇《经济半小时》解读11.11，央视再次点赞京东物流，称代表中国速度

上一篇物流自动化发展提速 AGV机器人有望迎来爆发

网友评论
文明上网，理性发言，拒绝广告
0条评论

相关资讯
更多>>

斯科特技术公司推出NexBot AGV

斯科特科技公司（Scott Technology）的 Transbotics 业务部门在 ProMat 2025 展会上发布了其在自动导引车（AGV）技术方面的最新进展。NexBot 模块化 AGV...

2025-04-03 13:41
智行千里！中力数智2025年自动搬运车推荐会·武汉站圆满收官！

中力数智自动搬运车为您解决点对点长距离无效搬运难题！3月20日，春分好时节在樱花盛开的武汉，我们迎来了2025年度第一场自动搬运车推荐会！来自湖北区域的伙伴...

2025-03-31 13:32
卡斯卡特亮相LogiMAT 2025：轻松搬运世界，智能引领未来

2025年3月13日，全球瞩目的LogiMAT 2025展会在德国斯图加特圆满落幕。作为叉车属具和自动化车辆配件领域的全球领导者，卡斯卡特（Cascade）携其最新产品和解决...

2025-03-28 21:11
益佳通亮相LogiMAT 2025，聚焦绿色能源动力，赋能全球物流设备行业

2025年3月11日，全球知名的物流和供应链管理展览会--LogiMAT将在德国斯图加特盛大举行。作为新能源电池领域的领先企业，安徽益佳通电池有限公司（以下简称“益佳...

2025-03-27 13:40
蓉城携手启新程蜀地同心赢未来--搬易通（MiMA）成都办事处顺利开业！

中国AGV网（www.chinaAGV.com）新闻中心2025年3月23日讯，合肥搬易通MiMA在成都举行以“蓉城携手启新程蜀地同心赢未来”为主题的（成都）营销服务中心开业庆典...

2025-03-26 10:31
直击LogiMAT 2025：合肥搬易通（MiMA米玛）闪耀斯图加特，引领超窄通道智能搬运新潮流

德国斯图加特讯3月11日，全球物流行业瞩目的年度盛会--德国斯图加特国际物流展（LogiMAT 2025）在斯图加特展览中心盛大开幕。本届展会吸引了来自全球80多个国家...

2025-03-18 10:03
彩虹-9无人机及新型特种载荷首次公开亮相

我国自主研制的新一代中高空长航时无人机彩虹-9飞行试验首次公开！超20小时跨昼夜飞行万米高空极限挑战智能飞控全程“自动驾驶”神秘特种吊舱首次亮相40小时滞空...

2025-03-17 11:12
智能物流新未来，中国力量闪耀LogiMAT 2025——德国斯图加特物流展LogiMAT 2025盛大开幕

中国AGV网(www.chinaagv.com)德国斯图加特讯2025年3月11日，备受全球物流行业瞩目的德国斯图加特物流展LogiMAT 2025在斯图加特展览中心盛大开幕。作为全球内部...

2025-03-13 22:12
植保无人机带动农业经济

2025年中央一号文件正式发布，首次提出了“农业新质生产力”的概念，其中无人机技术作为关键要素之一被提及。这一政策信号不仅为无人机技术在农业领域的应用指明...

2025-03-10 13:38
JOUAV推出固定+移动式电网无人机巡检系统

无人机网(www.youuav.com)援引外媒消息，工业级无人机制造商纵横与广西供电局合作，推出国内首个“固定+移动”型电网巡检无人机自主巡检系统，为电网巡检提升效...

2025-03-10 13:38