日本NTTCorporation的研究人员最近开发了一种以用户为中心的强化学习方法,该方法可用于向社交机器人教授“方式”。在arXiv上预先发表的一篇论文中概述了他们的方法,该方法使机器人可以问候或吸引路人的注意力,而不会引起路人不适。
进行这项研究的研究人员之一,YasunoriOzaki告诉TechXplore:“我的想法是受市场中的皮箱启发的。”“大多数剥皮人都会致电对餐厅感兴趣的路人,但他们几乎不会打电话给其他人。根据这一观察结果,我提出了以下假设:剥皮人通过推断出他们对广告服务的兴趣来确定要呼叫的路人我想开发一种方法,该方法允许机器人通过训练剥皮者的行为来模拟剥皮者的行为,以使其理解人们的利益。”
社交机器人正在逐步进入医疗保健和零售等各个领域。例如,在零售业中,社交机器人可以帮助向路人和潜在客户解释产品。
最近,越来越多的公司已开始测试机器人作为客户服务代理(例如接待员,向导或参展商)的有效性。但是,为了在面对客户的角色中发挥最大的作用,机器人需要向路人打招呼,而不会惊吓他们或让他们感到不舒服。
考虑到这一点,Ozaki和他的同事着手开发一种方法,该方法允许机器人根据机器人所处的环境以及与之交互的人来调整其行为习惯。他们的方法采用以用户为中心的强化学习,以分析机器人传感器收集的数据,从而可以相应地调整其动作。
Ozaki解释说:“我的方法允许机器人通过观察路人的反应来学习动作。”“当机器人对路人采取行动时,路人通常会对这种行为做出响应。例如,如果机器人呼叫路人,则该呼叫可能会导致路人不适,或者可能导致路人对机器人产生兴趣。机器人通过分析后方传感器收集到的画面,估算出行人的感受。”
Ozaki和他的同事设计的方法基于奖励和惩罚方案。如果机器人在与之通信的任何路人中引起不适,则会受到惩罚。另一方面,如果路人停车,与机器人互动并对它产生兴趣,则机器人会获得奖励。随着时间的流逝,机器人学会适应其交互策略,从而在不使潜在客户感到不舒服的情况下吸引人们的注意力。
本站信息仅供参考,如有文章涉及版权问题,请速与我们联系:2811358863@qq.com | 网站地图
备案号:桂ICP备2023007194号 © Copyright 2024 56常识网 Inc.All Rights Reserved. 桂公网安备45030502000552