您现在的位置:首页 >> 拖拉机械

使用自然语言和视觉处理与人类互动的自主机器人

2021-08-18 来源:河北农业机械网

使用自然语言和视觉处理与人类互动的自主机器人

普渡大学电气与计算机工程学院的研究人员正在开发集成的语言和视觉软件,该软件可以使自主机器人与不同环境中的人进行交互并实现导航目标。

使用自然语言和视觉处理与人类互动的自主机器人 中国机械网,okmao.com

“该项目的总体目标是告诉机器人副教授杰弗里·马克·西斯辛德说:找到一个特定的人,房间或建筑物,并使该机器人与未经训练的普通人互动,以自然语言询问去往特定地点的方向。”领导研究团队中国机械网okmao.com。“

要完成此任务,机器人必须在人们在场的情况下安全操作,鼓励他们提供指导并使用他们的信息来找到目标。”

博士生托马斯·伊列夫斯基(Thomas Ilyevsky)和贾里德·约翰森(Jared Johansen)正在与Siskind合作开发一种名为Hosh的机器人,该机器人可以将图形和语言数据集成到其导航过程中,从而找到特定的地点或人物。

该团队正在通过由美国国家科学基金会的国家机器人计划资助的赠款来开发机器人。

该机器人可以帮助自动驾驶汽车与乘客和行人通信,或者可以在商业场所完成小规模的任务,例如传递邮件。

根据波士顿咨询集团(Boston Consulting Group)的预测,到2025年,机器人将为消费者机器人产业的140亿美元增长做出贡献。

机器人将接收到在已知或未知位置定位特定房间,建筑物或个人的任务。

然后,机器人将结合新颖的语言和视觉处理功能来导航环境,询问方向,请求打开门或按下电梯按钮并达到其目标。

研究人员正在开发高级软件,以赋予机器人“常识性知识”,使其能够以人类直觉来理解物体和环境,从而使其能够识别导航惯例。

例如,机器人会将语音陈述和肢体手势都纳入其导航过程。

名为Hosh的自主机器人将在环境中导航并与人互动。顶部照片中显示的是机器人的计算机显示屏,其中包括地图,摄像机视图和其他操作软件。

底部通过机器人的计算机视觉显示了研究人员Jeffrey Mark Siskind(左),Thomas Ilyevsky(中)和Jared Johansen(右)。

Ilyevsky说:“机器人需要人类的直觉才能理解导航惯例。” “这就是常识知识的来源。机器人应该知道奇数房间和偶数房间在走廊中彼此对置,或者317房间应该在建筑物的三楼。”

为了开发机器人的常识知识,研究将开发集成的自然语言处理和计算机视觉软件。

通常,自然语言处理将使机器人能够与人交流,而计算机视觉软件将使机器人能够导航其环境。但是,研究人员正在改进该软件,以便在机器人移动时相互告知。

“机器人需要在视觉环境中理解语言,并在语言环境中理解视觉,” Siskind说。“例如,在定位特定人员时,机器人可能会以评论或肢体手势接收信息,并且必须在其导航目标范围内理解两者。”

例如,如果响应为“检查房间300中的那个人”,则机器人将需要在视觉环境中处理该语句,并确定其当前位于哪个房间以及到达房间300的最佳路线。

响应是带有物理提示的“那个人在那儿”,机器人将需要将视觉提示与陈述的含义相结合,以识别人A。

约翰森说:“与人类互动是人工智能领域尚未解决的问题。” “对于这个项目,我们正在尝试帮助机器人理解它可能会遇到的某些约定,或者期望十几个不同的响应都具有相同的含义。”

Siskind说:“我们希望这项技术真的非常庞大,因为自动驾驶机器人和自动驾驶汽车的产业正在变得非常庞大。”

“这项技术可以应用于自动驾驶汽车,就像人类驾驶员一样,允许汽车询问方向或乘客要求特定的目的地。”

研究人员希望随着技术的进步,将机器人送往越来越复杂的自主任务中。首先,机器人将学会在单层室内进行导航。

然后,要搬到其他楼层和建筑物,它将要求人们操作电梯或为其打开门。研究人员希望在春季进行户外任务。