大规模3D数据集ScanNet:让机器人理解真实世界

 行业新闻     |      2021-03-05 00:47
本文摘要:根据:国际计算机视觉和模式识别顶级会议CVPR-2017-7-7-7-7-7-7-7-7-7-76-7-7-7-7-7-7-7-26-26-26-7-26-26-26-26-26-26-26-26-7-7-26-26-26-26-26-26-26-26-26-27-26-26-26-26-26-26-26-26-26-26-2-2-22-22-22-22-2-22-2-2-2-26-222-2-2-2-2-2-2-2-22-2-2-2-222-2-2-2-2-22-22-2

亚博登录官方网站

根据:国际计算机视觉和模式识别顶级会议CVPR-2017-7-7-7-7-7-7-7-7-7-76-7-7-7-7-7-7-7-26-26-26-7-26-26-26-26-26-26-26-26-7-7-26-26-26-26-26-26-26-26-26-27-26-26-26-26-26-26-26-26-26-26-2-2-22-22-22-22-2-22-2-2-2-26-222-2-2-2-2-2-2-2-22-2-2-2-222-2-2-2-2-22-22-2-2-2-2-2-2-2-2-2-2。(公共编号:)记者团也回到夏威夷,向大家报告。会议上,很多优秀的青年学者说明自己的研究和论文,不说明一部分内容。

Angeladai是斯坦福大学的博士生,在CVPR中有Spotlighttalk,主要讲解Scanntt,享受3D室内场景重建信息的大型RGB-D数据集。她最初的想法是推进数据不足的机械学习算法的发展,特别是在3D界面。3D数据包括大小和物体之间的距离等信息。

但是,3D数据不能提供更多,标志也不能进一步提供,现在3D数据不多。Angela期待着ScanNet建立可扩展的数据收集框架。

他们首先要收集3D修复数据,用有效的方法显示数据,收集更多的数据。目前,团队已经收集了大约1500个RGB-D的视频序列,通过iPad收集了特殊深度传感器。然后视频不会上传到传播服务器,自动修复。

然后,视频不会被交给亚马逊MechanicalTurk,这将显示所有的工作。数据显示在等价3D的场景中,绘制椅子、桌子、电脑等物体,理解什么和位置。每个图片一般需要5个人来表示。扣除数据可以作为标准参考,如物体分类。

亚博登录官方网站

ScanNet数据集有助于在3D数据中训练算法。例如,在房间里移动机器人时,必须识别房间里有什么对象,不仅要识别远处有什么对象,还要确认这个对象是什么。Angela和团队在现实数据中实现了一些场景解读的基准测试。

因为现在有数的大型3D数据集,所以和现实世界收集的3D数据相当不同。一般来说,如果通过制作数据库来训练算法,算法作为现实数据的话效果会太好。因为计算机没有自学现实世界的数据特征。

现实中有很多噪音,很难仔细观察一个对象的所有特征。标准测试指出,计算机在现实数据中的培训效果远胜于制作数据中的培训效果。现实数据今后没有更大的市场需求。

Angela以前还在研究3D修复,开发了动态的3D修复系统,但是在实践中很难使用,因为缺乏对场景的语义解释。在某个场景中,人们不期待告诉物体在哪个方向,是什么,有虚拟世界助手和聊天机器人一样的东西,协助场景的交流。

这也是她开发新数据集的原因。此外,除了显示任务外,他们还希望在场景中修复任务。

此外,在语义解读方面还要做很多工作。但是,他们现在的任务是解决问题的物体识别。3D场景数据未来没有更有趣的应用。安吉拉对将真实世界的数据与准备的CAD模型相结合感兴趣。

亚博网页版登陆

这样做的一个好处是,制作数据更容易获得,操作者更容易。如果制作数据与现实数据有联系,则可以使模型训练的系统更容易输入现实数据。

当然,更重要的任务是向3D数据表现语义说明,不利于机器人更好地解读世界。关于ScanNet的论文,这里是iTunes。

版权文章允许禁止发布。下一篇文章发表了注意事项。


本文关键词:大规模,数据,集,ScanNet,让,机器人,理解,真实,亚博网页版登陆

本文来源:亚博网页版登陆-www.cwmnidrwg.com