>科技>>正文

为实现单目镜头3D测距,谷歌AI部门竟调用“假人挑战”视频

原标题:为实现单目镜头3D测距,谷歌AI部门竟调用“假人挑战”视频

人眼通过双目视觉可实现精准的3D测距,即使在周围的人或物不断活动的复杂情况下,效果也足够稳定。市面上的3D传感器也是一样,通常需要搭载不只一颗摄像头,但是用单目摄像头能不能通过平面图像实现准确度较高的3D测距呢?

为了探索这一课题,谷歌的AI科研人员利用YouTube上的大量“假人挑战”视频数据,训练了一款3D建模算法。他们在博客中表示:计算机视觉可通过计算2D图像数据来重建3D立体场景,但很多时候效果不够稳定,周围环境自由移动的时候,容易混淆传统3D重建算法。

混淆的原因是,传统3D重建算法基于三角测量法,也就是说要么就是使用多摄像头阵列(比如谷歌Jump技术),要么场景必须保持静止。现有的三角测量法通常会滤掉移动的物体,将其深度值视为零或错误。

那谷歌AI科研人员用“假人挑战”视频来训练深度学习算法又是为什么呢?原来是因为,这个挑战需要多人参与,每个人都要模仿假人一动不动,然后由摄影师拍下全过程,这个挑战曾经非常火爆,以至于在YouTube上可以搜到大量资源。

通过学习人物静止的视频,深度学习算法可了解到大量的人体姿势和形态数据,从而模拟摄像头和人的移动,并推断搞准确度的3D深度。

这种算法的好处是,可以让你通过单目摄像头捕捉到效果足够好的深度信息,可应用在3D视频、AR、容积摄影等场景。

返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
3d传感器 ar 深度学习算法 jump ai
阅读 ()
投诉
免费获取
今日搜狐热点
今日推荐