当前位置
首页 > 新闻中心 > 行业动态
人工智能3D感知技术的未来
2020-02-27

为了赋予机器感知三维世界的“眼睛”,早在上世纪70年代,工业界便开始应用激光雷达、结构光、ToF(飞行时间)等3D感知技术,用于测量、扫描物体,以提高生产效率。

初期的自动驾驶汽车,则大量应用激光雷达作为传感设备,提升对环境的感知能力。

相较于结构光,ToF支持的工作距离更长,适用于更加多元化的场景,同时占用空间更小,更易集成进小型化的终端设备。

在未来一段时间内,这两种感知技术都将共存,且因不同使用场景需求,在不同行业领域中长期发展。

但是,硬件只是基础,如同人们的双眼,只是让我们具备了捕捉立体图像信息的能力,真正理解万物和人类之间的各类交互行为,依靠的还是我们大脑的学习能力。

3D感知硬件从工业界走向大众,消费者对这项技术自然也会抱有更高的期待,因此要具备更加通用的场景感知能力。

 

对于机器来说,能学习这些能力的“大脑”,就是人工智能AI)技术。

如今,AI3D这两大革命性的技术,正在产生绝妙的化学反应。

很快,在AI+3D技术的加持下,仅通过智能手机等小型终端设备,就能做到很多以往需要专业硬件设备才能够实现的事情,并因此让这些事情变得更加简单,成本更低,让众多的应用场景从不可能变成可能。

AI+3D,很有希望成为掀起新10年行业变革的一项感知技术。

尽管结构光、ToF等技术在过去几年间已经不断小型化,但受限于图像处理算法的瓶颈,机器的3D感知能力,并未被充分挖掘。

这就为机器开创了学习理解三维世界的全新方法,诸如更加精细地识别场景中人和物的相互关系,快速重建人脸、人体和物体的三维模型,快速测量各种物体的三维信息,赋予机械臂感知物体的立体型态,更高效率跟踪人体关键点和动作……

可以说,AI技术能够在相同的硬件能力上,更快速地实现更好的效果,相应地,它也能够弥补硬件能力的不足,在相对较低成本的硬件上达到媲美高端硬件带来的效果。

随着3D感知硬件的广泛普及,AI3D的有效结合就将非常重要,两者将密不可分:

首先,AI+3D可以进一步优化感知效果,提升用户体验。以动作捕捉为例,结合对深度信息的高效处理,能够整体提升肢体关键点的稳定性、准确性以及运动的稳定性和自然度,精准呈现人在三维空间中的动作姿态变化;第二,AI+3D可以更加高效地应用和处理深度信息,理解环境中人物间的相互关系。例如为自动驾驶提供车外的人、车、物的识别和距离感知,或为增强现实应用带来逼真的虚拟元素遮挡、旋转、碰撞效果,又在智能手机等轻量级设备上完成高精度的3D模型建模;第三,AI+3D可以更加精准地分割图像中的主体和背景。特别是在主体和背景颜色比较相近的情况下,得益于对深度信息的快速处理,在分割效果上就能够比2D感知技术有很大的提升,可提供不同人物之间的语义信息,亦可结合3D相机系统带来更逼近单反的摄影效果;第四,深度信息与红外图像的结合,可以让3D感知适用于更多的场景,使之不受环境光线的影响,在暗态场景下依然能感知这个世界。

目前,科技已经将AI技术广泛地应用于3D感知的各个领域,开发了基于ToF3D感知硬件的技术与产品,包括人脸与人体3D重建、物体重建、3D全身关键点跟踪、3D Avatar驱动工具、AR测量、AR场景互动、AR导航、3D人脸认证、3D摄影等等。

AI+3D,开创应用场景的更多可能

2020年,想象一下人工智能三维感知技术的未来

如果说,随着人工智能的急速发展

然之后,在未来10年里面,人工智能+3D将使机器更加深远地感知和理解我们的三维世界,并重新定义我们的生活、娱乐和工作方式。

赋予机器感知三维世界的“眼睛”/人类具有感知三维环境的内在能力。这是因为我们可以用两只眼睛捕捉图像,通过大脑处理形成三维视觉,从而识别物体的形状、他人的行为,感知彼此之间的距离,巧妙大自然地与三维世界互动。

人类也在不断尝试赋予机器和我们那样的3D感知能力,这样机器就可以“理解”我们所做的动作,并给出相应的反馈,或者让机器知道“它们四周有什么”,甚至可以描述它们。

例如,通过身体感控制屏幕之上的游戏人物,你可以在家里和朋友进行棒球或田径比赛,而不是仅仅坐在沙发之上控制手柄;

你可以通过增强现实(AR)技术将下一代汽车投射到桌面之上,客户可以亲自“开”门,甚至在现场“拆卸”内部结构,并给出简单的修改建议;

让无人机深入森林或洞穴,在前进过程之中绘制四周场景的三维图像,帮助我们探索自然环境;

3D感知技术可以为各行各业带来创新的发展模式,无论是丰富我们的娱乐体验,提高我们的工作效率,方便我们的旅行体验,还是改变我们探索自然的方式

2017年以后,智能手机摄像头系统从单摄像头发展到双摄像头,再到多摄像头和TOF的结合。随着摄像机数量的快速发展,其对人工智能的依赖性将越来越低。只有两者的紧密配合才能给最终用户带来理想的图像体验,这是必不可少的。

同样,越来越多的智能硬件也逐渐具备了3D感知能力。

除了物体重建,我们还可以做“人脸重建”。

消费者不仅可以在面部特征之上体验到比二维美容更为精美的三维美容功能,还可以在不出家门的情况之下巧妙进行虚拟化妆测试,间接观看化妆效果,甚至可以间接体验“三维微塑”来模拟整形效果,为医疗美容行业带来全新的用户体验。

AI+3D开创了一种全新的人机交互方式,可以使智能手机成为人体感知设备,实现准确的表情识别和人体运动关键点的捕获。

因此,玩家不再需要内部体感控制器,因此他们可以巧妙地玩体感游戏。内容创作者可以使自己成为虚拟游戏角色、虚拟主机、虚拟评论员或虚拟教师等三维化身虚拟形象,并通过自己的表情和动作来驱动虚拟形象的相应行为。

这种模拟现实结合的创新互动形式,可以为游戏、直播、文化旅游乃至教育创造全新的发展模式。

 

 

关闭
用手机扫描二维码关闭