的卢深视科技户磊高交会演讲：从深度感知到三维识别|高交会_新浪财经

北京的卢深视科技有限公司创始人兼CEO户磊

　　新浪财经讯 “第二十届高交会-中国高新技术论坛”于2018年11月14日-16日在深圳举行，本次论坛的主题为“坚持新发展理念、推动高质量发展”，北京的卢深视科技有限公司创始人兼CEO户磊出席配套会议“未来科技峰会”并演讲。

　　日常生活中，我们比较熟悉的是图象的感知，不管是一般图象的拍摄还是视频的拍摄，而户磊提到了三维视觉产业跟图象有层次的类比，分为三个层次，第一个层次是三维感知，第二个层次是三维重建，第三个层次是三维世界形成完整的还原。

　　以下为演讲实录：

　　户磊：三维视觉是蛮学术的概念，简单讲就是人的感知能力，感知是一个非常重要的，我们构成一套完整系统的重要的方面，感知、决策、显示、展示，三维视觉是非常直接的感知方式。相比较而言，大家比较熟悉的是图象的感知，不管是一般图象的拍摄还是视频的拍摄，我们认为三维视觉产业跟图象有层次的类比，让大家更容易了解，图象的话，可以分三个层次，第一个层次叫成像，物理世界到图象的识别。其实还有一个层次叫SP（图象处理）原始的图象有很多噪声，信息也很丰富很冗余的图象，许多经过图象处理的层次，把它定成人眼看起来真实的世界，其实这几十年的图象产业的发展使得我们的价格越来低，能力越来强，越来越小型化，手机拍照的能力已经取代了单反的能力了。再加上互联网等等一系列的应用走入千家万户，使得互联网出现了大量的图象，现在的图象各个方面都是非常重要的基础，整个产业发展经历了很长的变化。

　　三维视觉也可以分为三个层次，首先是深度感知，一般来讲，我们的二维成像是XY成像的捕捉。三维的信息感知才构成了完整的三维信息感知，这个层次我们称之为三维感知，通过结构光或者是类似雷达的方式，我都是获取产品当中的深度信息形成深度图象，在深度感知之上，我们还有第二个层次，我们认为是三维重建的层次。这是在单一视角固定的点上获取的具体信息，它不是完整的物体三维形状或者一个三维世界完整的还原，我需要多信息融合，形成不管是人、人体、场景、物体完整的重建，对于三维世界形成完整的还原，这是三维重建层要做的事情，在此之上我们催生出三维的各种各样的应用，不管催生、测量、识别、交互都是三维正套可以支撑的应用。

　　有这么一个维度给大家一个概念，还是从感知能力上面讲的，感知能力可以分为几个等级，分米级、厘米级、毫米级、亚毫米级，分泌级的包括室外场景重建，低精度SLAM无人驾驶，低精度物体分割。厘米级是活体检测、物体分割、体感动作识别、基本手势跟踪、SLAM、室内场景重建。毫米级感知能力是能支撑更精细或更好的应用，包括人脸表情识别、人体重建与精准测量，包括中小物体精准重建测量，利用到AR和VR的当中，如果我的感知能力是亚毫米的话，我可以把人脸的皱纹和衣服的褶皱都能精准的还原出来，还可以利用到精度制造、缺陷检测等领域。如果能做到每一个不同的感知能力，可以支撑的应用。在非常基础的应用之上，他们交织在一起，再与其他的感知传感器结合在一起，就能支撑产业的变革。

　　三维视觉技术栈，比较经典的包括像苹果上的结构光，ToF也是这样，这个表格其实内容比较多，我就不一一细讲了，简单来说，近距离的高精度，结构光是一个选择或者是必然的选择，苹果10是具有非常里程碑性质的深入的设备或者应用。远距离的稳定的精度ToF是更好的路线

　　在当前的感知路线当中没有哪个更好或者哪个能100%覆盖其他技术的方向，在如何选择深度感知传感器或者是构造一个深度感知传感器，就是要谈应用的，脱离应用就很难谈覆盖的传感器。我们当前落地的是三维是绝对人的积累和技术应用，包括人脸、人体，对整个精度要求会更高，对产品距离本身要求没有那么高，现在我们首选的深度感知方面，我们现在也在结构光感知这块。

　　我们自己本身可以达到很高的一个精度，同时具备了非常长的产品化的能力，包括实时动态深度纠正和自动标点，在FPGA、ARM等技术的实现。这是重建，为什么要做重建呢？本质上我们需要融合多视角的深度。这也是关于三维重建维度的看法，可以分为场景、刚性物体重建、人体重建、人脸重建，柔性物体等，衣服的这种可以无穷变化的，这个呈现的难度，目前在结构方面也很难解决这个问题。

　　这是一个大概的精度的比较，这边是我们的三维人脸的精度，现在是世界领先的水准，我们积累的三维人脸的数据在二维重建三维的领域上面，我们本身也得到了很多的益处，也能得到很高的精度。这块是给大家带来的一些演示，一些视频，这是一个脸谱换脸的模型，中间最重要的东西是会做一个人脸的重建，不是通过简单的拟合做脸谱的贴合，因此可以贴合的非常的精细。

　　这是人体的重建动作捕捉，主要强调的是动作捕捉，右边其实是做的比较丑，因为我们不是做动画出身的，就是粗糙随意的一个化身模型，左边就是人的动作如何迁移到右边的模型上去，这些都是基础的能力，基于这些可以服务于不同的行业。

　　我们自己当前主要的应用还是应用在三维人脸识别上面，也也是我们当前落地的主要应用，在人脸识别或者人的身份管控领域，当前基于人脸识别还是面临三个问题，准确率不足，安全性无法全面保障，对于照片视频3D面具攻击难以保障。

　　新浪声明：所有会议实录均为现场速记整理，未经演讲者审阅，新浪网登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

责任编辑：谢长杉

文章关键词：高交会科技峰会

我要反馈

相关专题： 2018中国高新技术论坛专题