Tel:153 2100 2012

Email:ceo@lianyun.wang

Beijing Four Sentences of Heng Qu science and technology Co., Ltd.
北京横渠四句科技有限公司
委员之声 | 公司CEO王连云为“十四五”建言:抓住3D科技重大创新机遇期,解决"卡脖子",啃下“活在三维空间、困于二维信息”的难题
来源:工业和信息化部电子科学技术委员会  www.miitestc.org.cn  | 作者:4SHQ | 发布时间: 1516天前 | 5340 次浏览 | 分享到:

    展望未来,3D摄像头好似给机器或电子设备安装了“人眼”,让其能够根据人的动作做出相应的反应,并赋予“思维”、“感知”的能力。3D摄像头应用方向也非常广泛,包括摄像、游戏、无人机和无人驾驶汽车、增强现实(AR)、康复医疗、安防监控、机器视觉、三维扫描等领域。人类的想象空间有多大,3D摄像头的应用空间就有多大。3D视觉技术被广泛应用到人脸识别、智能机器人、自动驾驶、AR等领域,国内外相关公司推出了一系列产品。OPPO、华为和苹果等公司推出的3D+AI识别功能,通过扫描人脸三维结构完成手机解锁;自动驾驶领域通过分析3D人脸信息,判断司机驾驶时的情绪状态;SLAM方式通过重建周边环境,完成建图与感知;AR领域通过三维重建技术完成目标的重现。

    世界本是三维的,由于科技发展的局限性,不得不用二维的平面来显示世界。基于5G、AI技术的3D传感技术亦将撬动AR/VR、智能家居、无人驾驶等领域,将让“智能+”的构想真实地大规模地落地,带动上下游产业的发展,加速万物互联时代的全面到来,随着5G等高速网络时代的到来,信息的传输也必然从3G向4G/5G过渡,视觉信息也将从二维向三维转变。“活在三维空间、困于二维信息”的难题,将在5G时代得到解决。


(二)搜索+AR进入Web三维时代,构建自主3D数据格式迫在眉睫

     从3D视觉到3D交互,然而,3D技术的发展不会只止步于看到3D图像,它将会打开一种全新的用户交互范式。随着互联网带宽(5G)的增加,文字,图片,平面操作系统为主的二维互联网虚拟世界开始向视频,声音,三维应用系统为主的三维互联网进化。美国著名的second life 就是一个互联网向3D进化的例子,但总体目前互联网3D化进程还比较慢,由于3D图形表示法和使用案例的多样化,定义一个3D图形传输模型极具挑战。因此,与图片和视频对比,由于缺乏简单和通用的高效数据表示法,3D生态系统的发展很慢。

     3D模型数据是3D场景渲染的关键技术,是支撑三维重建、游戏、XR业务基础能力。由于目前业界用于生产3D内容工具平台较多,均采用不同的文件格式存储,导致3D模型数据格式无法统一,有超过70种不同文件格式的3D数据,服务于不同目的和应用案例,3D格式统一化更有利于产业的效率提升.

     目前,在业界由khronos主导的glTF以及苹果主导的USDZ正是基于统一3D文件格式的目标,推动不同3D文件面向实时渲染应用,直接传输给图形API的数据形式,不再需要二次转换。苹果一种新的3D文件格式,并在去年WWDC推出USDZ文件格式以及ARKit 2.0。谷歌宣布将在搜索结果中加入3D模型,在搜索结果中页面,你可以直接点击这个3D模型,然后进入3D模型预览界面,之后可以选择AR模式实景预览,例如在线购物,或者其它娱乐场景。谷歌已经联合NASA、New Balance、三星、沃尔沃、Target等合作,为他们的3D模型提供了支持。从应用层面来看,苹果的USDZ文件格式可以嵌入到任何网页、App中,而谷歌凭借自家搜索引擎,只需添加几行代码即可支持,可以直接在搜索结果页面进行3D AR搜索展示。从当前结果来看,大多数人更多是希望在搜索中获得结果,而在这个过程中,将搜索结果变得有趣就非常重要,3D模型和AR的加入就是非常重要的一环,这直接将以往2D页面互动提升到三维交互。通过定义一个基础,各种应用可以压缩和传输元件,glTF从中起到重要作用。我们非常期待glTF扩展将为广泛使用的3D图形带来高效MPEG压缩技术。