Tel:153 2100 2012

Email:ceo@lianyun.wang

Beijing Four Sentences of Heng Qu science and technology Co., Ltd.
北京横渠四句科技有限公司
《扩展现实(XR)产业和标准化研究报告》——数据格式、内容生产
来源: | 作者:4SHQ | 发布时间: 82天前 | 2151 次浏览 | 分享到:

未来,高效的球面-平面的投影、高效的片划分、提高并行处理速度、实现用户姿态变化快速响应及视角自适应动态切换等将是未来全景视频编码技术的重要发展方向。

3)自由视点视频编码

自由视点视频实现了3DoF/6DOF观看体验,相较于其他沉浸媒体,其具有低成本制作、应用场景多等优势。面向自由视点视频,ISO/IEC JTC 1/SC 29/WG4工作组制定了沉浸式视频 (MIV) 标准,提供沉浸式、6DOF立体视觉场景的高效编码,可用于虚拟现实 (VR)、增强现实 (AR) 和混合现实 (MR)。MPEG计划基于视觉体积视频编码V3C的框架进行技术集成和扩展。国内AVS虚拟现实标准工作组 VRU于2019年启动了自由视点视频标准制定工作,开展国家标准《信息技术 虚拟现实内容表达 第2部分:视频》标准制定工作,该标准基于超高清视频编码技术进行自由视点视频压缩,在编码端将多视点图和多深度图直接进行拼接,加上辅助的元数据进行2D视频编码,在终端将基于深度图的处理合成虚拟视点的合成。

MPEG MIV 编码器的输入是多组视频,由一组无序的具有任意位姿(源视角)的真实或虚拟摄像机捕获。来自每个源视角的视频集包含了投影几何信息(深度以及可选的占用图)和属性信息(例如纹理、表面法线、材质贴图、反射率、透明度等)。此外,还提供了每个源视角的元数据,例如相机内外参、投影格式、投影平面尺寸和源视频的位深度(几何和属性)。MIV 编码器将基于几何和属性信息生成属性图集和几何图集,以及基于每个源视角的元数据生成描述图集的元数据。通过生成图集将减少视图间冗余,从而降低编码比特率,同时保持呈现给观众的内容质量,以实现实时的沉浸式视频服务。生成的属性和几何图集使用 2D 视频编码器编码为视频比特流,而元数据使用 MIV 标准编码。

更高效的补丁块生成、深度图生成方法、兼容更多的视频编码器、基于率失真优化的联合比特分配、面向全景内容的非同构视图选择、支持更宽的深度动态范围并实现占用误差校正、降低视点切换的延迟等将是未来自由视点视频编码的技术的发展方向。

4)点云编码

3D点云由一系列点的3D坐标和其对应的属性信息(颜色、反射强度、法向量等)组成。ISO/IEC JTC 1/SC29/WG7“MPEG三维图形和触觉编码”工作组基于点云编码的需求,相继发布了基于视频的点云编码(V-PCC)和基于几何的点云编码(G-PCC)AVS工作组成立了点云工作组,发布了点云编码参考软件(PCRM),其是在 3D 空间对点云进行编码处理。DCM工作组也就面向机器智能的点云编码提出了技术需求,计划开展点云编码相关标准工作。