Tel:153 2100 2012

Email:ceo@lianyun.wang

Beijing Four Sentences of Heng Qu science and technology Co., Ltd.
北京横渠四句科技有限公司
《扩展现实(XR)产业和标准化研究报告》——数据格式、内容生产
来源: | 作者:4SHQ | 发布时间: 82天前 | 2152 次浏览 | 分享到:

,提供了跨设备和平台的手势交互的通用框架和规范,涵盖了手势识别、生成和理解的通用方法,标准清单见表5。

表5 ISO/IEC 30113系列标准清单

标准号

标准名称

ISO/IEC 30113-1:2015

信息技术 用户界面 跨设备和方法的基于手势的界面 第1部分:框架

ISO/IEC 30113-5:2019

信息技术 用户界面 跨设备和方法的基于手势的界面 第5部分:手势界面标记语言(GIML)

ISO/IEC 30113-11:2017

信息技术 跨设备和方法的基于手势的界面 第11部分:通用系统操作的单点手势

ISO/IEC 30113-12:2019

信息技术 用户界面 跨设备和方法的基于手势的界面。第12部分:通用系统操作的多点手势

ISO/IEC 30113-60:2020

信息技术 跨设备和方法的基于手势的界面 第60部分:屏幕阅读器手势的通用指南

ISO/IEC 30113-61:2020

信息技术 跨设备和方法的基于手势的界面 第61部分:屏幕阅读器的单点手势

语音识别方面,全国信标委用户界面分委会(TC28/SC35)制定了智能语音交互GB/T 36464和GB/T 41813系列标准,规定了智能语音交互系统通用功能架构、移动智能语音交互系统的术语定义和系统框架以及要求和测试方法。

《国家新一代人工智能标准体系建设指南》和《国家人工智能产业综合标准化体系建设指南(2024版)》都提出要建设自然语言处理、智能语音、计算机视觉、生物特征识别、人机交互/人机混合增强现实等关键技术标准,推动人工智能技术创新和应用。


3

生成式AI技术

2024年2月,OpenAI发布了文生视频人工智能模型Sora,引起了广泛关注。OpenAI将ChatGPT所用的Transformer算法,与扩散模型相融合,形成了新的底层算法模型DiT,使Sora实现了对语言的深刻理解,在视频生成上表现出了很强的“涌现”能力。

创建丰富和高体验度的虚拟和虚实结合内容与场景,需要投入高昂的人力、物力和时间成本,极大限制了创新速度和规模,是元宇宙发展的关键瓶颈。生成式AI技术将为XR的3D模型、场景、动作和脚本的创建提供前所未有的自由度,让开发者能够专注于用户体验创新,实现高质量XR内容、场景和虚拟世界的快速构建。

此外,XR中的虚拟场景、人物,需要与用户进行有效的实时交互,提供高度定制化的体验感。传统方法只能实现预设式的基本交互功能,而