揭榜挂帅 | 工信部组织开展2023年（3D/元宇宙、人形机器人、脑机接口、通用人工智能等）未来产业创新任务揭榜挂帅工作

Tel：153 2100 2012

Email：ceo@lianyun.wang

English 简体中文

Beijing Four Sentences of Heng Qu science and technology Co., Ltd.

北京横渠四句科技有限公司

首页＞需求发布＞揭榜挂帅 | 工信部组织开展2023年（3D/元宇宙、人形机器人、脑机接口、通用人工智能等）未来产业创新任务揭榜挂帅工作

揭榜挂帅 | 工信部组织开展2023年（3D/元宇宙、人形机器人、脑机接口、通用人工智能等）未来产业创新任务揭榜挂帅工作

来源: | 作者:4SHQ | 发布时间: 982天前 | 16815 次浏览 | 🔊 点击朗读正文 ❚❚ ▶ | 分享到:

二、重点产品

（五）语言大模型产品

揭榜任务：探索以知识为中心的大模型范式，通过上下文编码、动态记忆机制等核心技术，提升语言认知大模型的智慧涌现水平。对标国际先进产品，提升中英双语的语义理解、逻辑推理、代码编程等能力，实现在线知识咨询功能，能够实时融合基于互联网的海量信息。开展大模型推理加速算法研究，提升语言大模型赋能智能产品的部署效率。

预期目标：到2025年，语言大模型在中英文均达到世界先进水平，提升大模型泛化能力，零样本或少样本学习在超过30个基准中达到优异性能。中英双语认知能力全面提升，在模型常识性、专业性、逻辑性、推理能力方面取得重大突破。语言大模型在数字座舱、机器人或语音助手等领域实现应用。

（六）语音大模型产品

揭榜任务：研究具有高通用性和高解释性的通用语音表征理论和方法，突破语音数据依赖性强、领域适应性弱等难题，实现超大规模语音表征训练、语音表征信息解耦合建模等关键技术，支撑语音大模型的泛化性。构建面向多个语种、多个语音任务共享的语音大模型，赋能语音助手、虚拟客服、数字人等智能产品的智能化升级。

预期目标：到2025年，语音大模型达到世界先进水平，覆盖语种超20个，其中汉语、英语、法语等5个以上重点语种的处理效果业界领先，可支撑语音识别、语音合成、声纹识别、情感识别等10个以上语音任务，性能较传统模型实现显著提升。

（七）视觉大模型产品

揭榜任务：研究视觉大模型统一算法底层架构，创新视觉大模型训练路径，构建支持动态视觉理解和生成统一的底层基础模型架构，突破静态向动态视觉大模型的范式升级。视觉大模型能够通过少样本微调解决图像、视频等视觉任务，生成式任务指标达到国际先进水平，解决视觉大模型的高效设计、有效训练、快速推理等关键技术问题。

预期目标：到2025年，训练超过千亿级参数规模的通用视觉大模型，能够通过少样本微调方式解决超过30个视觉基础任务（包括10个以上动态视觉或三维视觉任务）并且表现出色，推理速度达到全球领先，具备在智能终端产品的部署能力。

（八）多模态大模型产品

揭榜任务：研究多源多模态异构数据的表示和对齐方法，实现文本、图像、视频、语音等模态数据间的语义对齐，全面提升多模态大模型性能。研究多模态大模型训练和推理加速方法，构建算法、框架、硬件和并行策略等协同考虑的优化和计算架构，提升万亿级参数多模态模型的工程效率。

预期目标：到2025年，全面提升多模态大模型性能，多模态大模型达到万亿参数，零样本学习下解决15个以上多模态任务，基于主观评价的最终效果和推理速度达到国际先进水平。