Email:ceo@lianyun.wang
二、重点产品
(五)语言大模型产品
揭榜任务:探索以知识为中心的大模型范式,通过上下文编码、动态记忆机制等核心技术,提升语言认知大模型的智慧涌现水平。对标国际先进产品,提升中英双语的语义理解、逻辑推理、代码编程等能力,实现在线知识咨询功能,能够实时融合基于互联网的海量信息。开展大模型推理加速算法研究,提升语言大模型赋能智能产品的部署效率。
预期目标:到2025年,语言大模型在中英文均达到世界先进水平,提升大模型泛化能力,零样本或少样本学习在超过30个基准中达到优异性能。中英双语认知能力全面提升,在模型常识性、专业性、逻辑性、推理能力方面取得重大突破。语言大模型在数字座舱、机器人或语音助手等领域实现应用。
(六)语音大模型产品
揭榜任务:研究具有高通用性和高解释性的通用语音表征理论和方法,突破语音数据依赖性强、领域适应性弱等难题,实现超大规模语音表征训练、语音表征信息解耦合建模等关键技术,支撑语音大模型的泛化性。构建面向多个语种、多个语音任务共享的语音大模型,赋能语音助手、虚拟客服、数字人等智能产品的智能化升级。
预期目标:到2025年,语音大模型达到世界先进水平,覆盖语种超20个,其中汉语、英语、法语等5个以上重点语种的处理效果业界领先,可支撑语音识别、语音合成、声纹识别、情感识别等10个以上语音任务,性能较传统模型实现显著提升。
(七)视觉大模型产品
揭榜任务:研究视觉大模型统一算法底层架构,创新视觉大模型训练路径,构建支持动态视觉理解和生成统一的底层基础模型架构,突破静态向动态视觉大模型的范式升级。视觉大模型能够通过少样本微调解决图像、视频等视觉任务,生成式任务指标达到国际先进水平,解决视觉大模型的高效设计、有效训练、快速推理等关键技术问题。
预期目标:到2025年,训练超过千亿级参数规模的通用视觉大模型,能够通过少样本微调方式解决超过30个视觉基础任务(包括10个以上动态视觉或三维视觉任务)并且表现出色,推理速度达到全球领先,具备在智能终端产品的部署能力。
(八)多模态大模型产品
揭榜任务:研究多源多模态异构数据的表示和对齐方法,实现文本、图像、视频、语音等模态数据间的语义对齐,全面提升多模态大模型性能。研究多模态大模型训练和推理加速方法,构建算法、框架、硬件和并行策略等协同考虑的优化和计算架构,提升万亿级参数多模态模型的工程效率。
预期目标:到2025年,全面提升多模态大模型性能,多模态大模型达到万亿参数,零样本学习下解决15个以上多模态任务,基于主观评价的最终效果和推理速度达到国际先进水平。