基于昇腾AI的“紫东太初”大模型获中国算力大会大奖 - DAO的研究

注册登录

首页 > DAO的研究 > 正文

基于昇腾AI的“紫东太初”大模型获中国算力大会大奖

发布日期：2022-08-01

7月29-31日，首届中国算力大会在济南举行。大会现场，基于昇腾AI基础软硬件平台、由中国科学院自动化研究所联合华为打造的“紫东太初”人工智能基础大模型荣获“DC Tech创新先锋”优秀成果。

基于昇腾AI的“紫东太初”大模型获中国算力大会大奖

“紫东太初”人工智能基础大模型荣获“算力平台”先锋案例

2022中国算力大会是我国算力领域首个大型会议，作为大会发布的重要奖项，“创新先锋”优秀成果评选旨在从设备技术、软硬件系统、成果应用、能效水平、赋能情况、流程优化等多个方面优中选优，充分发挥典型标杆的示范引领作用。

“紫东太初”是全球首个三模态大模型，开拓性实现了图像、文本、语音三个模态数据之间的“统一表示”与“相互生成”，理解和生成能力更接近人类，向通用人工智能迈出了重要一步。紫东太初作为多模态大模型代表作，正在全力助推AI研发规则和产业应用模式变革，加速各行业智能化转型实践。

当下，多模态大模型受产学研用多方关注，原因在于人工智能产业高速发展带来全新研究、应用需求。目前，网络数据90%以上为图像与视频，音频数据也保持高增长，但当下用于预训练的模型大多是以文本、图像为主的单模态或双模态，只能涵盖互联网一小部分数据，不仅与人类多模态交互能力差别很大，也无法充分发挥数据的生产要素作用，限制了下一阶段人工智能应用创新。

因此，推动预训练模型从单模态向多模态方向发展，打通图像、文字、语音壁垒，进而使AI应用更贴合人类行为习惯与现实需求，成为当前人工智能行业攻坚点之一。

中科院自动化所以昇腾AI平台为基础，基于武汉人工智能计算中心算力，研发面向超大规模的高效分布式训练框架，在图、文、音三个基础模型上加入跨模态编码和解码网络，基于昇思MindSpore AI框架，打造了全球首个千亿参数三模态大模型“紫东.太初”，性能领跑业界，可以灵活支撑图、文、音全场景AI应用，更加接近人类真正的感情和思考，灵活性更高，通用性更强。基于紫东太初打造的虚拟人“小初”，具备视频生成、视频描述、图像生成、智能问答、语音识别等多个功能，甚至能在纺织生产线上通过声音就能“听”出纱线断头的质检缺陷。

去年底，国内首个多模态人工智能产业联盟成立，吸引了新华社技术局、长安汽车、中国移动、千博手语等30余个成员单位加盟，通过开源的多模态大模型快速进行自身业务AI融合创新，基于“紫东太初” 陆续孵化出新媒体内容检索平台、智能座舱、南宋御街数字人、手语教考一体机等场景化行业应用，充分展现了人工智能大模型的产业价值。

从“紫东太初”大模型的研发，到产业联盟的组建，AI研发规则和产业应用模式迎来深刻变革，昇腾AI正在加速推动AI产业化和产业AI化，助力中国人工智能抢占智能时代新高地。