图说:发布会现场展示“星火”能力 采访对象供图(下同)
“三项能力超过ChatGPT!”
“10月底将整体赶超ChatGPT!”
国内文心一言、日日新、通义千问、盘古等“大模型”争相涌现后,在上周末举行的科大讯飞星火认知大模型成果发布会上,董事长刘庆峰的自信,再次点起人们对通用人工智能的期待。
自去年11月ChatGPT问世以来,认知大模型技术阶跃持续进化,人工智能掀起了全新的热潮。“认知大模型已成为通用人工智能的曙光,我们有信心实现‘智慧涌现’,首先需要一套科学系统的评测体系。”刘庆峰说。
“星火”两字,总会让人联想起它的后一句,而科大讯飞要做的,正是联合开发者推动大模型应用落地,共燃人工智能“燎原之势”的生态。
图说:认知大模型将带来解决人类刚需的全新机遇
三大能力超越ChatGPT
见过那么多大模型,人们已经褪去了初识时的新鲜感。不过,星火的“见面礼”,还是着实惊艳了到场者。
发布会的现场演示环节直接体现了“星火”的七大核心能力,即多风格多任务文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力、多模态输入和表达能力——这是从ChatGPT关注的48个主要任务方向和讯飞开放平台上400多万开发者团队的需求分析中凝练而出的。
图说:“星火”的七大核心能力
“如果有个小伙子和他女朋友吵架了,他应该是宁死不屈,还是能屈能伸?”一道幽默风趣的问题,展现了“星火”的高情商,“星火”答道:这种情况下,这个小伙子应该能屈能伸。
更令人赞叹的,要数“星火”的“学霸”气质,也就是在大模型普遍表现平平的数学领域。“花坛里有三种花,一共88朵,其中月季花的数量是菊花的4倍,牡丹花的数量是菊花的5倍少2朵,那么请问花坛里一共有多少朵牡丹花?”面对这道听着就拗口的数学题,“星火”秒给答案,还展示了解题步骤。
据介绍,当前讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上已超ChatGPT。
刘庆峰也坦言,目前大模型技术还有待攻克的缺陷,比如新知识难以及时更新、事实类问答容易“张冠李戴”,史实、传统典籍等容易“编造情节”等,但这些问题在今年都将得到明显改进。
联合各行业共建“星火”生态
“星火”这个名字,意味悠长。
24年前,中文语音市场被国际巨头控制。六个中科大在校大学生提出“中文语音要做到世界最好”,却被人笑话。这批年轻人在融到第一笔资金之后,就开始了大规模投入研发并整合源头技术创新资源之路,一直走到现在。
“燃烧最亮的火把,要么率先燎原,要么最先熄灭”,时至今日,中文语音的主流市场已由国人抢回70%,这番豪言壮语依旧刻在科大讯飞合肥总部的墙面上。
放眼国内,星火认知大模型并不占先发优势,但在今后的产业对接上,科大讯飞讯飞似乎并不担心。这份底气,也是“星火”给的——通用人工智能需要星火燎原,这也是其一以贯之的生态理念。
在安徽,企业作为产业创新主体的态势基本形成。依托科大讯飞组建的省内首家创新联合体——安徽省智能人机交互创新联合体平台已开放560项人工智能产品及能力,聚集超过400万个开发者团队,总应用数超过164.6万。
讯飞方面介绍,面向全新的人工智能时代机遇,已为认知大模型的“智能涌现”做好了源头核心技术的储备。当前,企业通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系,并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖7大类481个细分任务类型。在科学的评测体系中,推动大模型的发展。
“我们一直认为,人工智能的发展绝不是单个企业和单个科研机构的事情,而是需要大家合作共赢的。”刘庆峰说。他宣布,首批来自36个行业的3000余家企业开发者将接入星火大模型,联合各行业合作伙伴共建大模型“星火”生态。
“星火”还是个“求上进”的大模型,根据公布的三个关键里程碑节点:6月9日,将突破开放式问答、多轮对话能力明显提升、数学能力再升级;8月15日,代码能力升级以及多模态交互能力提升,希望能帮助到更多的合作伙伴及开发者团队;10月24日,将实现通用模型对标ChatGPT,中文超越ChatGPT的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。
新民晚报记者郜阳