4月8日,人工智能大模型技术高峰论坛在杭州萧山开幕。
证券时报·e公司从现场了解到,出席此次活动的嘉宾,不仅包括多位重量级院士嘉宾,华为云人工智能领域首席科学家田奇也现身,并就人工智能发展趋势、盘古大模型的进展及应用等热点话题,在会上进行了分享。
今年以来,人工智能持续在全球升温,在这轮新的人工智能浪潮中,田奇称,人工智能发展,已经从局部探索,走向千行百业。AI正在走进企业核心生产系统,开始创造更大价值;人工智能行业渗透率提速,2026年将达到20%。
在田奇看来,人工智能发展趋势呈现两大特点:首先是从小模型到大模型;其次是人工智能与科学技术的交汇。
据介绍,大模型成为应对AI领域应用碎片化的一种方式。这种方式下,提高了模型泛化能力,减少了对于领域数据标注的依赖和模型微调;模型复杂度(参数个数)持续爆发,不到半年增长了10倍,达到了1750亿。
同时,大模型有可能收编高度定制化的小模型,导致市场向大模型集中。这主要是因为,开发大模型资金门槛高,开发和训练一次,需要1200万美元;技术门槛高,具有对AI框架深度优化和超强的并行计算能力。
另外,大模型正在改变AI产业的规划与格局。比方说,牵引AI产业快速收敛,构建AI产业的底座;汇聚和沉淀行业生态及开发者生态,形成产业生态黏性。
AI在哪些科学计算场景能发挥“尖刀”作用?“工业、气象、能源、生物医学等众多领域,都受到了人工智能的深刻影响。”田奇称,大模型是连接技术生态和商业生态的桥梁,是未来AI生态的核心。
“AI for Industries是人工智能新的爆点”
除了行业的发展趋势,田奇也谈到了盘古大模型的进展和趋势。田奇称,华为盘古大模型正在推动人工智能开发从“作坊式”到“工业化”升级。
据介绍,2019-2021年,华为开始了盘古大模型的立项研发,并在2021年4月份开发出了盘古基础大模型,随后又陆续发布了多个盘古行业大模型系列。譬如,2021年9月份,开发了盘古药物分子大模型;2022年6月,盘古矿山大模型;2022年11月份,盘古气象、海浪、金融OCR等领域大模型发布。
“大模型是AI产业快速发展的必然选择,行业正在从‘大炼模型’转向‘炼大模式’。”田奇称,传统AI时代,不同场景对应不同小模型,一个场景一个模型,模型参数小,泛化性差。大模型时代,大模型吸取海量知识,适配多业场景,多个场景一个模型,模型参数大,泛化性强。
譬如,GPT-2,参数为15亿,到了GPT-3,参数为1750亿。盘古大模式,参数达到了千亿级。Switch Transformer,参数已达到了16000亿。多参数,可以掌握海量知识背后的逻辑,有极高泛化能力;同时,还可以降低研发成本,自监督学习,减少标注数据,解决人工标注成本高,周期长,准确度不高问题。
据介绍,华为盘古大模型,具有优秀的泛化能力,可以充分挖掘数据内的联系,达到更高的泛化性能;高效样本筛选能力,可以海量无标注样本筛选,节省80%以上人力标注代价;小样本/零样本能力,自动化数据增强,数据挖掘算法,实现零训练样本下缺陷样本识别,较传统方法发现率提升2-3倍;低门槛AI开发,提供自动化工作流,自动数据处理,自动化调参,自动化生成模型,减少对AI开发工程师专业依赖。
“AI for Industries(工业人工智能)是人工智能新的爆点,盘古行业大模型正在加速落地,赋能千行百业智能升级。”田奇称。