首页 >  商业经济 >  正文
英特尔张宇:三要素制约边缘人工智能发展
发布日期:2023-09-07

来源:科技部网站

转自:中国科学报

“如果以攀登高峰比喻边缘人工智能AI)不同阶段发展的话,我们现在还站在山脚,即处于边缘推理阶段。”9月3日,在京举行的2023年中国国际服务贸易交易会专题论坛中国智能产业论坛上,英特尔中国区网络与边缘事业部首席技术官、英特尔高级首席AI工程师张宇说。他表示,即便实现了边缘人工智能发展的下一个目标——边缘训练,也只是站到了半山腰,距离真正站到山顶、实现边缘自主机器学习(AutoML),还有很长的路要走,其间仍要克服多个挑战。

?

张宇 受访者供图

仍面临多重挑战

边缘计算是在靠近物或数据源头的网络边缘侧,融合网络、计算、存储、应用核心能力的开放平台,就近提供边缘智能服务,满足行业数字化在敏捷联接、实时业务、数据优化、应用智能、安全与隐私保护等方面的关键需求。随着边缘端相关需求日益凸显,2016年11月30日,英特尔公司与华为技术有限公司、中国科学院沈阳自动化研究所、中国信息通信研究院等联合倡议成立了边缘计算产业联盟(ECC)。该联盟旨在搭建边缘计算产业合作平台,推动OT和ICT产业开放协作,促进边缘计算产业健康与可持续发展。

很快,随着人工智能技术的快速发展及其向行业的进一步渗透,边缘人工智能成为边缘计算领域重点关注的方向之一。那么,边缘计算和人工智能这两者间的关系是怎样的?边缘计算和边缘人工智能未来的发展目标又是否一致?就此,在接受《中国科学报》专访时,张宇表示,作为一种技术,AI可以赋能包括边缘计算、云计算等在内的多种计算模式。而边缘计算作为其中一种计算模式,可以利用AI、5G等技术,在靠近数据源头的地方给用户提供更加及时、更具有安全性的需求响应。从长期来看,边云融合是边缘计算的最终发展目标。而在此过程中,智能化作为边缘计算的一个重要趋势,在推动最终目标的实现方面扮演着重要角色。

在中国智能产业论坛上发表的主题演讲中,张宇指出,产业界对于连接、智能应用、数据隐私保护等需求的增加,推动了边缘计算尤其是边缘人工智能的发展。不过,当下人工智能在边缘端的应用大多还停留在边缘推理阶段,即行业还是要利用数据中心极大的算力或大量数据训练出一个模型,然后将训练结果推送到前端进行推理操作。在他看来,“这种应用模式最大的局限性是对模型的更新频率有限”。

以自动驾驶为例。自动驾驶企业在车辆出厂前会利用大量数据训练模型,然而这时其所采用的训练数据集跟驾驶人员真正驾驶时所面临的路况以及驾驶场景之间会有差异,造成训练以后模型泛化能力往往有限。这时,最有效的解决办法就是不断在使用过程中根据驾驶人员的驾驶习惯以及所面临的实际路况,对模型进行不断的二次修正,即进行边缘训练。

此外,如何在样本量比较小的情况下进行有效训练,实现有效的模型更新,例如在正常的产线上检测出带有缺陷的样本?在对隐私保护越来越重视的情况下,如何在保护数据隐私的同时创新出一些能够在边缘侧进行模型训练的新技术?这些都是推动边缘人工智能进入第二阶段,即边缘训练时所要解决的问题,而这些问题往往是建设数据中心时不一定需要面对的问题。

然而,即使顺利完成第二阶段,人工智能所潜藏的局限性仍会制约边缘人工智能的发展。

“有时我们和行业专家探讨这一话题时,会开玩笑说,‘当下的人工智能一半是人工,一半是智能。’因为现在的人工智能,不管应用在边缘端,还是应用在数据中心,人都在其中扮演了一个非常重要的角色。”在张宇看来,要实现真正意义上的人工智能,就需要实现自主机器学习,即网络模型感知人的意图,并选取适宜的样本集训练模型,将训练结果推送到训练阶段进行相应操作,甚至根据训练的结果不断更新网络模型,以达到理想的结果。这才是边缘人工智能发展的最终形态。

三方面的突破

“要实现边缘人工智能的最终目标,需要在算力、算法,乃至理论上进一步突破。”张宇说。

他告诉记者,制约边缘人工智能发展的关键要素主要有三个方面。一是算力,即算力要足够,能支撑越来越复杂的网络模型。二是数据,因为要解决问题不能仅只设计一个模型,而是必须不断通过数据训练得到最终的训练结果并付诸实用。三是人工智能核心理论的突破。“这三个方面相辅相成,缺一不可。只有这样,才能到达边缘人工智能的‘山顶’。”

如何面对这一过程中的诸多挑战,并提供相应的解决方案?在张宇看来,这需要产业界的通力合作。

他举例说。作为一家数据公司,英特尔给业界提供的是面向边缘人工智能、网络、数据中心的完整硬件和软件解决方案。尤其在人工智能方面,英特尔提供了从计算、通讯到存储等一系列产品,供开发人员进行选择。

在计算方面,英特尔提供了包括CPU、GPU及各种人工智能芯片等在内的多种产品组合,满足用户对人工智能不同算力的要求。以计算为例,针对人工智能大模型的训练和推理,英特尔在今年7月推出第二代Gaudi深度学习加速器——Habana Gaudi 2。它不仅能提供大量的算力,同时还能提供通讯能力。在近期MLPerf公司针对业界主流大模型的评测中,Gaudi 2成为全球唯二能够提供针对大模型训练极佳性能的产品。“对于大模型训练,往往不能靠单颗芯片单打独斗,而是要靠一个集群。而大集群的性能不仅仅取决于计算能力,同时也取决于通讯能力和存储能力,Gaudi 2处理器则兼顾了这几方面的能力。”张宇说。

此外,在硬件方面,考虑到边缘人工智能在算力、算法复杂性以及数据安全保护等方面的诉求,英特尔采取的策略是,在增强通用处理器的同时,还提供专用的人工智能加速芯片,以满足用户对边缘人工智能算力的要求。

张宇介绍说,今年英特尔还发布了第四代至强可扩展处理器。这款处理器上包含了一系列面向人工智能的技术创新,特别值得一提的是其嵌入了高级矩阵扩展(AMX)技术。该技术可以直接对矩阵计算进行加速,从而使得人工智能的推理和训练能力相比上代提高了10倍。

当问及边缘人工智能何时能到达“山顶”时,张宇坦言,这一时间点很难预测。不过,相比算力和算法上的进步,目前理论上的进展仍然相对较慢,而这正是下一步需要重点突破的地方。

英特尔张宇:三要素制约边缘人工智能发展