迭代当前技术是个坏主意;语义通信可能是答案
这是一篇特邀文章。这里表达的观点仅代表作者本人,不代表IEEE Spectrum或IEEE的立场。
我们仍处于5G推广的早期阶段,其技术演进仍需许多年。但按照传统的10年开发新的无线一代的周期,对6G的研究已经在全力推进。世界各地的一些6G倡议,包括第一个由芬兰奥卢大学领导的6GENESIS,正在为预计在2025或2026年启动的标准化进程铺平道路。
当无线行业在2030年左右部署6G网络时,他们希望迎来一个时代,在这个时代里,不仅是我们的手机,所有的东西都被感知、连接和智能。6G可能包括像 “数字孪生 “这样的创新,作为人、城市和工厂的复制品,像全息图这样更具沉浸感的通信,为用户提供视觉、空间、触觉和其他感官反馈的 “感官互联网”,这只是其中几个例子。
早期6G研究背后的驱动力之一是,这些类型的应用将需要极端的延迟、可靠性和带宽要求–甚至比5G对4G的惊人改进所能满足的要求更高。不幸的是,这导致了6G的愿景只是 “每秒的比特数越多,带宽越大,基站越多越好”。换句话说,无线行业设想的6G是5G的进化–无线网络是更好、更快、更可靠的X个数量级。
目前的共识是,6G将只是5G的渐进式发展。这种单一的关注意味着其他两个层次的通信被忽略了。
无论是从能源足迹还是从网络部署和运营成本的角度来看,这种方法既不可扩展也不可持续。尽管世界各地有多个6G倡议,但目前的共识是,就目前的情况而言,6G将只是5G的一个增量演变。
这并不是说6G将只包括5G中已经出现的技术。例如,对太赫兹波的研究可能会开辟新的频段供使用。开放式RAN可能会使混合和匹配不同供应商的无线电组件更加可行,使网络运营商能够建立高度专业化的定制无线网络。集成传感和通信,顾名思义,将有可能通过将无线信号同时用于两种目的(传感和通信)来进行回收。可重新配置的智能表面是可操纵的表面,可以通过控制反射信号对表面的影响来提高传输信号的性能,以提供更好的传感能力并减少干扰。原生的人工智能和机器学习将允许收音机在飞行中适应不断变化的环境或传输条件。此外,6G将可能包括对网络隐私、可信度、弹性、可持续性等的新要求。
虽然这些都是有趣和令人兴奋的研究领域,但这些通信技术–事实上,我们今天所有的通信系统–仍然从根本上扎根于1948年克劳德-香农在其开创性著作《通信的数学理论》中提到的 “技术问题”,或 “A级问题”。A级问题规定,通信是在一个点上准确或近似地复制在另一个点上选择的信息的过程–换句话说,A点上的信息比特以同样的顺序和正确地到达B点。更多的带宽,更多的基站,等等。
对技术问题的关注–与香农自己的告诫相反–意味着另外两个层面的通信被忽略了。它们是语义问题(B层)和有效性问题(C层)。语义问题涉及到传输的符号如何精确地传达一串比特的预期含义。与技术问题(A级)相比,信息没有任何背景或意义,而重要的是尽可能准确地再现它。有效性问题关注的是接收者推断的意义与传输的预期意义的匹配程度。与A级不同,B级和C级将通信从重构比特的任务(即确保输出等于输入)改变为在设备和网络中诱导 “行为变化 “以完成任务或目标的过程。
使用语义技术将使设备有可能根据上下文线索推断出丢失的数据。
考虑一下视频会议,这是我们许多人在新冠疫情期间变得更加熟悉的东西。在A级通信方案中,视频会议是通过在通话的人之间发送大量的数据来完成的。原始视频帧和音频也必须在源头进行编码,在目的地进行解码,并有纠错技术来修复传输中的任何错误。
包括B级技术将看起来像每个视频通话参与者在当地预测和渲染视频数据的任何缺失部分,如果发生故障或网络打嗝。目前,我们分配了大量的时间、能源和计算资源来确保极高的传输可靠性。但相反,每个参与者的机器–无论它是笔记本电脑、手机还是其他东西–都会根据已经到达的内容推断出缺失的内容,从而 “填补空白”。在更深的层次上,机器将能够以与发送内容相同的意义重建数据,即使它在逐位或逐像素的层面上不一样。做到这一点的机器学习技术已经存在,尽管它们仍然比较新:两个例子是变异自动编码器和生成对抗网络。尤其是后者,由于其开发深度伪造图像的能力,近年来获得了关注。
使用语义、B级技术–例如使设备有可能根据上下文线索推断出缺失的视频数据–也将减少传输数据所需的带宽、数据速率和能源消耗,而不会牺牲可靠性。这是C级,你可以回忆一下,这就是有效性问题。你可以想象一下,通过发送内容提要和书目信息而不是整本书来更有效地传输信息。在这样的比喻中,传输的信息需要更少的带宽和能源消耗。而视频会议只是一个例子。因为我们谈论的是一种不同的通信方式,而不是开发新技术,所以我们可以将这些想法应用于任何类型的通信。
在芬兰的奥卢大学,我是教授,也是智能连接和网络/系统小组的负责人,我们正在研究一个新的研究愿景,叫做VisionX。我们的总体目标是双重的,我们在2020年开始努力实现这一目标。首先,我们想研究如何更好地发现高阶概念或数据的语义表示。其次,我们希望能够将这种理解和知识提炼成设备、基站和机器,以解决各种推理任务,包括但不限于通信、运动规划和控制。
为了释放新一代的无线技术,我们需要从从模式匹配中学习的机器,转向理解和推理数据的能力,以及数据是如何产生的。
如果我们更好地理解语义表征,我们就可以创造出能够在一定程度上 “推理 “它们所发送和接收的信息的设备和通信技术。而不是盲目地来回传送数据–学习数据的统计模式,而没有能力理解正在发送的内容–技术将能够推断出缺失或不正确的知识,并根据它采取行动。这些推理能力将使设备和网络变得更加自主、稳健、有弹性和可持续。它们将能够不断适应和概括不同的任务、环境和通信类型。
我们在VisionX工作的另一个重要部分是从数据中开发新的通信协议,而不是由3GPP–当今手机标准背后的标准机构–开发的手工制作的规则。这种方法将使为通信网络的特定部分定制协议成为可能,使其更加有效和灵活。
简而言之,我们正在超越今天占主导地位的机器学习类型–那些从数据中学习简单的统计关联的机器学习(我们称之为 “系统1 “机器学习,借用心理学家丹尼尔-卡尼曼关于人类认知的有影响力的书《思考,快与慢》中的一个概念)。我们正在开发整合 “系统2 “机器学习的语义交流方法,这些方法能够进行推理。至关重要的是,这也将是构建6G的一个完全不同的基础,而不是目前已经在进行的5G+方法。
也就是说,要使VisionX成为现实,仍有许多巨大的挑战需要解决。一个挑战是如何以及在什么条件下,代理之间的合作通信–包括蜂窝基站、使用手机和笔记本电脑的人、无人机等的总称–出现,以解决一个共同任务?我们还需要能够以某种方式衡量有效的通信和信号,这样我们就可以量化代理是否根据收到的信息采取行动,而不是在做决定时忽略它而选择自己的本地信息。
在机器学习方面,我们需要摆脱从数据的相关性中学习的机器–换句话说,模式匹配–转向理解和推理数据的能力以及数据是如何产生的。机器还需要能够相互交流它们的理解和推理,以便成功地从数据中构建新的通信协议。
此外,为了解决C级(有效性)问题,我们需要确定这种语义通信比A级通信更具有可持续性和效率。虽然语义通信在发送比特方面花费的能量较少–因为需要发送的比特较少,需要的纠错也较少–但机器学习仍然会产生计算成本。就可持续性和资源效率而言,尽管在传输更少的比特方面比香农通信的效率高一个数量级,但语义通信可能会产生计算成本,这需要加以说明。我们的初步研究结果表明,语义通信是如何在具有共享背景的两个代理之间通过相互推理而出现的。我们特别从卡尼曼描述的人类的两种认知模式中得到启发。在第一种模式(系统1语义交流)中,一个代理从数据集中提取所有的概念,将它们传达给另一个代理。在第二种模式(系统2语义沟通)中,一个代理只向第二个代理传达最少量和最有效的概念,然后它使用自己的推理来推断所传达的内容。我们发现,与系统1相比,系统2的方法导致了更有效和可靠的沟通。然而,这项研究只代表了我们仍然需要进行的研究的一小部分。