图片来源:由无界 AI工具生成
来源:普华永道
近几个月以来,美国人工智能(AI)实验室OpenAI 发布的聊天机器人ChatGPT火爆全网,并带动了相关概念股的上涨。除了资本市场的热炒外,IT领域头部企业也纷纷跟进。各互联网巨头也透露了相关项目的布局和进展。
近年来,人工智能技术的进步迅速,特别是在Natural Language Generation(自然语言生成)领域取得了巨大进步。与此同时,人工智能在内容生成、写作、翻译等多个领域的应用也越来越广泛。AIGC(人工智能生成内容)就是人工智能在内容生成领域的重要应用之一。AIGC可以帮助用户快速生成大量内容,包括文本、图片、视频等多种形式。AIGC的兴起,改变了传统内容生产方式,推动内容生产效率的提高同时也带来了新的安全和法律风险。
普华永道于3月30日举办了AIGC专题网络研讨会,普华永道全球TMT行业主管合伙人周伟然、普华永道中国交易战略及运营合伙人蒋维、普华永道中国首席数据官万彬、普华永道中国交易战略与运营合伙人鲁冰以及普华永道中国交易战略与运营经理亓涛做了深度分享。
研讨会上,普华永道专家就AIGC在应用场景、投资机会等多个方面可能带来的影响,以及如何应对AIGC带来的新风险进行了深入分析和讨论。参会者还通过案例分享和交流,扩展了视野,对AIGC的应用和未来发展有了更深入的理解。
AIGC的典型应用场景
AIGC的应用场景可以按技术角度来看,分为文本、视觉、语音、编码等。
借助ChatGPT最近的火热,文本领域出现了很多的应用场景,比如对话、翻译,或者按照要求进行文本摘要提取,知识问答或写故事、写简历等。从商用角度来看,已出现了很多将GPT模型应用在产品中的例子。
在视觉领域,自2022年下半年,由AI基于文本快速生成图像就非常热门。涉及公司就包括Stable Diffusion、OpenAI的DALL·E 2、Midjourney以及谷歌的Imagen等。这些生成的图片甚至可以达到比较惊艳的艺术性效果。目前这些技术主要被用在图像生成、图像编辑以及分辨率提升等场景,可以节省很多时间并提高效率。
在编码领域,ChatGPT可以编写代码,包括Java、Python、SQL语言等,再比如OpenAI的Codex,Github Copilot,谷歌专门构建AI程序的MakerSuite,华为的CodeArts。这些工具可以帮助开发人员快速生成代码片段,通过自动化编码过程并减少编写代码所需的时间和精力来彻底改变软件开发行业。
AIGC的持续发展将会对任何需要人类创作和人机交互的行业和场景产生影响。这些场景包括高度商业化的媒体、教育、电商、健康、娱乐等领域。除了不同的行业应用场景以外,AIGC在商业模式上也存在两个不同强度和需求的应用模式,在计算机的学习过程中高效的中心化计算有利于提升效率降低成本,而在用户端的人机交互领域同样也需要AIGC拥有分布式的个性化能力,这两种商业场景的不同也会带来类似与to B端(面向企业用户的产品)订阅和to C端(面向终端用户的产品)交互的不同模式。
AIGC潜在的爆发式增长机会
回顾自然语言学习类机器人过去的商业化历程,可以发现,在ChatGPT前虽然技术的进步带来了诸多交互方式的提升,但是除语音交互以外其他领域创造的商业价值乏善可陈。其关键是AI的核心价值在对人类工作效率的提升,而在AI的能力等级不足以支撑复杂任务时,其能增进人类工作效率的商业价值仅仅是一个较低的量级。
不过当ChatGPT出现后,市场对于AIGC进一步替代复杂工作的预期大大提升了。从短期看,普华永道中国交易战略与运营合伙人鲁冰表示,更看好中心化AIGC模型在to B端(面向企业用户的产品)的商业价值。行业情境下的模型会极大地激发商业化内容创作者的创作效率和创作能力,逐步替代初级甚至中级创作者,这就如同几十年前CAE和CAD软件对于工业设计的价值一样。
近期的投资市场上,大家普遍对AIGC在一些偏传统企业的应用上有很多期待。总体趋势上类似当年移动互联网开始盛行的阶段,本质上是使用新的技术手段来赋能和改造原有的业务流程和商业模式,深度服务投资机构的普华永道中国交易战略及运营合伙人蒋维认为,AIGC作为一个未来的基础手段和工具,AIGC+也可能会成为常态,传统企业可以通过应用AIGC技术来进一步在提高效率、降低成本、提高产品、服务质量等方面实现真正的数字化转型。例如AIGC+营销推广和AIGC+客户服务都存在很大的想象空间。
普华永道中国首席数据官万彬认为,AIGC在数据领域未来也会有更多的机会。在数据输入端,将来更多的需求将体现在对优质数据的需求量提升,其次是对于数据的标注完善和清洗完备要求也会提高,从而提升训练数据的质量。因此对于AI服务的上游厂商(即基础数据服务厂商)会是一个发展契机。在数据输出端,考虑到AIGC的输出物可能存在被滥用的风险,如何分辨某一项成果是AI自动生成还是人类创造的,将是一项新的业务机会。
AIGC将带动的投资机会
按照整个价值链来看,AIGC大体可以分成应用层、模型层、基础层,其中基础层又分为框架层、平台层、算力层(云计算、芯片)、安全层等。在应用层,相关的创业以及投资机会将会有很多。
内容创作领域:例如,利用AIGC来自动生成新闻报道等,提高内容的生产效率。
游戏开发领域:例如,利用AIGC来生成游戏角色、游戏场景和画面效果,提高游戏开发的效率和准确性。
电商领域:利用AIGC自动生成商品描述,提供文本、图像及视音频在内的更个性化的广告营销内容,提高销售量和转化率。
教育培训领域:例如,利用AIGC来自动生成教育内容、提供个性化的智能化教学。
科研领域:例如药物研发。谷歌的AlphaFold可以准确预测蛋白质结构的3D模型,并在几乎所有生物学领域加速研究。
来源:翻译自Generative AI:A Creative New World,Sequoia Capital US/Europe网站
从数字基础设施角度来看,AIGC使用的算力和调用的存储都是海量的,但就其输出的特性而言,AIGC还是属于高算力密度的计算类数字基础设施。从AIGC的部署方式上来看,中心化的计算既需要大量的数据访问也需要保持实时的更新,因此未来AIGC的数字基建部署可能还是围绕着一线城市和环一线的传统热数据区域。从结构上来看,AIGC可能会对目前数字基础设施的形态提出更高要求,这也是行业生态发展带来的机会。
AIGC未来发展的瓶颈
综合来讲,AIGC未来发展的瓶颈主要集中在算力、数据和人才三个方面。
在算力方面,ChatGPT使用的A100芯片功率为400w,即使不考虑未来升级,其潜在服务器架构至少会消耗约4kw的服务器耗电,换算到单机柜这个数值就会到达50kw左右。由于目前一线城市标准机柜为6kw左右,即使高功率机柜也只有8-10kw,因此,IDC等数字基础设施将会面临较大的产品结构调整。由于算力密度升级带来了能量密度升级,AIGC支撑的IDC也会需要更大的电力供给能力和更大的能评以获取更大的消纳配额。短期而言,中国AIGC发展的核心问题不仅仅是研发和人才的差距,在硬件上也面临着美国的进口限制,导致构成算力的高功率芯片供给不足。这也反向抑制了国内目前行业研发能力的进步。
在数据方面,首先是数据规模和质量将在垂直领域遇到天花板。数据规模和质量是AI能力的一个重要参数。训练数据的体量越大,质量越高,AI就越“智能”。今后AIGC的能力将深入到各个垂直领域进行发展,这就需要吸收更多行业相关的数据进行训练。目前在数据保护及数据本地化的大背景下,数据孤岛的趋势越来越明显,要做到共享行业数据进行AI模型训练将会有一定困难。因此,未来AI训练的数据规模可能很快碰到天花板。其次是数据合规,AIGC的数据采集方式可能会存在合规风险。例如:有些数据源网站会规定禁止利用爬虫技术爬取数据或禁止将数据商业化使用等。此外,对于AIGC当下的一大担忧是AIGC收集的海量隐私数据如何进行保护。如果个人要求AIGC公司删除其个人数据,AI模型是否可以真的“忘记”已经用于训练的隐私数据?这一点目前的看法是存疑的。
在知识产权方面,AIGC知识产权归属是目前非常有争议的一个话题,争议包括训练数据所有权和产出物所有权两方面。
随着AIGC技术的进步,对于人才的需求也在不断提高。目前,中国AIGC领域的人才短缺问题已经成为行业发展的主要障碍。主要原因有以下四点:
人才培养机制不足。目前中国的高等教育机构,尤其是理工科院校,对于AIGC相关专业的培养还 不够。相关专业的设置和课程体系还需要进一步优化,增加机器学习、深度学习、机器人学等方面的课程,培养更多人工智能专业人才。同时,也需要推进跨学科合作,培养人才的灵活性和创新性。
人才流动性较大。AIGC行业发展迅速,人才需求变化快,但高等教育机构的培养周期较长,难以适应行业的快速变化,导致人才供给难以跟上市场需求。行业企业需不断吸引和调整人才队伍,实现人才的灵活运用。
人才结构不合理。目前AIGC人才主要集中在研发技术岗位,而缺少应用人才和管理人才。实践证明,技术人才和业务人才的结合是推动AIGC应用的关键。需要培养更多人工智能工程师、人工智能专业经理等高级管理人才。
人才薪酬待遇不高。相比海外市场,AIGC行业较难吸引和留住高素质人才,人才流失率较高。提高人才薪酬待遇是吸引人才的关键。
综上,要解决AIGC发展中的人才瓶颈,需要进一步优化人才培养机制,提高人才流动性,合理配置人才结构,并提高人才薪酬待遇。只有打好人才基础,才能真正推动AIGC在中国的大发展。
AIGC领域的投资项目甄别
在AIGC行业投资的尽职调查过程中,普华永道建议关注三个不可忽视的标尺:项目本身的技术实力、技术门槛,商业模型,以及项目的市场竞争力。投资人需要从项目的技术团队、产品方案、技术门槛及限制等方面入手,AIGC模型的准确性也需要关注。
市场规模:对于每一个提升效率为核心的数字产品而言都是最重要的。AIGC在短期内的商业应用主要替代了传统的创作方式,因此其市场价值集中于在原有创作的定价体系下对速度和质量的提升。然而,AIGC能否严格替代传统方式以及可替代性的边界是实现假设的关键。此外,当行业应用产生竞争后,围绕初始AIGC成本的竞争带来的价格下降也是市场规模需面对的问题。
应用的壁垒及技术迭代:包括行业数据、算法、用户数量和监管等方面的壁垒。在技术快速迭代的时期,新兴技术可能不是最终的解决方案,先发优势也可能变成后发优势。
应用技术的成熟度,评估技术商业应用性,同时找到简单直接的最终客户和变现方式是AIGC投资避不开的话题。
再者,不同的行业应用对准确度有不同的衡量指标以及要求,尤其在金融和医疗健康领域会要求很高,这对AIGC产品的商业化都有较大的影响。当然这些准确性的指标相比传统的AI模型来说较难衡量,因此构建合适的准确度衡量指标以及严谨的测试、比对方法非常关键。
同时为了确保技术应用的长期价值,需要考虑多方面的因素。虽然AIGC模型在巨大的数据集上训练,但许多模型都会从网络上抓取信息,这就需要重视数据安全和知识产权保护。此外,技术应用的可持续性也需要各方关注,考虑如何进行维护和更新,以保证其稳定性和有效性。在进行投资决策时,投资方需要充分考虑这些因素,以确保投资能够长期产生收益。
AIGC的数据安全
当前,各种AIGC服务仍存在不成熟的方面,用户在使用过程中会发现各种问题和错误。尝试使用ChatGPT时,用户也可发现它更擅长文科类的话题,对理科类的回答正确率较低。新闻报道也显示,在某些对话场景下,AI会生成奇怪的、甚至违背社会道德常理的对话内容。有用户向ChatGPT提问AIGC的风险是什么,ChatGPT则回答了七个方面:回答不够准确、缺乏创新、违背人类道德观、知识产权风险、基于过时数据生成答案、隐私保护和模型偏见。这些风险大部分与数据安全相关,特别与数据准确性、数据保密性和数据合规性密切相关。
AIGC这类新技术的发展历程与过去每一种新技术的发展历程都具有相似性。各方需要探索应用场景、挖掘技术创新价值,同时理性识别和应对每种技术发展中的风险。由于AIGC的输入和输出都依赖于数据,因此除了传统的信息安全风险外,AIGC的数据安全风险也尤其需要关注。AIGC中的数据安全问题可以借鉴云计算行业中使用的“责任共担模型”概念,在这个模型中,AIGC的各个参与方扮演不同的角色,既有服务使用方,也有服务提供方,甚至有些公司是符合身份既是使用方又是提供方。因此,每个角色所面临的数据安全问题是不同的。
对于服务提供方来说,Responsible AI(负责任的人工智能)是公司努力追求的目标,要以合法合规作为底线,在安全性、可靠性、数据质量、可解释性、无偏见等领域建立良好的内控体系。对于服务使用方来说,最重要的是确保使用AI服务中的各个场景要做好数据安全合规并使其符合法规要求。此外,还可以与专业机构合作以获得高水平的专业支持,为公司提供包括数据安全、系统安全、合规管理、资质认证等一系列的专业服务。这样可以帮助企业在AI服务设计阶段就借助专业机构将最好的管控与合规体系纳入到创新产品中去。
在考虑使用ChatGPT等AIGC工具时,数据安全是一个需要认真考虑的问题。根据相关媒体报道,自从ChatGPT爆火之后,已经有众多金融企业、咨询公司、学术机构因担忧信息泄露、合规、信息可靠性等因素宣布禁止组织内人员在日常工作中使用ChatGPT。近期更是爆出一家韩国知名公司在使用ChatGPT时发生了机密数据泄露事件,涉及设备测量资料、产品良率等机密信息。此外,也已经有欧洲国家个人数据保护局因隐私问题禁止了该国境内使用ChatGPT并对OpenAI展开调查。这些事件都导致公众对ChatGPT的数据安全产生了质疑,并且提醒用户在使用类似ChatGPT服务时需要考虑如何防范数据安全风险。投资者也需要谨慎考虑数据安全对AIGC技术发展及商业化的影响。
© 2023 普华永道版权所有。普华永道系指普华永道在中国的成员机构、普华永道网络和/或其一家或多家成员机构。每家成员机构均为独立的法律实体。详情请见 www.pwc.com/structure。
免责声明:本微信文章中的信息仅供一般参考之用,不可视为详尽说明,亦不构成普华永道的法律、税务或其他专业建议或服务。普华永道各成员机构不对任何主体因使用本文内容而导致的任何损失承担责任。