采访|冯大刚
撰文|邓咏仪
编辑|杨轩 苏建勋
封面来源|视觉中国
2023年,全世界的关注焦点,都在AI大模型的焦灼竞赛。
中国参赛选手、百度“文心一言”在研发阶段时,百度技术团队曾与ChatGPT进行对比测试,李彦宏对36氪回忆,当时“差距是40分的水平,一个月能追得上。”
可过了一个月,技术团队再次测试后,发现差距反而拉大了——AI大模型的发展速度不是线性的。
紧张追赶之后,到文心一言今年3月16日发布时,甚至“能达到它(ChatGPT)今年1月份的水平。”李彦宏对36氪说。要说文心一言和ChatGPT差距多大?“可能最多是两个月。但这两个月什么时候能追上,才是更重要的问题。”
过去一周,AI领域处于更强烈的疾风骤雨之中。百度文心一言发布会前一天,OpenAI发布了新一代GPT-4大模型;后一天,又有微软发布搭载最新GPT-4的AI助手Copilot——均是震撼业界的产品进展。
百度文心一言随之成为激烈争论的对象。带着人们围绕文心一言的诸多质疑,36氪独家访问了百度创始人兼CEO李彦宏,直接发问:为什么发布会用了Demo而不是实时演示?为什么产品在不甚完美时就发布?
这些质疑折射出国人的复杂情绪:人有我无的焦虑,民族情绪的高涨、期待与失望间的起伏……
在回应质疑之外,36氪在与李彦宏交谈中,印象更加深刻的,是他给出了关于AI行业的许多直接论断。
比如,被问到中国创业公司里会不会再出一个OpenAI?他直接回答“基本不会了”,“没有必要再重新发明一遍轮子。”
比如,“在应用层,将会出现全新的、十倍于现在微信和抖音的创业机遇。”比如“AI将会颠覆云计算市场”。
比如,AI虽然会取代人类工作,但有更多意想之外的机会。一个针对个人的提示是,不会面向AI写提示词(prompt,人与机器进行交互的指令语言)的人会被淘汰。
无论如何,我们正站在一个历史性的时点:基于AI大模型技术,可能开启一个新增长时代。就在两天前,英伟达发布了专用于大模型计算的新GPU,能让大模型处理成本下降一个数量级。“我们正处于AI的iPhone时刻。”英伟达创始人黄仁勋在会上三次激动地强调。
以下为对话全文,经36氪编辑整理:
回应文心一言发布会的所有质疑
36氪:3月16日文心一言发布会之后,网上有非常多的声音,其中有祝福,也有质疑,今天我是代表质疑的声音。首先问一个小问题,今天这样一个突然的采访,会不会让你觉得有压力?
李彦宏:不会。确实像你讲的,3月16日之后,网上有各种各样的声音,我自己也确实有一些话想说。
36氪:有人说你在发布会现场比较紧张,是这样吗?
李彦宏:我真没觉得自己紧张。因为这个东西(指文心一言)是我非常熟悉的,包括那5个演示场景,基本上都是我选的,或者至少是别人给我建议、我认真看过的。
后来我也回看了发布会实况,也没觉得我在任何时候紧张。我猜测,是因为当时在台上,我看不到股价变化,所以没有被它所影响。但是很多在台下的人,包括看直播的人,能够看到一些资本市场的反应,又看不到我们真实产品是什么样子(因为当时还没有发布出来),所以会有此猜测。
36氪:在发布会中,你提到产品还没有准备好。为什么要在还没有完美的情况下发布?
李彦宏:最主要的原因,是因为有市场需求。我们有好多客户都在问,这个东西什么时候出来?我们什么时候能够用?你能不能保证我是第一批试用产品的人?不断有人在问这方面的问题。
目前整个大环境,是ChatGPT非常火,甚至被神话了。大家一定是有焦虑感的,如果我们的客户不能及早地用最先进的产品,他们也会有焦虑感。在这种情况下,我们确实希望尽早把它推出来。
36氪:选择在3月16日开发布会,这个日期是怎么确定的?
李彦宏:一开始我们想的是3月底,其实哪一天我觉得都是可以的。
但我在很早的时候,答应了去参加今年的亚布力论坛,亚布力是3月17日,那时我会见到很多新老朋友,包括政府领导、媒体,大家一定会问(文心一言),那个时候我们还没有发布的话,别人问起来,我真不知道该说什么了——你说得少,大家会觉得你一点信息都不透露,你不拿我当朋友;说得多,我们是上市公司,等于选择性地披露一些东西,也是不行的。
所以想来想去,决定稍微往前赶一点。为了适应3月17日亚布力论坛,就决定3月16日来开发布会。
36氪:所以碰上OpenAI发布新版本,这是偶然。
李彦宏:对,我们事先并不知道OpenAI会在那一天发GPT-4。对于我们来说实际上也没有那么重要。我们自己能看到的可提升的地方已经足够多了,先把这些东西做好就够了。
36氪:发布会现场为什么会用先做好的Demo,而不是实时展示?
李彦宏:我是希望能现场演示的,因为人机对话产品具有极强交互属性,但后来两个因素让我改变了主意。一是生成式AI每次给出的答案不一定一样,会带来不确定性。二是真正说服我的理由,是全球所有类似发布会,没有一个是现场演示的,都是录好的。如果大家都可以,那我们也OK。
36氪:文心一言发布的产品有五个场景,包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成,为什么是这样的五个场景?
李彦宏:这是很好的问题。我们选择的逻辑是这样:文心一言对标ChatGPT,所以大部分ChatGPT有的功能,我们也要有。
但同时,我们毕竟植根于中国,所以,我们的对话型产品,一定要体现我们对于中文、对中国文化更好的理解。我们确实有一些ChatGPT没有的东西,希望在发布会展示给大家。
所以,前三个场景是对标ChatGPT已有的功能,我希望大家能够感受到我们的东西不差。比如第一个例子是,三体的作者是哪里人?我在ChatGPT里面试过很多次,它答的都是错的,每次生成的答案都不一样,有时候说甘肃天水人,有时候说山西吕梁人,答案非常随机。所以,我第一个例子用了那个例子,但是前三个例子的那些能力,大家已经看过了,在ChatGPT里面那些能力都是有的。
第五个例子,是多模态能力的展示。有一个四川话,有一个文生图,一个文生视频,这代表了百度过去十几年在AI上综合能力的积累。
做这五个例子的时候,我给团队提了个要求,我希望产品发出去之后,能让大家玩起来。第一个就是刚才讲的四川话,我们有语音合成的能力,也对中国情况更了解。所以,我希望当用户提问的时候,不管是提什么问题,我们都能够用语音合成,并且能支持用各种各样的方言说出来,不管是四川话还是广东话。我希望大家觉得很有意思,喜欢去玩这些东西。
第二个要求,当用户的问题本身存在事实性错误时,我们能够辨别,比如“二战期间苏联为什么轰炸波兰?”其实苏联没有轰炸波兰,是德国轰炸波兰。我希望文心一言能够辨别用户问题当中是有错误的,并且告诉你说,你刚才说的不对,我告诉你正确答案是什么。
所以当用户有这样的问题,或者故意进行错误引导的时候,如果产品能够辨别,用户会觉得你很聪明。
36氪:有人说这是为调皮的人类而准备的。
李彦宏:能够给大家多带来一些欢乐的话,何乐而不为?
36氪:提及ChatGPT,别人一定会把它跟文心一言对比,你觉得哪个更领先?假如ChatGPT更领先的话,你觉得它领先文心一言几年?
李彦宏:这个问题应该这样说,ChatGPT发布是去年11月30日,我们现在已经发布了,也就是说不可能被领先几年。
但是科学地去评比,文心一言到底是处于去年ChatGPT 11月30日的水平,还是12月30日的水平?这个我们没有特别严谨的方法评测,我们自己可以保留(产品状态),但是ChatGPT当时的状况我们已经保留不了了。
但是我可以给你讲一个我们内部开发的过程。第一版产品出来的时候,我们和当时的ChatGPT做了一个对比,和它大概差40分。
李彦宏:我们的对话式人工智能大语言模型应该具备的各种各样的能力,每一项能力去挑了提示词(prompt)。
36氪:满分是100分,差了40分?
李彦宏:对。当时我们能看到的提升空间远不止40分,所以我们觉得说一个月之内肯定追上它。但是过了一个月,我们又做了一次评测,发现这个差距不仅没有缩小,而且拉大了。
所以我们当时很紧张,说这个东西越做,跟人家差得越远了,但后来发现,其实ChatGPT那种升级不是匀速的升级,虽然提升很快,但是它有自己的发展规律。
而百度这种一版一版的迭代方式,升级速度是非常非常快的。等到我们敢说3月16日开发布会的时候,我们觉得就是至少可以达到它去年11月30日的水平,甚至说按照理性判断的话,应该达到了ChatGPT今年1月份的水平。所以,那个时候我们才敢出去发的。
尤其当你去测试ChatGPT比较擅长的能力(英文、编程等),会发现差距很大,那是因为ChatGPT也发生了很大的变化。我们发布会前一天,OpenAI上了GPT-4,和GPT-3.5也是不一样的。
36氪:可以说,文心一言在两个月后能达到ChatGPT的水平吗?
李彦宏:远远不够,因为人家也在进步。百度进步的速度要比它快,有一天不仅要追上它,还要超过它。
刚才我们讲的文生图能力,百度的能力打磨比较久,大家玩起来挺嗨。GPT4本身没有文生图能力,站在另一个角度比较的话,ChatGPT落后百度,文心一言早就有这个能力了。
早在文心一言发布之前,大家用文心一格(指代百度基于文心大模型的文生图系统)就能体验这个能力,这是我们做得好的地方。ChatGPT发布的时候,大家都说它跨时代、震撼发布等,它发布的理解图片能力,不是文生图,只是输入图片告诉你这个图片是什么。
客观比较下,我们有我们的长处,我们也很有信心在综合能力上,能够迅速追上甚至超过。
刚才我们讲的文生图的能力,百度的能力打磨比较久的时间,我们目前就是大家玩起来挺嗨,但是ChatGPT本身没有文生图的能力,站在另一个角度比较的话,ChatGPT落后百度,文心一言早就有这个能力了。
ChatGPT4发布的时候,大家都说它跨时代震撼发布之类的。其实它发布的所谓理解图片的能力,不是文生图,输入图片告诉你这个图片是什么。我们搜的只是官网上的能力,没有人体验过。
李彦宏:成本比较类似。但是这个东西不重要,重要是我们可以通过端到端的优化,让这个成本迅速下降。
李彦宏:会稍微便宜一点。
李彦宏:这很难划分清楚。例如,我们对于大语言模型的投入算不算在内?可能有些投入是去做了辨别式的东西,比如去优化搜索等等,有些是生成式的。
如果没有那些投入,根本就不可能出现文心一言这个模型。
中国基本不会再出一个OpenAI
李彦宏:人工智能如果按语言模型来分类,一种叫辨别式AI,典型应用是搜索。搜索就是根据你提的需求,看一个个网页跟你的需求匹配不匹配,主要是在辨别;另一种是ChatGPT,也就是生成式AI产品,你提一个提示词,它根据提示词发挥,甚至发挥错了都有可能,这个方向早期并不被大厂看好,积累也没有特别深厚。
在这过程中,其他大厂像Google、亚马逊、Facebook,你说它们重视不重视?现在肯定很重视。想不想做出这么一个东西来?肯定很想。听到这就很容易理解,为什么我会说百度是大厂当中第一个做出来的。
李彦宏:很多人也在问我,中国会不会再出一个OpenAI?基本不会了。OpenAI诞生是因为美国大厂都不看好这个方向,但现在中国的大厂都看好AI大模型,都在做这个方向。创业公司重新做一个ChatGPT其实没有多大意义。
第二,我觉得基于这种大语言模型开发应用机会很大,没有必要再重新发明一遍轮子,有了轮子之后,做汽车、飞机,价值可能比轮子大多了。
李彦宏:其实算力是很笼统的说法,你的CPU怎么样、GPU怎么样,芯片跟框架匹配程度怎么样,框架跟模型的匹配程度,里面可提升的空间都是很大的。
百度在四层架构都有领先的产品。芯片本身不管是摩尔定律,或者GPU的发展速度也非常快,框架也不能叫成熟,我们的工程师还在日以继夜优化框架。
模型更新得就更快了,一天能够上线三次升级,这种速度一定会使效率越来越高。将来制约整个大语言模型发展的很可能不是算力。今天我们看到算力很紧张,将来你可能发现算法突然变了,不是这个算法了,(制约发展的)可能就是另外一套东西。
李彦宏:在应用层。回看移动互联网时代,今天特别成功的微信、抖音、淘宝,都是应用。操作系统其实没几个,一个IOS,一个安卓,仅此而已。很难讲安卓的价值比微信、抖音大。在应用这个层面,机会很多,能够创造的价值也非常大。
李彦宏:我确实听到了这种说法,但我觉得离我们真实的想法差得太远了。
首先我觉得不会颠覆,你用的其实还是百度搜索。当这个能力(文心一言)被赋予到百度搜索上的时候,几乎不会改变你的使用方法。你不需要重新再花很多精力去学百度搜索怎么用,只是答案更精准了,过去篇幅比较小的答案,现在可以更加详实、更加生动、更加活泼,它扩大了搜索的边界。
框架层我多讲两句。百度在全球大厂当中最先做出来是有道理的,我们在芯片层、框架层、模型层、应用层都有自己的布局,全球大厂在这四层上都有领先产品的是没有的。
36氪:可今天我去搜索百度的东西,当中有15个搜索结果,其中有两三个是广告,简单说这是百度的商业模式。未来如果文心一言只给出一个答案,这怎么商业化?
我从来没有觉得商业模式是一个问题。如果我们给大家(不管是个人还是企业)提供了价值,他们就会通过市场机制来回报我们。
李彦宏:Google可以索引几乎所有互联网的内容,但是中国的话每一个APP都有自己的这种独立的生态,也有一定的壁垒。所以用户在获得信息上确实没有那么方便。
李彦宏:联盟也说不上,我觉得美国人的这个思维方式也竞争,比如微软和Google就是竞争。但是它的思维方式是说,如果你已经很领先了,我最好别做一个跟你一样的东西,我如果通过创新做一个跟你不一样的东西来竞争,那才是我的本事。
36氪:文心一言会接入哪些产品,以及对百度的业务矩阵有哪些机会和变化?
李彦宏:这些天我们各个部门也都在开会讨论,文心一言是一个通用能力,它跟各个产品的结合都是很自然的,跟搜索、贴吧、文库、百度健康、小度等等。几乎公司里面每个产品拿出来,包括百度书法,都能自然地想到和它怎么结合,让产品变得用户体验更好,更加powerful。
李彦宏:是的。
36氪:你在财报会上提到,文心一言会是改变云计算的Game Changer,为什么?
今天就会看到,我们完全没有必要基于芯片层、框架层来开发应用——基于大模型就好了,又快,成本又低。
我认为微软其实也是这样想的。大家都知道,ChatGPT和微软的产品真正结合,是非常厉害的。这是很多云厂商非常害怕的事情。
36氪:未来十年内,会不会出现诞生新的微信,新的抖音?
36氪:今天无数人在提问:AI会不会让打工人没有工作?OpenAI的创始人Sam Altman说,大量的人一定会失业,所以OpenAI会按需收费,给没有工作的人补贴。这其实是有点悲凉的,他自己说也有点可怕,你觉得这个事情会发生吗?这个问题你怎么看。
我没有那么悲观,我是乐观的。不管有多少工作被替代,这只是整个图景的一部分,另外一部分是,存在我们现在甚至无法想象的更多新机会。我做一个大胆预测,十年以后,全世界有50%工作会是提示词工程(prompt engineering),不会写提示词(prompt)的人会被淘汰。
百度的使命就是用科技让复杂的世界更简单,这个事情现在成立,十年之后还会成立。
我希望十年之后回望今天,会发现每一个普通人的生活、整个社会会被百度改变。我们起了什么正面作用?我们有什么东西没有做到位?我们什么东西可以做得更好?我更希望琢磨这样的事情。
李彦宏:我觉得不会是这样,我恰恰觉得人是唯一。在如此浩瀚的宇宙,目前没有任何迹象证明有外星人,足见在这个宇宙当中人有多么的独特。今天我们说想用机器替代人,想复刻一个人,我认为这是不现实的。
36氪:十年后,AGI(通用人工智能)是不是已经实现了?
“强人工智能”(Artificial General Intelligence),意思是它和人的能力是一样的。这个词对应的是“弱人工智能”和“超人工智能”。这种划分方法我不是很认可。
智能涌现也好,机器越来越聪明也好,我都很看好,我唯一不觉得我们的努力方向是要把机器变成人,完全没有必要。
李彦宏:技术进步的速度越来越快,生产效率提升会越来越明显,这是过去很多年的发展之中不断证明的。如果过去大家可能一周工作5天,也许10年之后工作3天就足够了。劳动生产率的提升会让人们生活的幸福感更强。
我自己也因为这件事情很兴奋,因为我能够参与其中并且贡献一些东西。
李彦宏:一定更幸福。