来源:“车云”(ID:cheyunwang),作者:铁盆
图片来源:由无界版图AI工具生成
ChatGPT 让整个世界沸腾了,每个版本一次。
GPT-3.5已经表现出极强的可用性,虽然答案仍然有各种各样的瑕疵,但是认知和判断已经体现出人一样的“智能”。GPT-4来了,则是应用场景的全面爆发,多模态像一把火,从自然语言烧向图片、视频、结构化信息,开始引发了技术工作者的恐慌。
最后,微软把AI神器GPT-4全面接入Office,人们熟悉的“高端职业技能”在AI面前崩塌。Midjourney最新V5版本的AI绘画传遍了朋友圈,曾经专属于人类的创意和设计也岌岌可危。
整个互联网圈都像打了鸡血,“真是黑魔法,想象力完全还没有打开……”轻芒联合创始人、豌豆荚前CEO王俊煜最近一直在“玩”ChatGPT-4,他激动地跟车云网编辑分享着他的感受。猎豹移动董事长兼CEO傅盛在试用过之后也感慨,“GPT-4非常非常恐怖,是整个世界生产力的变革,一个技术浪潮的来临,先拥抱它!”。
一直在AI领域深耕的出门问问创始人李志飞评价,如果说 GPT3 系列模型给大家证明了 AI 能够在一个模型里做多个任务(也就是所谓通用),GPT-4 在很多任务上已经是人类水平,在很多专业和学术考试上超越 90% 的人类。
要知道,ChatGPT是2022年11月才推出的聊天机器人,以对话的形式与用户进行连续性的交互,但上线2个月后用户数超过1亿,成为增长最为迅猛的互联网产品。
可以说,以ChatGPT 为代表的大模型技术突破,重要性不亚于2016年AlphaGo围棋大赛打败人类的胜役,是人类通向通用人工智能(AGI)道路上迈出的又一步。
01 横空出世,打破一切预期
自ChatGPT横空出世,科技圈大佬对其表现大为震惊并赞誉有加。
微软CEO纳德拉在发布会上直接放话:今天进入人机交互的新时代,重新发明生产力。NVIDIA CEO黄仁勋称, ChatGPT的出现对于AI行业来说,相当于手机领域出现的iPhone ,具有里程碑意义。比尔·盖茨甚至预言:ChatGPT出现的重大历史意义,不亚于PC和互联网诞生。
“ChatGPT之父”阿尔特曼(Sam Altman)则认为,ChatGPT的能力远超他的期待值。他还在社交媒体称,一个全新的摩尔定律可能很快就会出现,即宇宙中的智能数量每18个月翻一番。也有大佬对此感到恐慌,曾是OpenAI的发起者之一的马斯克感慨,“ChatGPT有一种让人毛骨悚然的厉害”。
OpenAI联合创始人兼总裁Greg Brockman最近在公开场合谈到了许多与ChatGPT和人工智能(AI)的话题。与许多人一样,在Brockman的畅想中,未来的通用AI将给人类带来颠覆性的影响。他认为,未来AI更像是一个全天候的助手,它能够“放大”人们的能力,并帮助人类获得新的想法。
跟过去的Siri或者传统搜索引擎相比 ,ChatGPT能够从人类反馈中不断的实现强化学习,这直接改变了人们直接获取信息和输出内容的方式。
“这是我们以前不敢相信的,曾经那么地怀疑通用路线,就等着看鼓吹AGI人的笑话,谁想到其如今所向披靡?”他感慨道,“看看苹果13年就发布的Siri,比深度学习革命黄金十年的历史还要长,但搞到现在Siri才刚刚推出两轮或者三轮的对话能力。”
事实上,不止搜索,所有定向信息产品和服务全部面临被重新审视和洗礼的宿命。
在源码资本李维博士看来,包括聊天、功能对话、文法纠错、机器翻译、文摘、知识问答等等,这些方面的代表作品(Siri、小冰、Gramnarly等)以前曾有的技术护栏一下子被降低了,“真好像大水冲了龙王庙”。
虽然NLP(自然语言处理)中不少产品由于多年的打磨以及用户的惰性,还不至于面临灭顶之灾,有的还可能存续很长时间,但这是通用AI对于传统AI的划时代胜利。
在李维看来,现在来了个ChatGPT降维打击,苹果怎么办?肯定只有拥抱LLM(大语言模型)。亚马逊的风云产品Alexa也是一样,也打磨了好几年了,积累了那么多用户数据。虽然不可能马上被取代,但依然会面临技术上的调整。
在ChatGPT4.0发布之前,还有不少声音质疑,是不是跟元宇宙一样炒概念?但自从4.0推出以后,这样的声音销声匿迹了。
“这次AI浪潮可以称为AI2.0,将会是一个巨大的平台性机会,这个机会将比移动互联网大十倍。而目前被热议的相关产品,只是冰山一角。”创新工场董事长兼CEO李开复在上周的AI趋势分享会如是说,“AI 2.0不仅仅是个高能聊天工具,也不仅仅是图文创作的AIGC生成,ChatGPT、GitHub Copilot 和如今看到的应用都还只是AI 2.0能力的开端。”
在他看来,如果说AI 1.0就像是发明电,AI 2.0就是电网。同时,在AI 2.0时代所有的应用都会被重写一遍,就像在移动互联网时代发生的那样。
其实,多年来一直不断有新技术和创业者企图挑战搜索,风险投资界也一直关注潜在的搜索颠覆者,但搜索地位一直没有改变。但这一次有所不同,微软有备而来。
2月8日,微软公司正式上线搭载了自己投资企业旗下ChatGPT的bing搜索引擎最新版。微软董事长兼CEO萨蒂亚·纳德拉在其个人社交媒体中宣称——Bing和Edge+AI,将带来全新搜索方式。新版Bing不再仅仅只是搜索框,而是以聊天的方式展示用户搜索结果。
战火烧到了自己家里,躺着赚钱的谷歌不得不紧急动员正面迎战。
谷歌CEO桑达尔·皮查伊(Sundar Pichai) 先是在ChatGPT问世两周内拉起“红色警报”,然后时隔3年创始人拉里·佩奇和谢尔盖·布林再度被召回。
今年2月6日,谷歌发布竞争对抗ChatGPT的Bard产品,为谷歌公司内部“code red”优先级项目,原计划于2月8日正式发布,提前两天亮相且CEO亲自发文邀请公众测试。它由大语言模型LaMDA提供支持的全新实验性对话谷歌AI服务,将利用网络信息为用户提供最新、高质量的回复。不同于ChatGPT受限于2021年以前的数据,Bard能基于实时网络数据回复用户并展开对话。
然而,谷歌对ChatGPT的回应在尴尬中开始,因为Bard的回答失误将股价推低了近9%,谷歌母公司Alphabet的市值跌超1000亿美元。
巧合的是,百度也出现了这样的狼狈。
3月16日下午,当李彦宏开始演示提前录制好的与文心一言交互的视频时,百度的港股股价应声下跌了10个点。在上周末亚克力中国企业家论坛的活动中,李彦宏在被媒体的追问下,只好拿“谷歌一开始表现也很差”当挡箭牌。
但是随着后来“文心一言”的大规模试用,拿到邀请码的媒体,包括车云也发现了,“文心一言”还是可以一战的。尤其是对比上一个版本的 ChatGPT 3,在中文信息的全面性和准确性上,甚至有不小的优势。百度的股价随之起舞,李彦宏似乎已经拿到了一张通往AI时代的船票。
“文心一言”的口碑,虽然经历了发布会之后的V型反转。但是随着体验的深入,大家发现它虽然精于提供准确的中文整合信息。但是在逻辑、认知、判断方面的能力止步于此。
ChatGPT-4 相比,“文心一言”更像一个中国教育体系下的学生,更善于提供不会出错的答案,没有向前一步的“智能”。
百度的仓促应对,让外界看出了国内互联网大厂在这一领域的窘境。李彦宏在当天发布会现场坦言,“文心一言对标ChatGPT、甚至是对标GPT-4,门槛是很高的。我自己测试感觉还是有很多不完美的地方。”
正如浙江大学国际联合商学院、数字经济与金融创新研究中心联席主任盘和林担心的那样,国内厂商在布局ChatGPT方面面临着算法优化能力有限、算力成本过高、数据质量不好等问题;同国外厂商相比,百度及相关厂商当前算法成熟度依然有一定的差距。
02 中国创新的经验,正在被挑战
360创始人周鸿祎和搜狐创始人张朝阳在上个月的一个对话中,也聊到了如何追随ChatGPT的机会。周鸿祎直言,“如果企业搭不上ChatGPT这班车,很可能会被淘汰”;而张朝阳则发出警告,ChatGPT的成功是算法的积累,没有能力的公司别跳进去会消耗资源一场空。
事实上,十几年前,谷歌的埃里克·施密特(Eric Schmidt)就预测到了人工智能眼下正在发生的转折。
2011年5月,在一次活动当中,时任谷歌执行董事长的施密特在回答《华尔街日报》有关谷歌搜索结果质量下降的提问的时候,表示谷歌正在不断改进其搜索算法,“我们在做的另一件更具战略性的事情是,我们正试图从基于链接的答案转向基于算法的答案。我们现在有足够的人工智能技术和足够的规模,可以真正计算出正确的答案”。
的确,ChatGPT可以用清晰、简单的句子提供信息,而不仅仅是一串互联网链接;可以用人们容易理解的方式解释概念;甚至可以从头开始产生想法,包括实时生成网页、论文写作、商业计划书、博客主题和旅游度假建议;在许多专业测试中表现出超过绝大多数人类的水平。
随着不断迭代 ,AI自动生成内容不止停留在文字文本层面,在音乐、绘画、语音、图像、视频、游戏等领域,AI参与生成的可能性将大大提高,将变得更加丰富。
据源码资本李维博士分享,一开始内部AI老友热议ChatGPT的时候,大家首先思考的是ChatGPT怎么和搜索技术结合起来,它能颠覆搜索吗?
据他分析,搜索是可追踪的,返回的每条结果都有记录,谈不上信息融合。ChatGPT是不可追踪的,长于信息融合:ChatGPT本质上不存在抄袭的可能性,它给你吐出来的每句话,都是自己消化之后的语言。可见,传统搜索与ChatGPT是两个完全不同的处理方式。
搜索是信息服务之王,拥有非常稳定的商业模式,中外都诞生了巨头(谷歌和百度)。自从Web1.0时代搜索崛起以来,搜索的形态和商业模式二十多年了基本没有改变。
这在北京大学新闻与传播学院教授胡泳看来,谷歌们的防线似乎坚不可摧,然而它有一个潜在的弱点:如果一个竞争对手能够给用户提供答案,而不是那些可能含有答案的网站链接,那么谷歌就遇上了大麻烦。
中国互联网的麻烦显然更大。
和西方巨头相比,中国互联网公司都是在底层技术储备不足的情况下,通过商业模式和产品创新,借力超大规模市场的人口红利实现弯道超车的。无论是前面的阿里腾讯百度,还是后面的滴滴美团小米。都是在中国这个大市场里,快速复制别人技术的同时,实现了商业模式创新层面的超越。
这个创新的上半场大家玩的很6,然而到了创新的下半场。中国公司很难建立苹果和微软那样宽阔的护城河。一旦主营业务的利润被巨大的竞争吞噬,对基础研究和前沿技术的投入就马上会戛然而止。必须把研究和实际业务的增长挂钩才有可能说服管理层和股东继续投入。百度IDL最后实际上融入了Apollo,达摩院和阿里云越来越深地绑定,都是一个道理。
字节跳动和拼多多是2010年代创立的公司,没有其他巨头的包袱,创始人年轻,效率和组织有优势。他们分别在内容分发和电商领域得手之后,百度阿里巴巴和腾讯这样的老巨头基本上放弃了在前沿领域的重投入。百度在2012年之后招徕的一批科学家纷纷离职入局自动驾驶,百度成了中国“自动驾驶”的黄埔军校。
ChatGPT恰恰是一个打破常规的技术,它的创新既有技术的突破,也自带应用场景,它是史上最快获得一亿活跃用户的互联网产品,比裂变的社交网络更快。然后从技术层面来讲,它出现的第一刻就在吞噬海量数据,没有留给任何对手后发先至的机会。Google 尚且气喘吁吁,更何况停留在应用层,靠人效取胜的中国公司?
360创始人周鸿祎做出这样的判断,中国厂商和GPT3.5的差距是18个月,GPT4是24个月,比光刻机的难度小多了。问题是,GPT3.5的公开和GPT4之间本来也就不到半年时间。更新迭代的速度超乎想象。这个局面如果不扭转,中国互联网的方法论有彻底被颠覆的风险。
如前搜狗CEO王小川之前的看法:“OpenAI的成功,首先是技术理想主义的胜利。中国需要自己的OpenAI,就需要技术理想主义。大厂受自己的业务牵引,追逐资本热点的创业公司更动作变形。不止如此,这种理想主义还需要有爱国之心、商业智慧和学术尊重去获得政府支持,推动企业联盟和学术界协同。中国能诞生自己的OpenAI”。
03 没有时代红利,创业者如何破局
数据显示,ChatGPT的总算力消耗约为3640PF-days(用每秒计算一千万亿次,需要计算3640天)。三年前,微软的Azure云服务为ChatGPT提供了一台由超过1万枚英伟达A100 GPU芯片的AI计算集群,为其提供超级AI算力支持。
业内一种公认说法是,1万枚英伟达A100芯片是做好AI大模型的算力门槛。目前我国厂商拥有的GPU主要是英伟达中低性能产品(如英伟达A10),拥有超过1万枚GPU的企业不超过5家,其中,拥有1万枚英伟达A100 GPU的企业至多只有1家。
华为诺亚方舟实验室语音语义首席科学家刘群在“黄大年茶思屋”的讨论中也坦承,中国在技术上还是有差距的。其中一个是基础模型本身的差距,虽然我们训练了很多万亿模型或者是几千亿的模型,但训练的充分程度,是远远不够的。“我估计到现在为止,没有哪个模型能吃GPT那么多数据。”
AI技术几乎每一次迭代都需要外部基础设施作出相应升级改造,但外部相关基建和硬件设施往往难以在短期内有效支持AI相关技术较高的配套诉求。而OpenAI 并不 Open,在公开的论文(其实更像技术报告)中,OpenAI 除了明确GPT-4 模型使用 RLHF 精调外,不会公开任何算法技术细节。
清华大学计算机科学与技术系长聘副教授黄民烈提到,在GPT-3之后,OpenAI所有的模型都没有开源,但它提供了API调用。在这个过程中,它干了一件事,就是建立起了真实的用户调用和模型迭代之间的飞轮,它非常重视真实世界数据的调用,以及这些数据对模型的迭代。当然,在此过程中,它也养活了美国一大帮创业公司,建立了一个生态。
据瑞银分析师蒂莫西·阿库里分析,ChatGPT已导入至少1万颗英伟达高端GPU来训练模型。自2023年以来,英伟达的股价就在一个月内大涨40%,同时让公司CEO黄仁勋(Jensen Huang)的财富增加了51亿美元。根据彭博亿万富翁指数显示,黄仁勋更是成为了迄今为止美国亿万富翁中净资产增幅最大的人。
除了算力、算法,ChatGPT飞速发展也离不开强大的资本推动。
在OpenAI LP成立四个月后,微软就对其进行了10亿美元投资。OpenAI 同年还获得了来自Khosla Ventures、Reid Hoffman Foundation、Matthew Brown Companies的投资。在2023年的融资计划中,微软将再次向OpenAI进行100亿美元投资。
在中文圈的环境中,百度的大模型(文心一言)几乎没有能够比肩的对手。在国内搜索引擎的市场地位上,百度也是一家独大,况且其他搜索平台在AI技术上的积累也很难与百度直接扳手腕。因此可以说在ChatGPT对谷歌潜在的竞争影响上,百度并不存在同等的危机。
错失了移动互联网大机会的百度,早已全力押注AI上,在这方面布局已经持续了六七年的积累。百度过去五年一直在搞自己的深度学习大模型“飞桨“(Paddle Paddle),用自己的通用AI芯片“昆仑芯”训练自己的模型,这些是百度训练自己的“ChatGPT”的基本环境和前提。
尤其是GPT-4发布之后,微软的动作明显快了许多,很快就推出了接入GPT-4的Office产品,而且是全部接入。微软的AI工具Copilot 应用了最新的 GPT-4 技术,能够帮助用户在 Word、Excel、PowerPoint、Outlook 和 Teams 等软件中进行写作、编辑、总结、创作、演示文稿等工作。
ChatGPT的核心技术,就是云端大数据的处理、学习。其高昂的成本也是商业化过程中绕不开的命题,调用ChatGPT的成本和它当下所带来的回报可能并不成正比。有业内人士透露,目前ChatGPT一次模型底座的训练需要500万美元的算力成本,一次问答的综合成本大约为0.8美元,这远非初创公司所能承受。
在a16z投资人看来,对于这样一个新兴行业而言,这着实是一大笔钱,而其中大部分都花在了三巨头上:亚马逊 AWS 、谷歌 GCP 和微软 Azure。这些云服务商每年保持超千亿美元的资本支出,确保他们拥有最全面、最可靠、最具成本竞争力的平台。特别是在生成式AI领域,它们也从供应限制中受益,因为它们可以优先获得稀缺的硬件(如Nvidia A100和H100 GPU)。
中国创业者中,不少大人物都已经蠢蠢欲动。
原美团联合创始人王慧文高调官宣入局AI,公司取名“光年之外”,自掏腰包5000万美元(折合人民币约3.5亿),天使轮的估值达到了2亿美金,并称下轮融资已有顶级VC认购2.3亿美金;3月8日,美团创始人王兴发布朋友圈表示,将参与王慧文创业公司“光年之外”的A轮投资,并出任董事;而王惠文在发布那条“AI英雄帖”时,出门问问的创始人兼CEO李志飞就坐在其对面,李志飞表示自己一定会参与。
早在2月15日,原搜狗CEO王小川就已经通过朋友圈,隐晦的表示自己会下场进入“中国OpenAI”的战争中,有媒体向王小川本人求证是否回归创业做AI大模型时,王小川承认自己在“快速筹备中”;据公开信息,快手前MMU负责人李岩,成立了AI公司“元石科技”,并且已证实公司业务主要是进行多模态大模型的研发;投资大佬李开复也不想错过这次机会,上周末在朋友圈发文宣布,其正在亲自筹组Project Al 2.0,一个致力打造Al 2.0全新平台和Al-first生产力应用的全球化公司。
对小公司来说,这次生成式AI的浪潮背后的确隐藏着巨大的机会。不过,与过往深度学习浪潮不同,由于其更加庞大的模型规模,将参与竞争的门槛明显提高,小公司可能更倾向于直接适用服务而非搭建自己的模型。
a16z投资人与大量生成式AI公司交流发现,应用公司虽然增长十分迅速,但他们仍在为留存率、产品差异化和毛利率挣扎。尽管模型提供商决定了这个市场是否存在,但多数还没达到大型商业化规模的门槛。
李志飞也分享了他的观察, 现在美国讨论最多的是应用落地,他觉得中国很快也会进入这个状态。“甚至有个 VC 说他们接下来准备第一个搞大模型和应用孵化器,我说你这种认知也就领先别人一个星期而已,我比别人也就领先两个星期。感觉再不看论文,再不去自己琢磨,很快就会落后了。我真的觉得很恐怖——集体智慧进化得太快了,一天不看论文都觉得跟不上。"
上一波持续了10多年的移动互联网浪潮,还能重现么?中国创业者从一个细分市场切入,然后冲击十四亿人大市场的财富神话还能复制吗?
在上周末的亚布力中国企业家论坛上,百度创始人李彦宏的答案是肯定的。“回到2007年,大家不会想象今天会有抖音、淘宝、微信,在AI时代、大模型时代也会出现这样现象级的应用,这些应用会是基于大模型开发的。”
然而这里面,会诞生下一批白手起家的王兴、张一鸣、程一笑吗?