来源:21世纪经济报道
南方财经全媒体记者梅道凤 广州报道
《头号玩家》是一部由史蒂文·斯皮尔伯格执导的科幻冒险电影,讲述了在虚拟现实游戏中寻找巨额财富和控制权的故事。
电影中的算法师是那些拥有高超计算机技术和编程能力的玩家,与虚拟现实游戏中的其他玩家一同竞争和探寻彩蛋,寻找隐藏在其中的财富和控制权。算法师不仅能够迅速解开各种密码和难题,还能够在游戏中用自己的技术和智谋穿梭于虚拟世界和现实世界之间。
在那个由人工智能主宰的未来世界中,算法师是最受尊敬的职业之一。他们不但可以开发出智能系统,还能够用精密的数据分析和模型优化解决各种实际问题。
去年,全国首批“琶洲领军算法师”诞生了。“琶洲领军算法师”中,博士学位有3人,硕士学位有5人,学士学位有2人。首批算法师毕业于北京大学、中国科技大学、浙江大学、武汉大学、新加坡南洋理工大学、美国伊利诺伊大学等国内外知名高校。2人任CEO职务,8人任技术高管。兼任高校校外专业导师有3人。拥有发明专利的有5人。2人曾获得国际奖项荣誉,4人获国家奖项荣誉,1人获省级奖项荣誉。
这些算法师,不断攻坚技术难题,他们深知自己所处的信息领域变化快速,每天都有新技术诞生,而要保持在领先地位,必须不断更加深入的学习和思考,算法师不仅需要拥有过硬的技术能力,更要有创新思维和不懈探索的精神。
在第二届广州·琶洲算法大赛启动之际,我们邀请了6大算法师,聆听作为“头号玩家”的他们与算法的故事,以及他们对当下风靡全球的ChatGPT的看法。
01 唯品会算法总监 严晓华
借助AI,人类可以做有创造力和更有价值的事情
我来自唯品会,是一家总部在广州的互联网公司,主打的是“精选品牌+深度折扣+限时抢购”的特卖模式。我的团队主要研究的是电商搜索业务中相关的算法问题。
简单来说,每当用户在唯品会网站或者App 通过“搜索”功能寻找他们想买的商品时,我们通过算法来给予用户良好的导购体验,并确保搜索的结果是符合用户搜索意图以及个人偏好的。
从技术层面来说,这些算法通常是基于一些“神经网络模型”。因为在当今海量数据的时代,这类模型具备的优秀的数据拟合能力以及通用性,让它们能够在各个业务场景发挥巨大的作用。尤其是在电商场景中,神经网络模型是实现“千人千面”的商品搜索与推荐的关键所在。
以电商搜索这个场景为例,每一次用户的搜索都会经历多个算法模块:搜索词自动补全 suggest模型、Query理解、召回模型、相关性模型和排序模型。拿“Query 理解”模块举例,用户发起搜索后,通常我们需要理解相应的搜索词,才能更好地返回合理的结果。这里就涉及到如何通过“自然语言处理”相关算法去理解搜索词背后的语义。例如,当用户搜索“新款苹果”时,我们需要理解这里“苹果”的含义更有可能是“苹果手机”,而不是一种水果。“自然语言处理”相关的算法,原理上与现在很火的ChatGPT也是相通的。
我个人对ChatGPT以及背后的生成式AI技术持比较乐观的态度。首先从技术层面来说,ChatGPT 给我的冲击非常大,因为我(甚至包括很多人工智能专业的博士)曾经认为我们距离ChatGPT这样高水平的能够基于自然语言交互的AI系统仍然很遥远。ChatGPT是一种技术层面的跃进式发展,也是OpenAI长期坚持的“大模型”发展路线的理想主义式的胜利。从社会发展与应用层面来说,我认为ChatGPT可能将提前数十年让AI真正开始深刻地渗透进所有人的日常生活之中,并在未来持续为社会带来各种变革。具体来说,短期它将作为一个强大的生产力工具,将人类从很多机械性的重复工作中解放出来。想象一下,你将拥有一个AI助手,它了解世界上的所有通用知识,也能够针对具体的细分任务适应性地学习并掌握任务所需的技能。你能够向它发送自然语言的指令,让其帮助你完成各种各样的任务,比如知识的搜索与问答、内容(文本、图片、视频、代码、甚至音乐)的生成与制作等等。对于人类来说,我们需要做的可能是尽快去适应它和学习使用它,让这个工具真正为个人与社会创造的巨大的价值。
当然,很多人也会担心他们的工作会被 ChatGPT 取代。我认为在有限的范围内确实是有可能的,因为最终使用AI高质量地完成某些特定工作的成本可能会被降得很低。但从积极的方面来看,AI 也将能够解放人类去追求更有创造力和更有价值的事情。举个例子,当自动取款机被发明的时候,人们说这是银行柜员的终结,但实际上并没有。现在银行柜员可以使用各种工具处理更复杂的事情,甚至有时候需要自己编写一些代码,而他们的工作效率可能是过去的10倍。
从另外一方面来说,ChatGPT确实给人类带来了巨大法律和伦理道德方面的挑战。它来得太快了,目前政府或者说相关法规基本上没有做好准备,因此如果无法确保 ChatGPT以及类似技术的安全性(例如,它们可能会成为坏人作恶的工具),那么我们确实会承担很大的技术给社会带来伤害的风险。
02 创优科技算法高级工程师 乔世吉
面对市场波动,要不要用模型解决值得商榷
琶洲算法大赛作为具有影响力的赛事,吸引了来自各地的优秀算法人才。非常期待看到各地的优秀人才能在同一舞台上展示自己的算法能力,交流经验和技术,探讨未来科技的发展方向。
名创优品作为一家新消费企业,一直非常重视供应链领域的技术发展以及应用。我所在的算法组深度参与其中的部分环节。
在此我要分享的故事与其中的销量预测有关。
在门店运营中,商品尤其是畅销商品是否齐全是影响消费者购物的核心因素之一,库存的数量又是影响门店成本的因素之一,而销量预测与补货刚好是连通商品是否齐全与库存数量控制的关键环节。举个简单的例子,预测商品销量偏小,那么很有可能造成门店商品缺货,导致消费者无法买到想要的商品;反之如果预测偏大,则会造成补货过多库存积压,运行成本增加且无法及时更新库存。因此,做好销量预测是优化供应链的关键点之一。
在算法领域,类似销量预测这类问题我们通常叫做时间序列问题,这类问题涉及多领域,比较难预测。为了更好地解决时间序列问题,各个领域的公司都投入了大量的人力物力去研究这类问题,一些知名的企业还为此设置大量的奖金举办比赛征集优秀的时间序列问题解决方案。
美国房地产信息查询网站zillow和俄罗斯联邦储蓄银行Sberbank在几年前举办过房价预测的比赛,二者比赛的具体场景、奖金设置、数据处理、评分方式等方面不同。场景方面,zillow是美国房地产市场,Sberbank是俄罗斯房地产市场;奖金分别是100万美元vs2.5万美元;数据处理方面,zillow按照时间严格划分建模使用的训练数据与测试数据,Sberbank则随机划分数据(导致数据泄露);评分方式上,zillow的得分依据对未来预测的准确性,Sberbank则是测试数据的准确性。两者对比,zillow更加科学的设置了比赛细节,并且严格避免了选手利用数据漏洞投机取巧。然而结果却令人意外,Sberbank从比赛中得出结论:房地产市场波动难以用模型预测,但却在2021年赚了140亿美金;反观zillow,从比赛中得到了“好的模型”,并以此为基础建立纯模型决策的房地产公司,结果在2021年亏损120亿美金。
类似问题在工作中经常遇到,在实际应用中某个问题是不是可以预测?要不要用模型解决?需要反复思考和实验。琶洲算法大赛恰好为广大从业人员以及在校师生提供了真实的应用场景,也为来自各地的优秀人才提供了展示的舞台。
03 技象科技总工程师 温文坤
ChatGPT加持下,算法师更具创造力而非取代
我觉得算法设计是一种创造性工作,对问题的理解越深刻,越能设计出更优化的算法。所以算法至少需要两种深刻经验和一种创造力。
两种经验分别是对算法工具本身的深刻经验和对问题本身的深刻理解。两种深刻的经验加上算法师创造性的设计,就能创造出优秀的算法。
几乎每一个算法师都经历过对问题从表象到本质逐步深入探究的过程。这个过程一般很漫长,不是每个人都能坚持下去,但越能坚持到后面的,越能成为优秀的算法师。从我国移动通信的崛起过程也可以看到这个规律:从开始的百家争鸣,到现在鹤立鸡群。这过程中很多工程师只能去做山寨机,也有些最终成长为国际上具有竞争力的算法师。
ChatGPT的出现,把对问题的深刻理解的要求转化成对问题本质的洞见的要求。因此,很多人担忧,算法师是否会被AI替代。我认为在ChatGPT的加持下,算法师将会有更大的创造力,而不是被取代。
因为人和AI最大的区别在于,我们有“心”、有创造力——至少目前还没有被证明AI有着同样的能力。AI能够轻松具备两项深刻的经验——工具和问题的理解,但缺少创造力。创造力是对问题而言,而问题是针对人类社会的问题。现在物联网行业就处于这个问题深入的过程——从10年前认为把物连起来就行,到现在发掘物之“灵”,我们不仅仅把物连起来,还在改变这物的应用方法。比如,以前水电表只是作为资源使用计费的计量器,现在还可以作为用户行为及生产能力的计量器。因此,我们在发掘问题解决方法的同时,也在发掘问题自身的价值。
广州技象科技有限公司成立于2018年,是中国电子科技集团有限公司科技成果转化和混合所有制改革的科技企业。
技象科技聚焦物联网底层关键技术,研发100%自主知识产权的TPUNB物联专网,是从物理层做到应用层的全栈式针对物联网应用场景的通信系统,系统架构包括物联网芯片“象芯 1 号”、通信模组、基站及网关,支持定制开发,灵活部署,和国外主流技术相比有着性能更优、自主可控、安全可靠的优势。可完全替代低功耗广域网络(LPWAN)领域的国外垄断的技术。
公司进行前瞻性“数字新基建”战略部署,上下游产业生态不断完善,为智慧城市、智慧能源、工业物联网、节能环保等民生重点领域,提供自主可控、安全可信的窄带物联网智能感知技术,已在全国十几个省市落地应用,客户包括政府、电网、世界 500 强企业,为诸多国民经济支柱性行业数字转型提供支撑性技术,促进各行业高质量发展。
04 云蝶科技CTO 余澜
大数据将赋能普通用户,实现技术平权
广州云蝶科技是碧桂园集团在数字科技领域的重要布局,打造了以大数据和人工智能驱动的OMO教学平台等软硬件产品,在基础教育和职业教育领域形成了各备特色的解决方案。云蝶科技研究的算法主要涵盖分类、聚类、关联分析、协同过滤、强化学习及迁移学习等,主要聚焦核心教学、教研数据的价值挖掘和应用。
在算法研究和产品研发过程中,发生了不少有趣的事情。某个教育大数据项目校优秀学生高考后的一次产品访谈的回答,尤其让我们印象深刻。当我们研发团队问到,“在多年的学习经历中,让你感到收获最大的是什么?”学生的回答并不是在学校学习的知识点,而是提到教育大数据产品让他第一次能够量化回溯了每次考试,从中透视了自己的思维过程,比如说自己对于考试时间的策略分配是否合理、陷阱题中该有的审题动作是否完备、复杂题解题思路从哪一步开始走偏。并不是纯粹地刷题和变成考试机器,而是能更高效、准确地去挖掘自己的学习和思维过程。同样来自教育技术国内专家的评价:这可能是这一二十年内,第一次做到真正的教育大数据。
对于最近风靡全球的ChatGPT, 我个人是非常兴奋和期待的。接触机器学习和人工智能以来,虽然在很多领域有不错的应用效果,但是就像教授Andrew Ng说的那样,感觉像是“tricks of math”。当深度学习诞生和应用之后,尤其是当年Alpha GO在围棋上实现的突破,第一次感觉好像我们隐隐约约看到了真正的AI。这一轮的ChatGPT触及的是人类智慧的载体:语言信息和知识逻辑,波及面将涉及几乎各个行业,因为每个行业都脱离不开语言——人类智慧发展过程中与动物最大的区别。而这次大语言模型突破智力天花板的方式之一就是简单暴力地堆参数,这和人脑神经元之间简单高效的连接方式不谋而合,谁知道意识和真智慧会不会出现“硅基世界”呢。这也是通往探索世界三大问题“我们是谁”的一条路,即使过程可能需要有监管和规范,但是无法阻挡这一波AI浪潮的来袭。未来的AI世界,如果形象比喻的话,在资金和技术实力雄厚的寡头技术公司推动下,会诞生一个个全知全能的“大贤者”,从文本、图像到音乐创作,以赋能普通用户的形式实现技术平权。那在各个细分领域或者专有数据就会出现一个个“大贤者”的分身,对这些具体领域会更加熟悉,更高效、准确地和用户交流沟通。这也是众多创业者和中小企业更容易发力的地方。总之,未来的世界会很有趣,也很有幸能生活在这样快速变化的时代。
05 探途网络技术总监 刘建平
算法助于提能增效,避免绕圈
广州探途网络最近一年主要在研究智能短视频广告投放算法、AI模特算法两个方面的算法。
智能短视频广告投放算法是基于B端用户投放的历史数据训练深度学习模型,对B端用户的短视频投放计划做智能推荐,智能复投,亏损预警,算法已沉淀到“巨好投”SAAS产品,该产品已应用于公司内部所有的短视频投放场景和十余家B端客户的短视频投放,为客户节约大量投放资金成本和时间成本;
AI模特算法是基于Stable Diffusion训练Lora模型,为服装类商品智能生成AI数字人模特穿搭的效果,节约行业成本,已应用于孵化和合作的新消费品牌,展示于各大电商平台的商品列表和详情页,节约了模特拍摄、后期处理的时间和金钱成本,让产品在电商平台的上架时间从一个月缩短为两周。
在我看起来,算法是一个工具,作用对象是数据。在经济社会中,算法有助于提能增效,之前需要绕圈多次收集数据,现在只需要转一圈,后台数据就出来了,优化的方案也推出来了。除此之外,算法也能帮忙做好未来的统筹规划,比如探途网络的选品和组货,之前只能靠运营的经验完成,现在只需童工算法对运营数据做分析,就可以做到自动智能组货和选品,形成智能采购计划。
06 药师帮技术部算法组组长 黄俊钧
算法是一种实现多赢的工具和手段
我个人入职药师帮后,主导多个推荐算法项目、优化项目,并且建立和完善了各个维度的画像数据。
我认为,对用户来说,算法可以帮用户更快地找到心仪的商品;对于供应商来说,算法是提升工作效率的利器;对于公司来说,算法能够加强加快用户触达,从而带来更多GMV( 即商品交易总额) 的提升;算法能够帮助不同的主体达成目标。
数据、算法、算力是数字经济和人工智能产业的核心要素。数据是一座待挖掘的矿,算力是“挖多少”的速度问题,算法解决“怎么挖”的方式问题。这三个要素是相辅相成的,现在国家大力发展“东数西算”,背后看也是基于三者的内在逻辑。算法产业的升级迭代将会推动数字经济和人工智能的发展,起到加速器的作用。
算法是助推器,算法是一种实现多赢的工具和手段。将来,算法会逐渐成为我们工作生活中不可或缺的角色,帮我们更好地提升和实现自身的价值。
(作者:梅道凤)