来源:媒体滚动
转自:中国青年网
近日,北京市推出“新时代首都发展巡礼——科技创新”系列报道,全方位展现十年来北京科技创新的发展进程和生动实践,感受首都北京在与国家战略高度同频共振中所贡献的积极能量。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰作为北京科技创新十年的亲历者,在采访中表示:“人工智能技术和产业发展正进入一个新的临界点。人工智能会在我们能想到的、没想到的方方面面带给人类前所未有的价值。”
清晨7点,王海峰来到了位于海淀区百度科技园的总部办公室。他要在半小时后的技术晨会开始前,用一大早精力最旺盛、思路最敏捷的时间先处理部分工作。王海峰是全球自然语言处理领域最具影响力的国际学术组织ACL首位华人主席,也是首位吴文俊人工智能杰出贡献奖获得者。
大语言模型热度空前,3月16日,他带领的技术团队基于在人工智能技术领域的长期深耕,在国内“大厂”中率先发布了中国自主研发的人工智能大语言模型“文心一言”。“我们看到,大语言模型,开始出现一些人们过去认为人工智能不会具有的能力,例如更强的创作能力、逻辑能力、推理能力甚至情感理解和情感生成能力等等。”王海峰说。
大语言模型到底是如何习得这些近乎人类的智慧的?王海峰对背后的技术原理进行了解密。他介绍,百度研发的知识增强大语言模型是基于文心大模型ERNIE和对话大模型PLATO研制的,从超过万亿的数据和知识中融合学习得到预训练大模型,在此基础上,采用有监督精调、人类反馈的强化学习和提示等技术,并具备知识增强、检索增强和对话增强的技术优势。前三项是大语言模型都会采用的技术,后三项是百度已有技术积累的再创新。其中,基础的“预训练大模型”像博览群书的学生,记住了很多知识,但需要老师来指导如何运用;而“有监督精调”就是老师在教学生,将提炼出来的知识要点、典型范例等教给模型,让它知道该如何符合人类规范、习惯和价值观,去执行相应动作,生成相应内容。
早在2019年,百度就发布文心大模型ERNIE 1.0,经过近4年研发和迭代,文心大模型如今已经形成了产业级知识增强大模型技术体系,包括自然语言处理、视觉、跨模态、生物计算、行业大模型,以及支撑大模型应用的工具平台,蕴含了大量自主创新并且在大规模产业应用中得到验证的技术。
王海峰坦陈,国内大模型应用相比国际最先进水平还略有差距。“我们在今年四月初的应用效果大约相当于一月时的ChatGPT,但这个差距在加速缩小,我们的进步速度非常快。”
搜索引擎、自动驾驶、人工智能……技术创新点燃的爆发性增长,在百度自创立起就不曾离开的中关村热土上不断上演。
作为百度人工智能技术的奠基者和领航人,王海峰也亲身经历着一个个新技术从积蓄力量到奋力起飞的故事。2011年,百度翻译上线,这项基于机器翻译的智能服务很快拥有了大量用户,当时,一向沉稳内敛的王海峰难掩激动地告诉同事:“从事这个领域18年,过去一周收获的用户量比过去18年的总和还多。”
从那时起,在产业应用层面尚处于发展初期的人工智能技术已经初步显现出令人遐想无限的未来。百度也从当时开始,从搜索引擎技术“打天下”,逐步转变为全面布局人工智能技术,在芯片、框架、模型、应用这四个技术层面全面攻坚,并逐渐成为中国人工智能技术和产业的领军企业。
12年后,看到人工智能不断模拟、延伸和拓展人类的智能,王海峰感慨,一个更让人兴奋的技术时代到来了。
已在人工智能领域深耕30年的他意识到,人工智能技术和产业发展正进入一个新的临界点。“人工智能会在我们能想到的、没想到的方方面面带给人类前所未有的价值。”