首页 >  DAO的研究 >  正文
百度文心一言潜藏风险,AI视频素材来源不明,创作者或陷版权风暴
发布日期:2023-03-27

百度文心一言潜藏风险,AI视频素材来源不明,创作者或陷版权风暴作者:IT时报

记者 :孙妍 编辑:钱立富  孙妍

3月16日,李彦宏携百度文心一言亮相,并宣布开放邀请测试。

虽然文心一言的能力受到了质疑,但毋庸置疑的是,百度是全球第一个挑战ChatGPT的大厂。李彦宏也已经预见,文心一言在与ChatGPT正面比较时会令大众失望,但百度认为,文心一言有两大优势:一是,画图、写长文、文字转视频等多模态生态能力是ChatGPT所不具备的;二是,文心一言具备中文理解能力优势。

但是,百度自诩的优势也许会成为文心一言所面临的大问题。近日,有网友在对百度文心一言AI作画功能进行大量测试后产生怀疑,认为其可能只是一个套壳的AI模型,先将用户的中文指令翻译成英文,然后用国外开源的AI模型生成作品。百度方面针对此回应表示,文心一言完全是百度自研的大语言模型,文生图能力来自文心跨模态大模型ERNIE-ViLG。

不过《IT时报》记者发现,百度低调向百家号入驻作者开放的AI图文转视频功能存在版权风险:百度视频素材来源不明。但这一风险被转嫁至媒体及其他百家号作者,若被告侵权,作者将承担巨大的版权风险。截至发稿,百度没有对文心一言版权问题进行回复。

百度即将在今天(3月27日)上线文心一言云服务,届时,AI写作、AI作图、AI文字生成视频等功能都有可能对外开放,这些危险的AI生成作品,也许会把百度席卷至版权风暴之中。

AI视频潜藏版权风险

《IT时报》记者实测比较百度文心一言和微软必应ChatGPT后发现,文心一言在文学创作、商业文案创作、数理推算方面仍有较大的追赶空间。但正如李彦宏所言,百度文心一言的优势在中文理解和多模态生成能力。

李彦宏表示,文心一言目前版本已经能生成文字、图片和语音。生成视频因为成本比较高,还没有对所有用户开放,未来百度会逐步接入。但熟悉百家号创作的用户,不少都已经体验过这个功能,每天有几万篇文章通过这个能力转成视频内容在百度平台分发。

但是,巨大的版权风险正潜藏在这每天几万条根据文字自动生成的视频中。

百度AI文字转视频功能早在2022年3月就已在百家号低调上线,百家号作者鲜少第一时间发现,是因为这一功能是在发布文章时默认勾选。在默认勾选状态下,百度AI会自动根据文字内容寻找合适的视频素材,生成视频后并自动发布,其中文章配图只占10%以内的占比,其他视频素材均来自百度视频库。

这是属于文心一言AIGC(人工智能自主生成内容)的TTV(文本内容情感化分析)功能。危险的是,百度并未公开其AI视频素材来源。多位百家号工作人员向《IT时报》记者表示,的确存在版权风险,至于其视频素材来源,一部分由百度进行版权采买,一部分是公开CC0(放弃版权)素材,建议不发到百度站外,或关闭该功能。

目前,这些AI视频主要自动发布在百家号及百度好看视频平台,但可以下载。“如果在百度平台内,可能由百度来处理版权纠纷,但目前还没了解到有什么版权侵权的案例。”百度百家号工作人员向《IT时报》记者透露。

但在社交平台上,多名百家号作者表示,AI根据其文章自动生成的视频被投诉侵权,其账号信用分被扣至0分而被封禁。还有百家号作者表示,AI自动生成视频中疑似含有版权水印。

《IT时报》记者发现,百度AI视频库里还有不少电视台等媒体拍摄视频,但无处查询视频素材出处。

百家号只在图文转视频的相关权益说明中提到,“如果您是原创视频作者,那么您发布的图文为原创时,转出的视频会自动声明该视频为原创视频,并且视频的阅读收益归您所有。”

截至发稿,百度没有对文心一言AI视频来源等问题做出回复。

风险转嫁至作者

更不合理的是,百度可以无偿使用百家号作者上传的内容,又将版权风险转嫁给百家号作者。

百家号在平台服务协议9.7条中提到:“您使用百家号平台服务上传、发布或传输内容即代表了您有权且同意在全世界范围内,永久性地、不可撤销地、免费地授予百度及其关联方对该内容的存储、使用、发布、复制、修改、改编、出版、翻译、据以创作衍生作品、传播、表演和展示等权利;将内容的全部或部分编入其他任何形式的作品、媒体、技术中的权利;对您的上传、发布的内容进行商业开发的权利……以及再授权给其他第三方以上述方式使用的权利。

据此协议理解,百度有权使用百家号A作者上传的文字、图片、视频等内容,编入B作者的作品中,甚至用于商业用途,完全不需要得到A作者的授权,也不需要付费给A作者。

《IT时报》记者查询抖音及其他新闻媒体平台与作者签订的协议发现,并没有存在如百度百家号这般不合理的条款。

上海大邦律师事务所高级合伙人、知识产权律师游云庭解读认为,如果上述条款有效,那百度就可以使用这些视频素材,不构成侵权也无须支付对价,如果该条款被法院认定为无效,则百度对外使用就构成侵权。

而当该条款遇上AI生成内容,潜藏的版权风险将对百家号作者更加不利。游云庭认为,文字内容是媒体创作的,百度只是提供了技术服务,因为AI生成的视频是无权享受著作权的,所以知识产权应该归媒体所有。媒体发布的视频,对外应该由媒体承担责任,如果权利人起诉媒体就是媒体承担责任,如果权利人起诉双方共同侵权,则构成连带侵权责任。

“由百度提供模型,素材库按照百度的合同规则使用的情况下,发生侵权可能责任是百度的。这当中任何一个节点发生变化,可能就是使用者的责任或者共同责任。这里面变量很多,要看具体细节。判断依据是人工智能生成品是不是侵权,模型数据提供者和使用者有没有过错等。”上海段和段律师事务所合伙人刘春泉认为,人工智能生成品有没有版权?与责任风险由谁承担?应该按照权利义务相一致原则来处理。纯粹人工智能生成品与动物按快门拍照片和大象画画一样没有版权。但是人利用AI作为工具制作的产品,符合法律规定的构成作品,可以受保护。

制作1条AI视频最低9.99元

《IT时报》记者发现,百度已经在进行文心一言的商业化尝试,而上述AI文字转视频的服务正是文心一言云服务的主要盈利点。

目前,百度大脑智能创作平台推出了两种会员套餐,视频创作会员1698元/月,智能写作会员198元/月。其中,视频创作会员的权益就包括每月50次图文转视频等。此外,图文转视频200条的报价是1998元,50条的报价是698元,20条的报价是298元,也就是说,1条图文转视频的价格最低是9.99元

“目前不管是API还是线上售卖的套餐,我们都没接入素材库。”百度云客户经理没有正面回答文字转视频素材来源的问题,但就AI生成图片的版权问题回复表示:“AI生成内容的可版权性在法律上仍处于不确定状态,百度不限制您将生成图片用于商业用途,但您应确保自身使用行为的合法合规性,在享有生成图片使用权益的同时,自行承担使用生成图片的一切后果。

截至3月27日,百度大脑智能创作平台显示,其自动创作文章已超200万篇,自动创作短视频已超15万条。

风口上的百度急了

“现在百度最卷的部门已经不是自动驾驶了,而是文心一言。”一位百度自动驾驶部门的员工说道。

基于20多年搜索业务的积累,百度建立起世界上最大的知识图谱,包含50亿实体、5500亿级事实,每天调用量超过400亿次。受益于百度知识图谱,文心大模型也成为全球首个知识增强千亿级大模型。研究表明,数据达到千亿级,大模型就可能发生“智能涌现”,但最快跑出ChatGPT的为什么不是百度?

过去10年,百度在AI领域投入超1100亿元的研发费用,2019年就推出了文心大模型ERNIE 1.0。论起步时间,文心一言并不比ChatGPT晚,但论专注度,百度没有OpenAI聚焦。此前百度之前一直将最大的精力投向了自动驾驶,以及一系列的AI风口追逐,当初希壤也让百度争得了国内元宇宙“头号玩家”等名号。

百度的主要收入还是搜索广告,这也是百度为什么着急做文心一言的原因之一。”一位百度昆仑芯的员工认为。

ChatGPT焦虑已经是业内的常态。

国内ChatGPT模型跟OpenAI的差距到底在哪里?“算法上还有细节要打磨,其次,高质量的文本数据还需要多积累。”一家研发GPT模型公司CEO对《IT时报》记者道出了多数国内ChatGPT从业者的现实和心态,“类ChatGPT的产品可能有版权上的顾虑,但先把技术用起来,以后再想办法更好地规范。

不过,也有一家国内AI大厂的相关人士对《IT时报》记者表示,目前已跑出AI作图等ChatGPT大模型,但是主要考虑到版权等风险,没有快速上线。

AI版权风暴即将来袭

最近,网易旗下轻博客社区LOFTER上的大量创作者删档销号,退出平台,用行动抵制AI作画。起因是网易LOFTER上线AI作画功能“老福鸽画画机”,部分创作者认为该功能可能用到原创作者的画作,有侵犯版权之嫌。

对此,网易LOFTER强调“该功能训练集来自于开源,没有使用LOFTER用户的作品数据,并明确注明不得用于商业用途”。3月16日,网易LOFTER官微向创作者发出一份公开致歉信,为伤害了很多创作者而表达歉意。该AI作画功能已于3月8日下线,网易LOFTER单独设立的“AI内容冒充原创”反侵权投诉渠道,截至3月25日收到1148条举报投诉。

在国外,AI侵权问题已经引起社会关注。近日,《华尔街日报》等多家国外主流新闻媒体指控OpenAI及其聊天机器人模型ChatGPT未经许可使用新闻来源进行训练,并拒绝向媒体支付相关费用。

早在2022年,一名程序员起诉GitHub、微软和OpenAI,指控GitHub Copilot的AI编程工具抄袭代码。今年1月,一群艺术家起诉AI绘画Stability AI Ltd.、Midjourney Inc.和DeviantArt Inc.,声称这些公司下载并使用了数十亿张受版权保护的图像,但没有获得艺术家的授权并对其进行补偿。

一场AIGC的版权风暴正在来袭。

2月15日,爱奇艺宣布将全面接入百度文心一言,双方将共同探索AIGC在内容搜索、内容宣发、内容创作工具、小说创作等业务上的应用。近期,文心一言开发的AI文档写作助手也将上线百度文库,作者只要输入主题及内容要求,AI写作助手就能帮助搜集资料、搭建框架、填充内容、理顺文档、制造亮点,最终生成范文。

李彦宏认为,多模态生成能力是ChatGPT不具备的能力,这是文心一言的优势。但是,百度一旦开放AI写作、AI作图、AI文字生成视频等,受到的版权类指控并不会比ChatGPT少。训练数据是否得到授权,AI生成作品是否涉嫌侵权等问题会接踵而至。

关于AI生成内容的版权问题正在业内掀起大讨论。

知识产权界绝大多数专家都认为,AI生成内容是不受版权保护的。中国社会科学院知识产权中心主任李明德认为,《著作权法》只保护人的作品,AI生成的内容不是作品,没有版权。只有个人使用存在免责情况,公司拿媒体的作品去训练AI,但没有拿到媒体的授权,就构成侵权,文字三四行就能构成作品,视频每一帧都是作品。

排版/ 季嘉颖

来源/《IT时报》公众号vittimes