首页 >  Web3案例 >  正文
国足夺冠、马斯克进厂……AI绘画大模型补齐最后短板 从此“有图未必有真相”?
发布日期:2023-03-31

国足夺冠、马斯克进厂……AI绘画大模型补齐最后短板 从此“有图未必有真相”?来源:《科创板日报》

编辑 邱思雨

近期,一张国足夺冠的图片在各大社交媒体平台走红。

国足夺冠、马斯克进厂……AI绘画大模型补齐最后短板 从此“有图未必有真相”?

图中,在卡塔尔世界杯上,中国国家足球队欢呼雀跃,在绿茵场上捧起了大力神杯。与国足夺冠同步走红的,还有马斯克穿越苏联工厂、爱因斯坦在音乐节狂欢等等“神图”。

国足夺冠、马斯克进厂……AI绘画大模型补齐最后短板 从此“有图未必有真相”?国足夺冠、马斯克进厂……AI绘画大模型补齐最后短板 从此“有图未必有真相”?国足夺冠、马斯克进厂……AI绘画大模型补齐最后短板 从此“有图未必有真相”?

图片细节饱满,足以以假乱真。但从现实考量,不难猜出,这些神图均出自AI之手。

生成这些图片的AI绘画大模型就是Midjourney。与GPT-4迭代的节奏同步,Midjourney上周也推出了最新第五代版本,修复了很多此前AI绘画模型的“BUG”,生成图片的逼真度大幅提升。

由于图片太过真实而引发了争议,叠加大量新用户的涌入“挤爆”了服务器,Midjourney于本周二宣布关闭了其免费账户的使用通道。

但不可否认的是,在AI绘画领域,Midjourney已超越了DALL-E、Stable Diffusion,成为了“当红炸子鸡”。

已实现盈利 生成图片曾获艺术大赛金奖

Midjourney是一个小型的、自筹资金的独立研究实验室,专注于设计、人工智能等领域,目前全职员工仅有11人。

国足夺冠、马斯克进厂……AI绘画大模型补齐最后短板 从此“有图未必有真相”?

Midjourney发起人为Leap Motion公司的创始人David Holz,背后顾问包括前AMD首席架构师、知名硅谷工程师Jim Keller,Github的CEO Nat Friedmaan等一众大佬。

在2022年7月12日,Midjourney正式向公众开放了Open Beta版本,任何人都通过调用它们的AI机器人程序来用文字生成图片。

2022年8月份,创始人Holz表示Midjourney已经实现盈利。目前Midjourney的商业模式为面向C端用户的Freemium模式。新用户可以免费生成25张照片,之后按照订阅制收费。月付制为10、30、60美元,或者使用年付制,价格为8、24、48美元/月。只有付费用户才拥有使用Midjourney生成图片的商业版权。

国足夺冠、马斯克进厂……AI绘画大模型补齐最后短板 从此“有图未必有真相”?

据东吴证券测算,假设Discord server用户(约1081万)的5%是付费会员,共54.05万人。若付费用户中选择10美元/月、30美元/月、60美元/月套餐的用户分别占70%(约37.84万)、25%(约13.51万)、5%(约2.7万),则Midjourney目前的收入约为945.9万美元/月,对应1.14亿美元/年。

此外,Midjourney的使用门槛非常低,用户只需要在其官网进入Discord服务器,任选一个新手频道(#newbies),然后在聊天框里输入或者调用“ / imagine”选项,输入任意一句话描绘想要实现画面的文字即可。

输入完成后,Midjourney将自动生成四张图,用户能够选择其中一张继续优化,比如进行变形、更改尺寸、细节优化等操作。

国足夺冠、马斯克进厂……AI绘画大模型补齐最后短板 从此“有图未必有真相”?

在Midjourney正式向公众开放后,2022年8月底,一幅由Midjourney生成的油画与人类艺术家的作品同台竞赛之后,斩获了金奖。

国足夺冠、马斯克进厂……AI绘画大模型补齐最后短板 从此“有图未必有真相”?

该作品名为《太空歌剧院(Théâtre D'opéra Spatial)》,创作者为Jason Allen,是一位几乎没有美术绘画技能的桌面游戏公司的老板。在艺术界引发了巨大争议的同时,这副作品也吸引了大量的公众的关注。

此后,Midjourney更新迭代的速度极快,当年11月推出了第四代版本,添加了更多图片风格;近期,Midjourney V5版本正式更新。

Midjourney V5修复了此前版本以及DALL-E、Stable Diffusion等AI工具尚未完善的“BUG”——画手,且V5版本生成图片的逼真度也大幅提升。

国足夺冠、马斯克进厂……AI绘画大模型补齐最后短板 从此“有图未必有真相”?

图|Midjourney(左)、Stable Diffusion(右上)和DALL-E 2(右下)

同时,Midjourney还能够与ChatGPT配合使用。用户可以向ChatGPT描述图片的初步构想,让其生成具有细节的画面描述,并提取关键词。然后,用户能够将Midjourney的提示句的语法构成告诉ChatGPT,再通过几次训练让ChatGPT记住如何通过输入的关键词来创建Midjourney的命令语法。

此后,只需要复制ChatGPT的指令到Midjourney的命令框里即可生成图片。目前,在电商、设计等领域已有人尝试运用Midjourney和ChatGPT生成产品图、宣传图片等。

东吴证券分析师张良卫认为,模型能力持续优化,可以让AI对生产力提升的实际效果更加显著,优化用户体验。生成式预训练大模型的快速迭代,将推动生产力应用的繁荣发展。

国泰君安亦指出,随着Stable Diffusion,Midjourney等Al绘画工具以及Runway等AI视频工具的不断突破,电商及营销有望成为AIGC率先落地的一大应用场景。AIGC有望赋能电商营销从上架到售后的全产业链,包括产品设计开发、产品介绍、营销文案、智能客服、智能物流等环节。