近日,武汉人工智能研究院推出基个性化AI作图平台——“百变悟空”,只需几张图片训练,就可以实现一图“七十二变”(点击左下方【阅读原文】体验)。
这标志着,继不久前发布AI内容创作平台“江城洛神”后,该院在AIGC领域迎来新进展。
AIGC(利用人工智能技术来生成内容)是一种全新的内容生产方式,具有高质、高效、便利、广泛的优势,逐渐成为新的生产力引擎,AI作画产品也逐渐走向大众的视野。然而,常规的AI作画产品无法基于同一主体生成其在不同场景中的图片,故而衍生出个性化文生图的需求。
为此,武汉人工智能研究院联合昇腾AI,利用昇思MindSpore AI框架与大模型微调组件,打造了个性化AI作画平台“百变悟空”。平台以“悟空”为名,即希望普通用户创作的内容也能如孙悟空一样实现七十二般变化,从而体验到个性化AI作画的魅力。
区别于一般通用文生图模型,“百变悟空”着重突出了个性化和场景化的创作能力。
创作时,用户仅需上传数张图片,即可一键实现训练、微调、部署自己的文生图模型。比如,基于用户上传的本人照片创建模型,通过文本描述生成与主体相关的图片,相比普通修图软件的滤镜套用,创作更具真实感、趣味性。
“百变悟空”构建了三大核心优势:一是融合多模态大模型的图文理解能力,使生成的图片与文字描述的意思更加贴近;二是基于多模态大模型数据构建能力,可自动化构建个性化训练任务的正则数据集;三是基于用户自定义图片主体训练信息,可通过简单个性化标识即可实现主体目标的独特性。
这一平台可广泛应用于文娱、文物、濒危物种等多种领域,减少人工绘画、拍摄时间等劳动成本,提高生产效率;同时帮助艺术家、摄影师等群体发散创作思维,使用模型来生成主体更多风格和场景的作品,极大提高了人机协同创作的新空间。
“百变悟空”不仅支持人物、动物等个性化作图需求,还可支持任意场景模型的定制化开发体验。
目前,光谷已集聚人工智能企业120余家,构建了从基础支撑、关键技术到行业应用的完整产业链条,人工智能核心产业规模超100亿元,相关产业规模超500亿元。
光谷组建了武汉人工智能研究院、北京大学武汉人工智能研究院“双研究院”,建成投运武汉人工智能计算中心、武汉超算中心“双中心”,人工智能企业数量占武汉全市66%,人工智能核心产业规模占全市82%。