美图AIGC布局再进一步,大模型3.0让用户掌握主动权
来源:锌财经(ID:xincaijing) 作者: 陈妍 编辑:大风
这年头,是个企业都要搭上AIGC的顺风车。
自从ChatGPT问世,各种AI视觉大模型公司也像雨后春笋般涌现。数据显示,国内目前已发布的AI视觉大模型超过30个,还有100支以上的创业团队在路上。但仔细观察会发现,大部分大模型只是描述了一个“完美”的概念。
它们的产品没怎么打磨过就匆忙上市,用户真实的使用体感很差。尤其是在企业生产环节,许多大模型与工作流的结合仍在初步探索阶段。
很长一段时间里,AI视觉大模型的都是空有其名,从企业到用户,都在等待一场真正搅动风雨的暴雨洗礼。
最近,锌财经发现美图公司举办了15周年生日会。生日会上,创始人兼CEO吴欣鸿官宣了一件大事,美图自研AI 视觉大模型MiracleVision发布3.0版本,最新的大模型将运用到美图旗下所有影像与设计产品,助力电商、广告、游戏、动漫、影视五大行业。
MiracleVision 3.0版本的核心能力可以拆分为“奇思妙想”和“智能创作”两部分,除了输入文字生成相应图像、输入涂鸦秒变大作这些基本操作外,大模型的“智能脑补”和精准控制能力都进一步加强,降低绘图、修图的门槛,实现创作平权。
对于美图的种种新动作,二级资本市场也已经做出来自己的回答。近几个月来,美图公司的股价持续呈现出上升趋势,截至目前总市值突破172亿港元。
不难发现,在这场对AIGC探索的长跑中,美图拉着用户跑到了最前面。
01
100天的进化,AI技能已达next level
美图上一次有更新动作,还在100天前。
今年6月,美图首次发布的视觉大模型MiracleVision,已经给整个行业带来惊喜,它能从绘画、设计、摄影等视觉创作场景反推技术演化,尤其擅长亚洲人像摄影、国风国潮等生成方向。但当时,吴欣鸿直言:“AI带来很多机会和挑战,但这个机会不一定是我们的机会,而挑战是实实在在存在的。我还是一个如履薄冰的状态。”
这种对技术的重视度和危机感,让美图大模型在很短的时间里再次做到迭代升级。吴欣鸿介绍说,三个月前,MiracleVision绘画水平还停留在初级阶段,如今3.0版本已经能描绘出真实细腻的画面细节。
锌财经亲身体验了以MiracleVision3.0为内核的AI视觉创作工具WHEE。在对话框中输入“一个小女孩”后,平台会提供智能联想,把关键词补全为“儿童画,小女孩,纯真的笑容,绿色草地,高分辨率,卡通风格,可爱,阳光明媚,水彩效果”,设定完基本参数,再等待数秒后,生成了4张画面内容各异的小女孩图像。
具体来看,这些画像注重细节勾勒,画面精致符合美学结构,人物效果栩栩如生,甚至有合理多变的光影效果,氛围感拉满。
一般用户可能不太懂有关绘画、照片的专业名词,比如光影效果、质感、风格、图片质量等,美图的“奇思妙想”能辅助没有美术功底的用户,提供创意灵感。如果有更专业的需求,MiracleVision的“提示词精准控制”功能,还可以轻松实现近景、远景、顺光、逆光等生成效果。
“智能创作”是美图办成的又一件大事。MiracleVision的“深化创作”功能,能进一步丰富作品细节和提升表现力;“AI画面扩展”功能让作品尺寸更大、细节更丰富;“局部修改”功能,可以指哪改哪,对部分画面进行精准修改与调整;“分辨率提升”功能可以生成高清大图,让细节表现、色彩展示、物体辨识更加精准和生动。
可以看到,这次美图大模型的更新,试图从根源上解决图像的精确性和可控性问题,让AI视觉生成上了一个台阶。
02
更适合工作场景的提效工具
一定程度上,把AI视觉大模型用到工作流程中,是比单纯做好视觉呈现更困难的事。虽然生活场景和生产力场景技术底层是共通的,但实际应用场景很不一样,需要做很多精细化的适配工作。
这次美图MiracleVision3.0版本的推出,更大的意义就在于,它能落地电商、广告、游戏、动漫、影视五大行业,来帮助工作流提效。
就拿电商行业来说,做物料一直是头大的事情。很多鞋服企业每年光是找摄影团队、模特拍摄上能花掉几十万甚至上百万,而且真人模特拍摄是一锤子买卖,后期想要再调整修改,也会很麻烦。
如今在美图设计室里,商家可以实现从涂鸦生成线稿、线稿上色、商品图、模特试穿图,再到电商物料输出的全过程,极大提高生产效率、降低成本。
用“AI鞋服”工具可以完成初步的商品图,选择线稿参考图、材质、文字描述后,一次性能生成8张图片,生成结果也能二次微调。
然后在“AI商品图”上,能把刚做好的商品图自动抠图,选择合适的场景,进行细节优化。最后再在“AI海报”看到海报效果。
美图还研发了“AI模特试衣”工具,上传人台图或真人模特图后,能定向选择保留或去除哪部分商品内容,然后在模特库里挑选所需的AI模特,性别、人种、肤色都可以自定义。稍等片刻,就会生成AI模特试衣图,如果对效果不满意,还能换模特,重新编辑。
不难发现,美图视觉大模型的出现,形成了AI原生工作流。在创意脑暴后,AI能快速生成各种创意视觉方案,确定最终创意后,AI又能快速把创意细化,完成最终作品。因此,原本会延续一周以上的工作时间,被压缩到三天,甚至更短。
在吴欣鸿看来,AI视觉大模型的本质,是无穷无尽的视觉创意库,应用层则是内容提取器,“根据用户的需求,从这个巨大的创意库中提取所需要的内容,让用户在特定场景中使用。”
将视觉大模型3.0版本做到的精确性和可控性赋能垂类工作场景,为行业降本增效,这是美图的目标。
03
与AIGC高度融合的未来
时至今日,美图与AIGC已经深度绑定了。
早两个月,美图公布2023中期业绩,上半年实现总收入12.61亿元,同比增长29.8%;归母净利润1.51亿元,同比增长320.4%。美图公司月活跃用户数达2.47亿,同比增长2.5%。具体分业务来看,影像与设计产品收入高达6.02亿元,同比增长62.2%;美业解决方案的收入2.86亿元,同比增长31.1%。
不难发现,在AIGC技术的驱动下,美图在AI图片、AI视频、AI设计等领域持续创新,推动影像与设计产品(主要是通过VIP订阅收费)收入大幅增长,从而帮助美图实现了营收增长和全面盈利。
事实上,AIGC在影像领域的应用场景,还有更广阔的市场空间。生日会上,吴欣鸿分享了自己的看法,视觉大模型应用普及将经历三个阶段:2024年之前为探索期,2024-2025年为高速发展期,2026-2030年为成熟期。
视觉大模型在生产端的应用逐渐走向成熟,到时候会助力千万设计场景,引领美学的升级与社会经济增长。
那么对于美图公司来说,这也是更大的发展机遇。根据财报数据,截至2023年6月,美图的VIP用户数量达到720万,但付费渗透率只有2.9%,还有很大的上升空间。
一个趋势是,未来美图的收入将主要由影像与设计产品业务驱动,预计到2025年影像与设计产品收入将超26亿元,是2022年的三倍有余,美图也很有可能成为最具影响的影像订阅企业之一。
如今的成就,是美图过往努力取得成功的里程碑。在AIGC的浪潮中,美图还在向行业释放更多想象力。