美图公司CEO吴欣鸿:行业拥有应用视觉大模型能力已成趋势
6月19日,美图公司举办主题为“AI时代的影像生产力工具”的第二届美图影像节。
现场发布7款新品:AI视觉创作工具WHEE;AI口播视频工具开拍;桌面端AI视频编辑工具WinkStudio;主打AI 商业 设计的美图设计室2.0;AI数字人生成工具DreamAvatar;美图AI助手RoboNeo;美图视觉大模型MiracleVision(奇想智能)。
影像节现场,美图邀请到了多位来自产业界和学术界的行业嘉宾,围绕“AI与视频创作”、“AI与设计”、“视觉大模型”三大主题举办论坛,探讨AI影像生产力的新趋势及对相关行业带来的变革。值得关注的是,三场主题圆桌论坛均由美图AI助手RoboNeo向嘉宾提问。
视觉作为人工智能内容生成的一种模态,一直在AIGC领域中扮演着重要角色。近年来,视觉生成技术也取得了很多关键性突破。多年来,美图持续深耕影像 科技 ,在视觉生成领域持续布局和探索,并在此次影像节发布国内首个懂美学的AI视觉大模型MiracleVision。
在第二届美图影像节“视觉大模型”主题论坛上,美图公司创始人、董事长兼首席执行官吴欣鸿,北京智源研究院访问首席科学家颜水成教授,美图公司技术副总裁兼MT Lab(美图影像研究院)负责人刘洛麒,机器之心创始人兼CEO赵云峰就“视觉大模型对产业的推动作用”、“视觉大模型的技术奇点会是什么”等话题分享观点。
吴欣鸿表示,美图视觉大模型将是公司最核心的业务之一,未来能够为美图提供重要的底层支撑。
从美图现有的业务角度出发,吴欣鸿提到,美图云修为商业摄影行业提供支持,美图设计室在电商领域提供解决方案,WinkStudio在影视行业进行探索。除了与视觉影像相关的行业之外,越来越多的行业将逐步拥有应用视觉大模型的能力。国家也在推动数字化与实体融合,而人工智能和视觉大模型实际上是数字化的一个重要组成部分。在这样的产业背景下,相信最大的变革就是没有技术背景的公司也能轻松地运用视觉大模型带来的各种能力,这一天可能会在三年内逐渐到来。
“战略是目标和能力的匹配,首先要把现在的事情做好,逐步探索是否能够延伸到更多的应用场景和行业。”吴欣鸿表示,美图是一家擅长工具、应用和整合的公司,美图视觉大模型初期重点将集中在上述领域。
现场嘉宾也指出,视觉大模型的发展,可能会对人们的审美观念和美学产生影响。在过去,生成对抗网络(GAN)生成的图像可能具有奇怪或不适的风格,但随着时间的推移和技术的进步,这些图像的美学问题可以进行探讨。
颜水成表示,人们可能会追求原生态的东西,希望看到更自然和舒适的状态,以避免审美疲劳。
赵云峰指出,AI在某些领域展现出的美感可能是人类从未发现过的,如AlphaGo在围棋中展示出的美感。
刘洛麒提到,AI的美学能力可以让任何人接触和学习审美,提高整体美学认知水平。AI的美学也能推动虚实结合,拓展人类的想象力和美学认知的边界,为未来元宇宙的发展提供可能性。
吴欣鸿表示,美学是个性化和多样化的,不能被单一定义,美的形态各异,应尊重每个人对美的喜好。对于AI艺术家的发展,人们希望看到真正有创造力、能够打造独一无二风格的AI艺术家的出现。