拒绝「PPTSD」!通义上线PPT新功能,重塑工作学习流
作为一名合格的打工人,你是什么时候对 PPT “PPTSD”的?
制作PPT,当代打工人的“阿喀琉斯之踵”
最近,在一档综艺节目——《脱口秀和 ta 的朋友们》中,选手赵晓卉对着 PPT 进行了长达几分钟的“血泪控诉”。是的,对于“讲脱口秀只是副业、在互联网大厂正经上班儿才是主业”的赵晓卉来说,没有哪个脱口秀演员对 PPT 的“深恶痛绝”能够像她如此这般真情实感了。
“但凡上过班的人,都不会想做 PPT。” 这简直就是打工人的心声,尤其是互联网大厂人,开不完的会议、写不完的策划、做不完的 PPT。
可以说,在如今的职场中,用到 PPT 的时刻简直就像呼吸一样频繁,日常项目策划要用,月度、季度、年度工作总结汇报要用,开会还要用,简直是随时随地都要用。
可是一份内容扎实、要点明确、设计美观的 PPT 背后,打工人付出的是什么呢?
ta 需要在短时间内构思好 PPT 的大致模样,在短时间内收集、整理、提炼出重点核心内容,在短时间内设计好简洁、美观的页面排版……如此大的工作量,简直对打工人在时间精力等方面都提出了高标准、高要求。
但是几乎没有人会把做 PPT 这件事写在工作日报中,似乎默认它没有时间成本,就应该是拿来即用的东西,而都忽略了背后打工人是如何把工作时间掰开了、揉碎了,在缝隙中来完成这一工作的。
当然,如果你还肩负着为领导做 PPT 的重任,那么这个时间精力可能还要 double 一下……
这就是为什么大家会“谈 PPT 色变”,打工人苦 PPT 久矣。
而听了赵晓卉的这一遭吐槽,通义 AI 直接坐不住了,紧急上线接梗——“别急”,通义 AI PPT 励志要帮助“每一位晓卉”告别 PPTSD,实现快乐上班。 快乐上班这回事暂且搁置一旁,还是先谈谈 AI PPT,本以为是段子,原来是宣发——通义 AI 真的上线了“PPT创作”功能,主打用 AI 做出更适合打工人体质的 PPT。
其实,PPT 看似是一个很细分的行业场景,可实际上它并非小众赛道。
数据显示,我国目前作为 PPT 重点使用群体的白领人员规模近 2 亿。不止是职场,教育教学也是使用 PPT 的高频场景,而其中的教师、学生数量也十分惊人。公开资料显示,当前我国专任教师总数超过 1880 万人,而高等教育在学总规模达 4763.19 万人,可见,PPT的用户群体是多么庞大。
因此,面对如此迫切的需求,变革传统 PPT 制作方式,已然是箭在弦上,不得不发。
而今年以来,AI 大模型技术迅速发展,大模型落地的呼声也愈发高涨,AI 医疗、AI 金融、AI 教育、AI 搜索、AI 办公等行业领域纷纷变热。既然,“所有的领域都值得用 AI 大模型重新做一遍”,那么 PPT 又岂能例外。
于是,各大厂商纷纷下场,目前 AI 创作 PPT 已然成为当下的一个热门赛道,卷得如火如荼。
去掉“AI 味”,一键生成 PPT
像大多数的“AI+”一样,AI+PPT的概念很好理解,利用 AI 大模型技术,帮助用户快速自动创建 PPT 模版,其中最核心的优势就在于能够彻底解决用户在传统制作 PPT 过程中费时费力的痛点。
有了 AI PPT 之后,资料搜集、关键信息提取、内容撰写和排版美化等繁琐流程均可由自动完成,再也不用闷头苦想,即便是非设计专业人员也能轻松制作出高质量的 PPT。
另外,相较于以往 PPT 制作过程中,用户往往使用传统PPT工具所提供的模版,风格相对单一、固定,而有了 AI 大模型加持的新型 PPT 创作,与用户的交互方式发生了改变,从想法构思到内容生成、设计美化,用户可以参与其中与 AI 共创。
而新的 PPT 创作流程可以简要概括为“输入主题—选择模板—一键生成—人工修改”,且短时间内生成的 PPT,内容丰富、质量上乘,在制作效率与质量上表现都很亮眼。
因此,越来越多的用户开始尝试转向 AI PPT制作。根据极光旗下月狐数据发布的《2024 年智能 PPT 行业市场研究分析》报告显示,2024 年 6 月智能 PPT 行业用户规模已接近千万量级,行业近 3 月用户规模复合增速达 21%。
而从整个市场来看,面对如此庞大的市场,进入这一赛道的玩家也越来越多,目前来看,国内的传统办公软件厂商、互联网大厂、大模型初创企业,以及聚焦 AI 创作 PPT 的初创企业等,纷纷下场开卷。
金山办公旗下的 WPS AI 可以看作是传统办公软件厂商代表,去年 ChatGPT 爆火之后,金山办公便宣布推出 WPS AI,之后大模型能力嵌入表格、文字、PPT 等四大组件中,可为用户提供内容改写、文档润色以及一键生成 PPT 等功能。
互联网大厂中百度也早早布局 AI PPT 功能。去年 5 月,李彦宏扬言要把百度搜索、百度网盘、百度文库等百度全系产品用大模型重做一遍。其中,百度文库在文心一言的加持下,能部分实现写稿和智能生成 PPT 等功能。
作为大模型初创企业中的翘楚,AI 大模型“六小虎”之一,月之暗面也在 7 月末推出了自家的 AI PPT 功能——Kimi+PPT 助手。
还有一些聚焦 AI PPT 赛道新生代选手,比如 Ai PPT,是一款将 AI 大模型与 PPT 场景深度融合的产品,提出所需PPT的诉求后,就可快速生成一份完整、专业的 PPT。
据了解,Ai PPT 原本聚焦做素材库相关产品,所以他们在设计上具有独特优势,页面美观,但在质量上,由于没有自家自研大模型作为依托,优势不明显。
可以说,目前市场上的这些 AI PPT 创作产品各有所长,也各有所不足,留给大家的改进提升空间还有很大,而各大厂商也在卯足了劲地进行自我升级。
如今,通义也加入了。
据官网介绍,通义网页版上线的“PPT 创作”功能,最核心的优势就在于只需一句话主题生成 PPT,且言之有物、设计精美、智能编排。
具体来看,通义 AI PPT 创作功能是基于通义千问大语言模型打造的,用户只需要输入一句话,明确所需 PPT 主题,通义就能够自动生成结构合理的 PPT 大纲,相应内容也是围绕着用户需求展开,以此来完成高质量内容创作。
感兴趣的用户可以去体验一下: https://tongyi.aliyun.com/aippt
比如,如今学生开学在即,假定用户身份为教师,想要生成一份关于学生新学期学习展望的 PPT,在输入这一句话后,就能够得到一份新鲜出炉的 PPT。
当然,“一句话主题生成 PPT”只是其中一种方式,除此之外,还有三种输入方式。
一是上传文件生成 PPT,比如文档、音视频、脑图、PPT等本地文件,甚至是添加网页链接等都可以;二是长文本输入生成 PPT;基于 Chat 中生成的结构化大纲生成PPT。
通过这份生成的 PPT 也可以看出来,内容上面,生成的 PPT 大纲和 PPT 内容的信息密度都很高,与用户需求和文档内容的关联性较强,且在遣词造句上非常符合用户的身份,没有像传统的 AI 工具那样,生成的字句晦涩、生硬、空洞,满满的 AI 味,在内容上真的做到了言之有物。
另外,在版面的设计方面,通义也提供多种模版供用户选择,用户可以根据不同场景下的不同需求,选择合适的模版,比如目前通义提供了针对学生、教师、白领、机关单位等各个行业场景的精品 PPT 模板,设计美观好看。
而且,基于通义万相绘画创作模型,在 PPT 创作过程中,还可以提供图片功能,用户可以通过文生图、在图片素材库中搜索、匹配,让配图更符合 PPT 需求。
因此,无论是职场白领,还是教师、学生等用户,都可以在工作汇报、学术演讲,以及日常分享有需求的时候,短时间内创作出一份适合自身需求的 PPT 。
“我们希望通过这些工具帮助用户节省时间,提升工作学习效率,激发无限创意。”通义效率产品经理王晓明向雷峰网说道。
据了解,8 月中旬,通义还在网页版上线了“深度搜索”模式,支持更多内容源索引,搜索结果更加深度、专业和结构化,省去了用户在大量信息中查找内容的繁琐过程,可以直接为用户提供更结构化的答案。
如今,不管是传统办公软件厂商、互联网大厂、大模型初创企业,以及聚焦 AI PPT 的初创企业等,每个细分类别都有了代表,为此,雷峰网
(公众号:雷峰网)
梳理了一下各家的产品特点,以更直观的方式呈现出来,供大家参考。
目前市场上 5 大主流 AI PPT 产品功能对照表
根据表格中可以看出,从生成方式、生成内容、设计排版、用户体验、是否免费、是否自研等多维度表现来看,通义 PPT 创作虽然入局晚,但优势明显,甚至有很多独家核心能力,而这背后的主要原因就是自研的通义大模型能力。
不止于PPT,通义AI重塑工作学习流
言之有物、设计精美、智能编排,这是此次通义PPT 创作功能核心卖点的简要概括,而仔细来看,背后技术实现却要复杂得多。
首先,通义 AI PPT 背后的基础模型来自自研大模型 Qwen 2.5,在理解能力、逻辑推理、指令遵循、代码能力上表现优异,且性能可与 GPT-4 Turbo 相媲美,这也是为什么即便只是简单的一句话主题,前者就可以深度理解用户需求,生成高质量的 PPT。
其次是长文本能力,今年 3 月,在各大 AI 大模型企业在卷超长文本能力时,通义千问宣布向所有人免费开放 1000 万字的长文档处理功能,直接从原先的百万级跳跃至千万级,成为全球文档处理容量第一的 AI 应用,而这也保证了在创作 PPT 时,可以支持超长文档、PPT、PDF、网页等内容输入形式。
另外,在多模态方面,通义 AI 支持输入长达 6 小时的音视频生成 PPT,而这一能力在今年 3 月份就已经实现。彼时,通义听悟在业界首次实现单记录、跨记录、多语言自由问,支持对单个最长 6 小时、一次性上百条音视频内容的理解问答。
还有文生图功能,让配图更符合用户的 PPT 制作需求,则来自于 AI 绘画创作大模型通义万相的能力,这是阿里云在去年 7 月正式官宣的通义大模型家族新成员。
可以说,此次通义上线的 PPT 创作功能,通义大模型家族齐心协力共同努力的成果,为的就是重塑 PPT 制作新模式。
其实,通义此次上线的新功能不仅仅是 PPT 创作。在通义网页版,音视频转文字产品“通义听悟”正式更名为“实时记录”、长文档阅读助手“通义智文”更名为“阅读助手”,与 PPT 创作功能共同合并为通义效率,实现从信息整理、阅读理解到内容创作的完整工作学习流。
通义想做的是要重塑工作学习流。
具体来看,通义效率-实时记录的应用场景主要聚焦课堂记录、会议记录,主要的功能主要表现在这几个方面:
实时进行语音转文字记录,并且用户还可以边听边划重点、记笔记,方便学习;可区分发言人,还可根据不同发言人的发言整理核心观点,这样就意味着如果需要在会后回顾会议时,也不会分不清发言人发言内容,可以根据标记,轻松找到所需内容。
另外,在录音录制完毕可生成摘要、章节速览、待办事项,还可直接生成脑图,帮助快速掌握会议/课程要点和脉络,这对于不擅长做规划的 P 人来说,简直是太有力的工具了。
据了解,目前通义效率-实时记录可识别中、英、日语,并实时翻译成中文,对于需要上外教课和海外留学生听课来说,更方便。
在收费方面,目前该功能支持每天 20 小时的免费录制撰写时长,感兴趣的用户可以去体验一下: https://tongyi.aliyun.com/live/
而另一个功能,通义效率-阅读助手的应用场景则主要是论文学习、资料整理,以及音视频播客转写文字上,可以说是诚意满满。
首先,它支持超多格式、超大文档,不管是 1000 万字的长文档,还是长达 6 小时的音视频,抑或是播客链接、网页链接等,都照单全收,之后可以对其进行快速精读、形成摘要、总结出核心要点,甚至是论文的优点、方法创新点、未来展望等,这样不管是多大块头的学习资料,用户都可以快速理解、掌握。
据官方透露,目前该功能没有时长限制,免费使用: https://tongyi.aliyun.com/read/
至此,通义效率的实时记录、阅读助手、PPT 创作等三大新功能集结完毕,构成了一个从信息整理、阅读理解到内容创作的三位一体的完整工作学习流,闭环、高效、用户友好。
看来,在重塑工作学习流这件事情上,通义是认真的。
硅谷精神之父凯文·凯利曾在《必然》一书中写过这样一句话——我们都只有“倾听”科技所偏好的方向,并使我们的期待、管理和产品服从于这些科技所内在的基本趋势,才能从科技中获得最大利益。
谁先捕捉到用户痛点,谁就同时抓住了机会。
显然,通义已然找到了那个痛点,并且正在抓住机会。
雷峰网原创文章,未经授权禁止转载。详情见 转载须知 。