Sora 跳票这 10 个月，AI 应用界翻天覆地

砍柴网 • 1月前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

这几天，你是否刷到过大火的各地博物馆让文物 " 舞动起来 " 的短视频？

Sora 跳票这 10 个月，AI 应用界翻天覆地又是否看到过让马斯克都直呼惊叹的，那些被 " 复活 " 的世界名画？

Sora 跳票这 10 个月，AI 应用界翻天覆地再或者，你一定看到过 AI 魔改过争议很多的老牌影视剧。

是的，这一切背后都是 AI。

就在 2024 年最后一个月，国内外科技大厂更是集体炫技，AI 应用正在以迅雷不及掩耳之势加速落地。

在人工智能时代，技术创新的速度让摩尔定律、新摩尔定律不断被打破。

我们此前就讨论过，随着这两年科技公司对算力和 AI 的史诗级投入，大模型底座技术渐成熟并由大厂开源后，AI 界走向了更务实的道路——应用落地。

最新的权威数据统计： 几乎每六个中国人中，就有一人正在使用 AI 产品。

更有从业者直言， " 最快 5 年之内，中国人一周只需要工作 4 天 "。

我们做好准备来迎接这个新时代了吗？

用 AI 造世界：文生图、生视频、生 3D 大模型加速开源

12 月 10 日，OpenAI 旗下视频生成模型 Sora，终于在首次亮相 10 个月后正式开放，新版工具 Sora Turbo 可以生成最长达 20 秒的视频。或许是由于等待的太久，用户火热的试用热情一度让 OpenAI 紧急关闭用户注册。

但是 Sora 姗姗来迟的这 10 个月的空档期内，AI 圈已经翻天覆地。

比 Sora 早一周，12 月 3 日，有着 "AI 教母 " 之称的李飞飞联合创立并担任 CEO 的 AI 公司 World Labs 官宣了首个成果—— 3D 世界生成模型，可以让用户从单张图片生成 3D 世界的 AI 系统，并且用户可以与之互动。比如，通过键盘和鼠标在生成的 3D 场景里移动、转换视角。

Sora 跳票这 10 个月，AI 应用界翻天覆地紧随其后，12 月 4 日，谷歌也发布了 Genie 2，一个能把静态照片变成可玩游戏的 AI 系统，同样可以实现从静态照片到可交互 3D 场景的转换。

就在一个月前，著名游戏公司任天堂旗下宝可梦公司也宣布过一项类似的技术，用 " 大规模地理空间模型 "，让用户距离空间智能更近了一步。简单说，用户可以自行上传图像，构建 3D 地图，能精确而真实地看到放置到物理环境中的数字内容，而且这些内容是持久的，还能与他人共享。

大洋的另一端，中国 AI 技术同样突飞猛进，在 Sora 跳档的这 10 个月里加速赶超。

就在李飞飞官宣新技术的同一天，腾讯版 Sora 大模型面世，并免费开源！

12 月 3 日，腾讯混元大模型官宣了最新的文生视频大模型 HunYuan-Video，用户只需要输入一段描述，即可生成视频，该模型参数量达 130 亿，是当前最大的视频开源模型。从文本、到 AI 绘图到 3D 生成再到视频，腾讯混元大模型已经全系开源。

有参与测评的博主发布评论称，其生成的视频不仅语义理解精准，更是 " 最有电视剧质感的 AI 大模型 "，甚至看不出一丝的 AI 味，对比以往文生视频模式，即使面面占比很小的人脸都不会糊。

半个多月前，字节跳动视频生成模型 PixelDance 和 Seaweed 在即梦 AI 正式上线，并面向公众免费开放使用，仅需 60 秒即能生成时长 5 秒的高质量 AI 视频。

更早的半年之前，今年 6 月快手可灵文生视频 APP 发布，至今已经经历了十余次更新，包括发布图生视频功能以及 1.5 模型的上线等。

在文生图领域，AI 技术也在快速迭代。例如，12 月 2 日，字节即梦 AI 上线了最新的图片 2.1 模型，解决了 AI 图像无法生成中文字体的问题，让海报设计的效率再次大幅提升。

某种意义上，ChatGPT 停止服务中国市场并不是坏事。

今年中国大模型厂家底层技术不断降价并开源，带动了更多中小创业者走上 AI 新牌桌。更重要的是，上述这些文生图、文生视频等以及文心一言、腾讯元宝、字节豆包、阿里千问等 C 端 AI 应用，在中国速度下都以免费的形式飞入了寻常百姓家。

QuestMobile 数据显示，2024 年 10 月，AI 原生应用行业月活跃用户规模达到 8976 万，同比增长 373.0%。

AI+SaaS：智能体将是通往未来的新船票

视觉 AI 应用火，更火的是 " 智能体 "。

在 AI 改变虚拟和真实世界视觉联系的同时，AI 正在各式各类的 SaaS 应用中落地，各种形式的智能体已成为 AI 大模型落地的新载体，并且展现出强大的商业化前景。

所谓智能体，又叫 AI Agent，是以 AI 大模型作为基础，构建的可以进行交互、完成特定任务、或提供专业知识的智能系统或应用程序。

通俗说，智能体可以体现为，装在传统软件 App 里的 AI 插件，也可以是一个独立的 AI APP。

相比较传统的 SaaS 需要完全由人工来操作完成，智能体最大的特点是，接受互动对话指令，并直接产出结果，包括生成视频、图片、文章或完成一件工作。简言之，所有的 AI 应用都可以称之为智能体。

OpenAI 首席执行官 Sam Altman 曾提出，未来每个人都可以拥有一个智能体。

Salesforce 首席执行官 Marc Benioff 更是直言，AI 的未来发展不在于大语言模型，而在于开发 AI 自主代理，即智能体。

产品智能化已经是 SaaS 厂商在新时代下必须迎接的事实，在一些 TO B 场景内，许多传统 SaaS 应用在 AI 加持下获得了新的发展。

比如，做电商服务的有赞最新推出了 " 加我智能 " 功能，其智能体功能包括商机指引、智能托管、营销专家、智能经营报告、智能穿搭、智能销售等等。

正是有赞创始人白鸦预言，未来的生意，数字化是基础，客户运营是抓手，所有这些都可以交给智能技术完成。" 我非常坚信，最多 10 年，最快 5 年之内，中国人一周只需要工作 4 天。用工具解决问题，数字化和智能化带来效率提升是必然的趋势。"

再比如，做教育的粉笔，最新升级了粉笔 AI 老师产品，这个智能体以对话形式存在，具备 AI 导练、学习规划、考情咨询、智能督学等在内的多项功能，可以帮用户规范的作答思路，形成标准化作答习惯，并详细解答答案，优化学习方向和可改进细节，主打一个专业、细心的教育陪伴。

互联网大厂中，百度、阿里、腾讯、字节跳动、华为等皆已布局智能体赛道，并推出一站式智能体开发平台，为开发者、创作者提供更为便捷的操作应用路径。

美国著名孵化器 YCombinator 最新一期圆桌讨论中提出观点：垂直 AI 智能体的规模可能是 SaaS 的十倍。

美国一线 AI 从业者提到，AI 大模型技术正在重塑软件行业。如果说 2004 年在浏览器中可以增加 XML HTTP 请求这个功能，开启了互联网应用程序的新时代，带来了整个 SaaS 软件行业的 20 年繁荣；那么大型语言模型—— LLM 的出现，则是开启了智能体时代的新篇章。

这一切正在发生。

QuestMobile 最新报告提到，当下 LLM 的落地应用在网页端、移动端都已比较成熟，正逐步拓展至智能硬件端，不断深入用户日常生活并提供更自然便捷的交互体验。

市场研究机构 Research and Market 在 11 月 11 日发布的报告中指出，未来五年 AI 智能体的市场规模将增加 420 亿美元。

在腾讯研究院最新发布的《2025 数字科技前沿应用趋势》中指出，AaaS 催化 AI 原生应用落地将是明年大趋势之一。

AI 的新时代已经势不可挡。

来源：明晰野望