智变·共生：可灵AI如何重塑内容生产的底层逻辑与传播生态-葫芦时刻

依法合规经营，保障用户权益是我们的生命线，对于部分广告发布者为牟取高收益侵犯用户权益行为，我司将通过法律途径追责到底！

智变·共生：可灵AI如何重塑内容生产的底层逻辑与传播生态

作者罗林周蓉

发表于 2025年8月

当前，人工智能（AI）正以前所未有的速度重塑内容生产与传播的格局。当短视频平台的“爆款”内容中很多由AI辅助生成，当地方文旅宣传片借助AI实现“千人千面”的精准触达，以可灵为代表的AI技术，凭借强大的自然语言处理（NLP）、计算机视觉（CV）和深度学习能力，正在颠覆传统的内容创作模式，推动传播生态的智能化升级。笔者以可灵为核心案例，探讨AI如何赋能内容产业，分析其带来的革新机遇，并展望未来的发展趋势。

可灵AI：打造全球领先的视频生成大模型

2024年6月6日，快手推出全球首个用户可用的真实影像级视频生成大模型可灵AI，提供文生视频、图生视频双模式，支持1080p、30fps的高质量视频输出。截至2025年4月，可灵AI全球用户规模已突破2200万，累计生成1.68亿个视频及3.44亿张图片素材。来自世界各地的超1.5万个开发者和企业，将可灵的API应用于广告营销、影视动画、游戏制作、智能终端等不同行业场景中。

可灵AI在技术、产品等多个维度的突破和创新，助力破解视频生成领域的行业难题，成为推动内容生产和传播变革的利器。一是采用自研DiT（DiffusionTransformer）架构，增强视觉与文本模态信息融合能力，具备强大的概念组合能力和想象力。重构VAE架构，解决复杂动态场景下画面过渡生硬的问题。二是通过强化学习技术提升复杂运动场景生成能力，优化人物表情、动作幅度及时间连贯性，解决运动速度不合理等视频生成模型行业通病。例如，在“马飞速奔驰”的场景中，可灵AI生成的镜头不再是慢动作，镜头表现更加真实、更加符合物理规律。三是强化对运镜语言、构图术语等专业指令的理解，提升对时间的理解能力，能够生成更连贯、更具有故事性、延续性的画面。目前可灵允许用户自由调节视频的纵横比，可为已生成的视频提供便捷的一键续写和连续多次续写，将视频最长可延伸至约3分钟。四是通过对数据体系、文本表征处理链路、提示词工程及去噪策略等方面的迭代更新，逐步自适应Diffusion去噪策略，可深度理解用户的提示词，优化出图细节、提升图片质量，拥有首尾帧控制、镜头控制等能力，支持多种镜头运动方式，在指令遵循、电影质感、艺术风格表现上达到行业顶尖水平。在全球测评榜单ArtificialAnalysis中，可灵AI的图生视频能力稳居全球第一梯队。

从“手工作坊”到“智能工厂”：可灵AI激活内容生产的“效率革命'

传统内容生产长期面临三大困境：人力成本高（头部MCN机构内容团队占比超 60% ）、生产周期长（一条优质短视频从脚本到成片需3至7天）、创意天花板低（依赖创作者个人经验，内容同质化严重）。可灵AI的入场，本质上是一场“生产工具的代际跃迁”，其通过“多模态大模型行业知识库”的技术底座，将内容生产从手工定制推向智能批量制造。

效率跃升：高质量低成本的内容创作。在信息爆炸的时代，内容生产的核心竞争力已从“如何生产”转向“生产什么”，从高成本零星生产转向低成本批量生产。AI实现了规模化的个性化生产，打破了传统传播学中“内容生产成本与传播广度成反比”的规律，革命性提升了内容生产效能。语言类AI使单日文案产量提升3至5倍，视觉类AI将图片创作时间从小时级压缩至分钟级。与此同时，AI还能提供“理解一生成一优化”的全链路覆盖，可实时抓取全网用户情绪热点，结合行业知识库生成“高潜力选题”，自动匹配图文、短视频脚本、海报等不同形态的内容框架，还能通过NLP技术优化语言流畅度，甚至能模拟特定KOL的语言风格，如“半佛仙人”的犀利吐槽体、“无穷小亮”的科普段子手风格。

本文刊登于《传媒》2025年14期

龙源期刊网正版版权

传媒

2025年14期

查看本期目录

更多文章来自