【关键词】图像生成;广告创意;自然语言处理
引言
在数字化浪潮席卷全球的当下,广告行业作为商业信息传播的关键枢纽,正经历着前所未有的深刻变革[1]。随着市场竞争的日益白热化,消费者每天接触到海量的广告信息,传统广告创意的吸引力逐渐减弱,广告行业面临着创意枯竭与效率瓶颈的双重挑战[2]。如何在短时间内产出新颖、吸睛且精准触达目标受众的广告创意,成为广告从业者亟待解决的难题。
传统广告创意的生成主要依赖于创意团队的经验和灵感,这种创作模式不仅耗时费力,而且难以保证创意的质量和效果。当前也出现了一些基于人工智能(Artificial Intelligence,AI)技术的广告创意辅助工具,如智能文案生成器、图像设计软件等。然而,这些工具大多只能实现单一功能[3],难以满足消费者和广告主对广告的多样性和个性化需求。NLP与文本生成图像技术在广告行业的应用为广告创意提供了新的契机。
NLP技术能够理解和分析人类语言,实现文本的分类、情感分析、机器翻译等功能,帮助广告工作者编写广告文案。文本生成图像技术则可以根据输入的文本描述生成相应的图像,大幅降低广告创意的成本。本研究将这两种技术有机融合构建智能广告创意辅助系统,帮助广告从业者快速理解客户需求,生成多样化的创意方案,并通过数据分析和用户反馈不断优化创意,从而提高广告的传播效果和商业价值。系统有效提升广告创意的生产效率和质量,实现从广告需求解析到创意生成的全流程自动化。
一、系统框架设计
研究基于NLP与图像生成技术设计了智能广告创意辅助系统。系统包括广告需求分析模块和广告创意生成模块,主要构建了广告需求解析器、广告创意知识图谱、可控文本生成模型和语义引导图像合成网络等功能模块。
广告需求解析器对输入的广告需求文本进行分词、词性标注、命名实体识别等预处理操作,将文本转化为适合模型处理的格式后,导入到领域增强的BERT(Bidirectional Encoder Representations from Transformers)模型中,进行广告需求的深度理解和精确标注,最终输出每个维度的语义标注结果;广告创意知识图谱采用了实体抽取、关系抽取、语义标注等技术,对多源数据进行整合和标准化处理。图谱包含广告学理论、消费者行为数据、图像风格特征等多方面知识,实现广告需求与创意之间的智能映射;可控文本生成模型基于GPT4o进行改进,模型根据广告需求解析模块输出的语义标注结果,确定广告文案的主题、风格和目标受众,实现多维度文案生成;语义引导图像合成网络根据广告需求解析器处理后的信息合成广告图像,满足广告用户个性化要求。
系统架构主要分为数据层、数据库层、技术支撑层和应用层,具体架构如图1所示。

二、广告需求分析模块
广告需求分析模块包括广告需求解析器和广告创意知识图谱。广告需求解析器将识别输入文本,经人工智能模型处理后输出每个维度的语义标注结果。
