语义相似度是显著影响AI数字营销的关键因子




语义相似度是显著影响AI数字营销的关键因子

论文思想以及与品牌增长的关系

在面对主观性问题或者有争议性问题时,目前主流的大语言模型会倾向于选择具有何种特征的文本?

“What Evidence Do Language Models Find Convincing?”这篇文章提出,相较于提升可读性、权威性、数据引用等方法,提高文章段落与问题的相关性更容易被AI引用,而别的影响因子基本是中性甚至有副作用。

所以在品牌营销策略中,提升文章与客户提问的问题之间的文本相似性(即文本向量化后相似度高)是一个重要手段,找准自己想布局的提问领域,精准化布局文章以匹配提问的问题,这样非常有助于品牌提升在主流AI平台(如DeepSeek、豆包、微信搜索)中的提及度以及曝光度。

 

探究论文的研究方法以及研究结论

本实验的数据集是收集一些有争议性的问题,比如“阿斯巴甜是否致癌?”,这种问题没有标准答案,并且存在正反两种观点的文章。然后把这两种文章的部分段落作为输入给AI去判断选择相信哪一个答案。

 

段落胜率的概念:像主流的RAG方式一样,一篇文章会被拆分成数个小段落,然后通过向量相似度去寻找与问题相类似的段落作为AI的“知识”来源。所以实验中也是把一篇文章拆分成多个段落,然后对于每个段落去跟别的段落比较哪个会被AI采纳,计算至少5轮竞赛的胜率作为这个段落的胜率。

 

首先第一次实验是,对于所有文章截取出来的每个段落,分别计算出它们的段落胜率。然后探究可读性、词汇多样性、情感积极性、困惑度、n-gram关键词命中数、向量相似度这6个影响因子对于段落胜率的变化。从下图可以看出来,可读性、词汇多样性、情感积极性、困惑度都跟段落胜率没有明显相关性,而关键词命中数和向量相似度对于提升段落胜率有很大帮助。

image-20250716142725198

 

第二次实验采用不同的方法,通过改变写作风格或者是提升语义相关性的方式修改已有段落的文本,并计算出不同特征对于提升被AI引用概率的影响。改变写作风格具体包括:添加引用、添加更多信息、添加联系信息、书写语气更具有权威性、书写语气更技术性、书写语气更客观。提升相关性具体包括:重写文章让它与提问更相关、添加一句相关的话、把问句放在段落前面、关键词堆砌。从下图中可以看见提升语义相关性的措施更能显著增加段落的胜率。

image-20250716111608586

 

本论文对品牌AI营销的指导意义

从以上实验数据我们可以看到,提升文章段落与问题之间的相关性是提升品牌在AI搜索中的可见性的一个有效方法,颠覆了我们的传统认知——即权威、客观等因素会更让我们觉得文章可信。所以要想让自己的品牌在AI搜索中获得更多的曝光,很好的一个办法是针对多个场景的问题,精准布局对应与问题相似度高的文章。

 

引用论文:

标题:“What Evidence Do Language Models Find Convincing?”

作者:Alexander Wan, Eric Wallace, Dan Klein

 



评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注