在SEO的世界里,我们毕生追求的,是创造那些经得起时间考验的、高质量的“黄金内容”。
我们相信,真正的价值,应当超越时效的束缚。
但日本早稻田大学的试验结果,似乎颠覆了我们的想象。
在当前主流AI模型眼中,时间的“新鲜度”,似乎比内容的“含金量”更重要。
这项研究发现——为在线内容添加一个伪造的、未来的发布日期,即可极大地提升其在各大AI模型中的可见性。
这一发现,几乎证实了许多从业者长期以来的一个猜想:以ChatGPT为代表的工具,正在系统性地偏爱较新的内容,哪怕某些旧内容同样具有参考价值,甚至质量更高。

内容的“时间戳”成为了武器
早稻田大学的研究团队在多个行业与内容类型中进行了多次的对照试验,其结果表现为:AI会让最新发布的内容排名更高,即使这篇内容并没有之前的内容那么优秀。
例如:
-
2018年所发布的一篇具有里程别意义的研究内容,其有10000名人员样本,且拥有多个同行评审,其排名应该很高
-
一篇2024年的初级博客内容,只有50人的研究样本量,且没有同行评审。却因为其文章发布时间更新,就取得了更高的排名。
仅从日期这方面的权重来说,AI的搜索结果中就能让2018年的那篇研究文章排名下降40-60位。
不仅如此,研究人员向包括ChatGPT、Perplexity和Gemini在内的多个主流AI模型提出了同行相关的问题。其结果揭示了不同模型对“时效性”的惊人偏好:
- 决策逆转:仅仅依靠改变日期,就有四分之一的相关性决策被完全颠覆。 这意味着AI在判断哪个内容更相关时,有25%的情况是单凭日期就做出了截然不同的选择。
- 排名巨变:在实验中,单个内容的排名位置仅仅因为日期的更新,就跃升了高达95位。
- 顶部内容年轻化:在竞争最激烈的前10名结果中,内容的平均发布年份,整体被拉近了1到5年。
研究团队发现,几乎每一个被测试的AI模型,都表现出了对更新日期文本的偏爱。

AI搜索大模型的“跷跷板效应”
跷跷板效应这个系统性现象并非简单的喜新厌旧,而是一场结构性的排名重塑。
在AI的眼中,拥有较新时间戳的内容被系统性地拔高,导致排名前10位的内容,其平均年份被拉近了0.8至4.8年。
与此同时,那些较旧的、但同样有价值的内容,则被系统性地压低,导致排名在61至100位的内容,其平均年份反而老了最多2年。
这就像一个跷跷板,一端(新内容)被强行抬起,另一端(旧内容)则被迫下沉。
不同模型的时效性偏见程度,谁是重灾区?
研究还进一步分析了不同AI模型受时效性偏见影响的程度,其结果也存在显著差异。
偏见最严重的模型:Meta的LLaMA-3-8B,其相关性决策的逆转率高达25%,排名年份的偏移接近5年。
偏见最轻微的模型:阿里巴巴的Qwen-2.5-72B,其决策逆转率仅为8%,年份偏移也最小。
居于中间的模型:OpenAI的GPT-4o和GPT-4处于中间地带,表现出可测量的、但相对能接受的时效性偏见。
这份数据谱,为我们评估不同AI工具在处理非时效性知识时的可靠性,提供了重要的参考。
但AI之所以会系统性地偏爱新内容,其根源在于其核心的检索增强生成(RAG)机制。
RAG系统在实时检索信息时,为了追求效率,会采用一些启发式判的捷径。
简单来说,就是AI认为判断哪一篇文章更新,要比判断哪一篇文章更优质简单得多。
这种机制在处理新闻、时事等查询时非常有效,但当它被不加区分地应用在所有类型的查询上时,便暴露出了巨大的缺陷。

结语
我们之所以需要高度关注这一现象,是因为AI模型似乎在奖励时间戳,而非内容质量。
这意味着那些高质量的常青内容,很可能会从AI的搜索结果中消失,除非定期更新它。
这项研究,将所有内容创作者和SEO从业者,都推到了一个新的战略十字路口。
那些我们引以为傲的权威文章,正面临着被降维打击的风险——不是因为它们不够好,而仅仅因为它们“不够新”。
这无疑会催生一种新的、令人担忧的“时间戳优化”的灰色地带。
但更重要的是,它迫使我们重新思考内容维护的定义。
在未来,定期审视、更新并重新发布我们的核心内容,可能不再仅仅是一个好习惯,而是一个关乎生死存亡的必要操作。
*本文观点源于SEL&Metehan,仅提供内容分享与参考作用
https://searchengineland.com/fool-ai-models-fake-dates-boost-visibility-463227
https://metehan.ai/blog/i-found-it-in-the-code-science-proved-it-in-the-lab-the-recency-bias-thats-reshaping-ai-search/
879

被折叠的 条评论
为什么被折叠?



