混迹技术圈这么多年,从PC时代的PageRank,到移动时代的App Store ASO,再到NLP的BERT模型,我们总是在追逐“算法”。但最近,一个叫GEO(Generative Engine Optimization,生成式引擎优化) 的词开始火了。
这不是一次算法迭代,这是一次“引擎”的替换。
我们过去的SEO(搜索引擎优化),本质上是对“索引器+排序器”的优化。而GEO,是对“LLM(大语言模型)”的优化 。
过去的SEO,我们玩的是“关键词”;现在的GEO,我们玩的是“语义”和“意图”。AI引擎面对的是“超具体、对话式”的查询 ,而不是“跑鞋 男”这种两三个词的组合。
这彻底改变了我们的技术实现路径。
“黑盒”的恐慌:AI到底在想什么?
我看了几篇国外的访谈,发现品牌方的CEO、CMO们现在普遍很焦虑。
一位高管(U.S. Polo Assn.的Jose Nino)坦言,他一个月前和一周前用AI模式搜同一个东西,结果完全不同 。他直说:“你根本不知道是什么在推动这个回答……如果有人说他完全知道,那他肯定不是100%确定。”
这种“不可知性” 让业务方很慌。但作为技术人,我们必须冷静。
AI的回答不是凭空生成的。 尤其是在购物、推荐这种需要事实支撑的场景,大概率依赖的是RAG(检索增强生成)架构。LLM负责“对话”,但它回答的“事实”来自它能“检索”到的数据。
因此,GEO的技术核心问题就变成了:我们如何让自己的品牌数据,成为AI在RAG过程中最优先、最信任的“R”(Retrieval)?
国外的一些先行者,已经给出了几个清晰的技术路径。我拆解一下他们的打法:
打法一:Target——“机器可读”的数据基建
Target(塔吉特)的数字产品副总裁RAGjeet Bhosale说得很到位:“SEO的未来是走向GEO” ,“我们必须确保我们正在‘训练’AI助手” 。
他们怎么“训练”的?不是靠堆内容,是靠“喂”数据。
技术实现: Target把搜索的核心要素拆解为5个关键点:价格、产品、促销、可用性(库存)和政策(退换货) 。
他们的工程团队正在全力确保所有这些数据都是“机器可读”(machine readable)的 。
架构师点评: “机器可读”是这里的精髓。这绝不仅仅是做个Sitemap。
我推测,Target正在构建一个极其健壮、实时的“产品知识图谱”或“结构化数据API”。
当一个用户发起如下的复杂查询:“为四个人准备的健康晚餐,无麸质选项,价格低于20美元,现在可在亚特兰大自提” 。
LLM会把这个自然语言拆解为结构化查询,然后调用Target的“机器可读”数据层。如果你的API能立刻返回一个包含(产品、价格、库存、地点)的准确结果,AI就会采纳你的答案。
Target的GEO优化,本质上是在优化RAG的数据检索质量和实时性。
打法二:Edible Brands——“Q&A对话式”的内容工程
如果说Target做的是“数据层”,Edible Brands做的就是“内容层”。
技术实现: 他们发现,与其堆砌关键词文章,不如专注于“有助于回答问题的长期内容” 。他们的内容形式被重构成“Q&A类型的对话” 。
同时,他们从技术上确保“元数据(Metadata)结构合理” ,以便LLM能够“阅读和理解” 。
架构师点评: 这是在为LLM“喂语料”。
“Q&A对话式”的内容 ,是微调(Fine-tuning)LLM或构建高质量Embedding向量的理想数据格式。当用户的Query进来时,更容易在向量数据库中匹配到你的Q&A对。
而“结构合理的元数据” ,大概率是指Schema.org这类语义标记。它在HTML中明确告诉爬虫(以及背后的LLM):“这段文字是一个‘问题’”,“这个数字是一个‘价格’”。这极大降低了AI的理解成本 。
Edible Brands的GEO优化,是在构建一个高质量的“私域知识库”。
打法三:Every Man Jack——深入“LLM可见层”的反向工程
Every Man Jack的打法最大胆,也最像我们“技术人”会干的事。
技术实现:
-
他们发现LLM在做推荐时,非常偏爱Reddit等平台上的“真实、长尾对话” 。于是他们反向去社区“促进真实的对话” 。
-
最关键的:他们在自己的网站上,创建“仅对LLM可见的内容” 。
架构师点评: 第一点,是意识到LLM的“预训练数据”来自广阔的互联网,因此他们试图去影响“源数据” 。
第二点 ,才是真正的“黑科技”。“仅对LLM可见”,这怎么实现?
我能想到的最直接的办法,就是基于User-Agent做内容分发。
当识别到访问者是Googlebot、ChatGPT-Crawler或其他AI爬虫时,服务器返回一个专门“喂”给AI的、高度结构化、富含Q&A和事实数据的页面。而普通用户访问时,看到的是常规的营销页面。
这本质上是在对AI进行“A/B测试” 。他们想通过这种方式,反向工程出“大模型到底喜欢什么样的数据,并会把它用在答案中” 。这是在尝试打开“黑盒”。
看了这些案例,我的结论是:GEO优化不是虚无缥缈的营销概念,它是一个严肃的数据工程和内容工程问题。
旧的SEO还没死 ,大部分人还在用传统搜索 。但是,用户行为已经开始迁移了——即使用户在传统搜索框里,他们也开始输入更长、更口语化的查询 。
作为技术人,我们的战场正在转移。我们不再是优化“排名”,而是优化“AI的答案本身”。
我们的技术栈需要扩展了:
-
数据层(像Target): 你的数据是否“机器可读”?你是否构建了能实时响应的“产品知识图谱”?
-
内容层(像Edible Brands): 你的内容是否是“Q&A对话式”的?你是否用了“结构化元数据”?
-
测试层(像Every Man Jack): 你是否有机制去“反向工程”AI的偏好?
这个新游戏才刚开始,但规则已经很清楚了。你准备好了吗?

被折叠的 条评论
为什么被折叠?



