什么是站点地图?
站点地图是一个文件,它列出了您网站上的所有页面,以帮助 Google 等搜索引擎找到您的内容并将其编入索引。并可能使用户更容易浏览您的网站。
站点地图有两种主要格式:
- 可扩展标记语言 (XML) 站点地图:供搜索引擎(而非人类)阅读的文件
- 超文本标记语言 (HTML) 站点地图:一个常规网页,其中列出了指向您网站上页面的链接,这可能对访问者有所帮助
这是它们的外观:
一些公司在规划其网站架构时还会创建可视化站点地图。
这有助于设计人员在构建网站之前规划页面层次结构并了解内容将如何连接。
注意:本文重点介绍改进 SEO 的 XML 和 HTML 站点地图示例,而不是 Web 设计人员使用的可视化规划地图。
为什么站点地图很重要?
站点地图可帮助搜索引擎发现和抓取您的页面。
搜索引擎必须先找到每个页面,然后才能在搜索结果中将其编入索引(存储)和排名(显示为列表)。以下是它在高级别的工作原理:
当搜索引擎访问您的网站时,它们通常会从一个页面到另一个页面跟踪链接。
如果出现以下情况,则会出现问题:
- 页面没有指向它们的链接
- 您的网站太大且范围太广,无法完全抓取
- 您的网站结构复杂,使搜索引擎机器人感到困惑
站点地图通过提供您想要抓取和索引的页面的清晰目录来解决这些问题。
不同类型的站点地图
XML 站点地图
XML 站点地图是专门为搜索引擎机器人创建的文件,用于帮助他们发现您网站上的页面。
它包含您网站上的重要 URL 列表,还可能提到:
- 每个页面的最后修改日期
- 更改频率指示器(内容更新频率)
- 优先级值(范围从 0.0 到 1.0),表明页面的重要性
以下是 XML 代码在站点地图中的简单示例:
您通常会在“yourwebsite.com/sitemap.xml”之类的地址找到 XML 站点地图。
HTML 站点地图
HTML 站点地图是一个网页,其中包含指向您网站重要区域的链接,供用户更轻松地浏览。它通常列出类别或部分,帮助访问者一目了然地了解您网站的结构。
例如,HTML 站点地图可能位于 “yourwebsite.com/sitemap” 并且看起来像一个目录:
HTML 站点地图现在不太常见,但可以改善大型或复杂网站上的用户体验。
XML 站点地图和 HTML 站点地图有什么区别?
简而言之,XML 站点地图支持搜索引擎爬行,而 HTML 站点地图支持用户导航。
以下是主要区别:
XML 站点地图包括:
- 专为搜索引擎打造
- 用人类难以阅读的 XML 代码编写
- 通常以包含更新频率和优先级等技术信息的方式编写
- 能够包含任意顺序的 URL,而无需层次结构
- 帮助搜索引擎高效地发现和抓取您的内容
HTML 站点地图是:
- 主要为网站访问者设计
- 以 HTML 格式创建并显示为常规网页
- 通常按反映您网站结构的逻辑层次结构进行组织
- 有助于用户浏览您的网站并查找特定页面
- 有利于改善复杂网站上的用户体验
XML 站点地图示例
XML 站点地图列出 URL 以实现高效抓取。许多大品牌使用它们来一次显示所有关键页面。
以下是一些 XML 格式的站点地图示例:
1. 三星的 XML 站点地图
网址:https://www.samsung.com/sitemap.xml
2. 百思买的 XML 站点地图
网址:https://www.bestbuy.com/sitemap.xml
3. Shopify 的 XML 站点地图
网址:https://www.shopify.com/sitemap.xml
4. OpenAI 的 XML 站点地图
网址:https://openai.com/sitemap.xml
HTML 站点地图示例
HTML 站点地图显示为网页,专注于组织可帮助用户浏览站点的信息。
以下是一些简单站点地图的真实示例:
1. Microsoft 的 HTML 站点地图
网址:https://www.microsoft.com/en-us/sitemap
2. Airbnb 的 HTML 站点地图
网址:https://www.airbnb.co.in/sitemaps/v2
3. 沃尔玛的 HTML 站点地图
网址:https://www.walmart.com/store-directory
4. 苹果的 HTML 站点地图
网址:https://www.apple.com/sitemap/
站点地图最佳实践
如果需要,包括 Page Priority
在 XML 站点地图中,如果您想显示哪些页面最重要,请使用 标记。值范围从 0.0 (最低) 到 1.0 (最高)。
只需知道 Google 会忽略此标签。
如果需要,指示更改频率
<changefreq>
标记指定内容更改的频率。
有 7 个 <changefreq>
值:
- 从不:对于不会再次更改的存档内容,例如历史记录
- 每年:适用于每年更新的内容,例如活动日历或年度报告
- 每月:适用于每月更新的内容,例如专题页面或常规列
- 每周:适用于每周更新的内容,例如产品列表或博客部分
- 每日:适用于经常更改的内容,如新闻版块或每日特价
- 每小时:用于快速变化的信息,例如天气预报或交通更新
- 始终:适用于不断变化的实时内容,例如股票行情或实时数据
与 <priority>
标签一样,Google 会忽略 <changefreq>
标签。
避免 Noindex 页面
Noindex 页面告诉搜索引擎不要在结果中显示某些页面。不要在站点地图中包含此类页面,以避免产生混合信号。
仅包含您希望访问者通过搜索引擎找到的页面。
避免重复内容
重复的页面应该远离您的站点地图。搜索引擎分配资源(有时称为 “抓取预算”),因此最好专注于独特的页面。
这可确保搜索引擎可以轻松发现您最有价值的内容并将其编入索引。
使用多个站点地图
单个 XML 站点地图最多可以包含 50000 个 URL,并且不能超过 50 MB。
如果您的网站较大,请创建多个站点地图,并使用站点地图索引文件进行分组以进行组织。
大型网站通常会为不同的内容类型(博客文章、产品页面等)创建单独的站点地图,以便更好地为搜索引擎组织其站点结构。
确保您的站点地图没有错误
无错误的站点地图有助于搜索引擎正确抓取和索引您的网页。
Semrush 的 Site Audit(站点诊断)工具有助于查找和修复站点地图问题以及其他 SEO 技术问题。
打开该工具,输入您的网站 URL,然后单击“开始审核”。
按照步骤配置设置。然后,点击 “Start Site Audit”。
您将看到如下所示的 “Overview” 报告:
转到 “Issues” 选项卡并搜索 “sitemap” 以查看与您的 sitemap.xml 文件有关的问题列表。
单击“为什么以及如何修复它”以获取有关解决每个问题的说明。
该工具还可以识别相关的技术问题。赞重复的内容:
而被 noindex 标签阻止的页面:
解决这些错误以保持干净的站点地图和强大的技术 SEO。