网站建设|如何利用XML站点地图提高网站的索引量

如何使用XML站点地图来提升SEO

随着网络的发展,谷歌和搜索引擎优化也在不断发展。

这意味着被认为是最佳实践的往往是不断变化的。昨天可能是好的建议,今天不是这样。

对于站点地图尤其如此,站点地图几乎与SEO本身一样古老。

问题是,当每个男人和他们的狗在论坛上发布答案,在博客上发布建议并在社交媒体上发表意见时,需要时间从错误的信息中提出有价值的建议。

因此,虽然我们大多数人都普遍认为向Google Search Console提交站点地图很重要,但您可能不知道如何以推动SEO关键绩效指标(KPI)的方式实施站点地图的复杂性。

让我们清楚解决今天站点地图最佳实践的困惑。

在本文中,我们将介绍:

  • 什么是XML站点地图
  • XML站点地图格式
  • 站点地图的类型
  • XML站点地图索引优化
  • XML站点地图最佳实践清单

什么是XML站点地图

简单来说,XML站点地图是您网站的URL列表。

它可以作为一个路线图,告诉搜索引擎哪些内容可用以及如何访问它。

如何使用XML站点地图来提升SEO

搜索引擎将在站点地图中找到所有九个页面,只需访问XML站点地图文件。

在网站上,它必须跳过五个内部链接才能找到第9页。

对于以下网站,XML站点地图帮助抓取工具加快索引的能力尤为重要:

  • 拥有数千个页面和/或深度网站架构。
  • 经常添加新页面。
  • 经常更改现有页面的内容。
  • 受到弱内部链接和孤立页面的影响。
  • 缺乏强大的外部链接配置文件。

附注:提交带有noindex URL的站点地图也可以加快去索引。如果要解除索引,可以比在Google Search Console中删除网址更有效。但请谨慎使用,并确保只将此类网址临时添加到您的站点地图中。

重点外卖

即使搜索引擎在技术上可以找到没有它的URL,但通过在XML站点地图中包含页面,您表明您认为它们是高质量的登陆页面。

虽然无法保证XML站点地图会抓取您的页面,更不用说索引或排名,提交一个肯定会增加您的机会。

XML站点地图格式

使用所有可用标签的单页网站将具有此XML站点地图:

如何使用XML站点地图来提升SEO

但SEO如何使用这些标签?所有元数据都有价值吗?

Loc(aka Location)标签

此强制标记包含URL位置的绝对规范版本。

它应该准确反映您的站点协议(http或https),如果您选择包含或排除www。

对于国际网站,您也可以在这里实施hreflang处理。

通过使用xhtml:link属性指示每个URL的语言和区域变体,可以减少页面加载时间,<head>或HTTP标头中的链接元素的其他实现无法提供这些时间。

对于那些想要了解更多信息的人来说,Yoast有一篇关于hreflang 的史诗文章。

Lastmod(又名最后修改)标签

一个可选但强烈推荐的标记,用于传达文件的上次修改日期和时间。

John Mueller承认Google确实使用lastmod元数据了解页面上次更改的时间以及是否应该对其进行爬网。与Illyes  在2015年的建议相矛盾。

上次修改时间对于内容网站尤其重要,因为它可以帮助Google了解您是原始发布商。

沟通新鲜度也很强大,但只有在进行了有意义的更改后才能确保更新修改日期。

试图欺骗搜索引擎你的内容是新的,如果不是,可能会导致谷歌处罚。

Changefreq(又名变更频率)标签

曾几何时,这个可选标签暗示了URL上的内容预计会更改为搜索引擎的频率。

但是  穆勒已经表示  “改变频率并不能真正发挥站点地图的作用”,并且“直接指定时间戳要好得多”。

优先级标记

这个可选标记表面上告诉搜索引擎页面相对于其他URL的重要程度在0​​.0到1.0之间。

充其量只是对搜索引擎的暗示,穆勒和  Illyes都明确表示他们忽略了它。

重点外卖

您的网站需要XML站点地图,但不一定是优先级和更改频率元数据。

准确使用lastmod标记,并将注意力集中在确保提交正确的URL。

站点地图的类型

有许多不同类型的站点地图。让我们来看看你真正需要的那些。

XML站点地图索引

XML站点地图有一些限制:

  • 最多50,000个网址。
  • 未压缩的文件大小限制为50MB。

可以使用gzip压缩站点地图(文件名将类似于sitemap.xml.gz)以节省服务器的带宽。但是一旦解压缩,站点地图仍然不能超过任何限制。

每当超过任一限制时,您将需要跨多个XML站点地图分割您的URL。

然后,可以将这些站点地图合并为单个XML站点地图索引文件,通常名为sitemap-index.xml。基本上,站点地图的站点地图。

对于异常大的网站,您还可以创建多个站点地图索引文件。但请注意,您无法嵌套站点地图索引文件。

要让搜索引擎轻松找到您的每个站点地图文件,您需要:

  • 将您的站点地图索引提交到Google Search Console和Bing网站管理员工具。
  • 在robots.txt文件中指定您的站点地图索引网址。当您欢迎他们抓取搜索引擎时,将搜索引擎直接指向您的站点地图。

如何使用XML站点地图来提升SEO

您还可以通过将其ping到Google来提交站点地图。

但要注意:

谷歌不再关注“未经验证的站点地图”中的hreflang条目,Tom Anthony认为这些条目是通过ping URL提交的。

XML Image Sitemap

图像站点地图旨在改善图像内容的索引。

然而,在现代SEO中,图像嵌入在页面内容中,因此将与页面URL一起被抓取。

此外,最佳实践是利用JSON-LD schema.org/ImageObject标记向搜索引擎调用图像属性,因为它提供了比图像XML站点地图更多的属性。

因此,大多数网站都不需要XML图像站点地图。包含图像站点地图只会浪费爬网预算。

例外情况是,图像有助于推动您的业务,例如照片网站或电子商务网站从Google图片搜索获得产品页面会话。

知道图像不必与您在站点地图中提交的网站位于同一个域中。只要在Search Console中验证了CDN,您就可以使用CDN。

XML视频站点地图

与图像类似,如果视频对您的业务至关重要,请提交XML视频站点地图。

如果没有,则不需要视频站点地图。

保存嵌入视频的页面的抓取预算,确保使用JSON-LD将所有视频标记为schema.org/VideoObject。

Google新闻站点地图

只有在Google新闻中注册的网站才能使用此站点地图。

如果是,请包括过去两天发布的文章,每个站点地图最多限制1,000个网址,并在发布后立即更新新文章。

与一些在线建议相反,Google新闻站点地图不支持图片网址。

Google建议使用schema.org图片或og:image来指定Google新闻的文章缩略图。

移动Sitemap

大多数网站都不需要这样做。

为什么?因为Mueller确认移动站点地图仅适用于功能手机页面。不适用于智能手机兼容性。

因此,除非您拥有专门为特色手机设计的唯一网址,否则移动网站地图将无益。

HTML站点地图

XML站点地图可以满足搜索引擎的需求。HTML站点地图旨在帮助人类用户查找内容。

问题是,如果您有良好的用户体验和精心设计的内部链接,您是否需要HTML站点地图?

在Google Analytics中查看HTML站点地图的网页浏览量。机会是,它非常低。如果没有,这表明您需要改进网站导航。

HTML站点地图通常在网站页脚中链接。从您网站的每个页面获取链接资产。

问你自己。这是链接资产的最佳用途吗?或者您是否包含HTML站点地图作为遗留网站最佳实践的点头?

如果很少有人使用它。搜索引擎不需要它,因为你有强大的内部链接和XML站点地图。该HTML站点地图是否有理由存在?我会说不

动态XML站点地图

使用Screaming Frog等工具可以轻松创建静态站点地图。

问题是,只要您创建或删除页面,您的站点地图就会过时。如果您修改页面的内容,站点地图将不会自动更新lastmod标记。

因此,除非您喜欢为每次更改手动创建和上传站点地图,否则最好避免使用静态站点地图。

另一方面,动态XML站点地图由服务器自动更新,以反映相关网站发生的变化。

要创建动态XML站点地图:

  • 请您的开发人员编写自定义脚本代码,确保提供明确的规范
  • 使用动态站点地图生成器工具
  • 为您的CMS安装一个插件,例如WordPress的Yoast SEO插件

重点外卖

动态XML站点地图和站点地图索引是现代最佳实践。移动和HTML站点地图不是。

仅当改进了这些内容类型的索引编制驱动您的KPI时,才使用图片,视频和Google新闻站点地图。

XML站点地图索引优化

现在是有趣的部分。如何使用XML站点地图来推动SEO KPI。

仅在XML站点地图中包含SEO相关页面

XML站点地图是您建议要抓取的页面列表,不一定是您网站的每个页面。

搜索蜘蛛到达您的网站时会收到一个“余量”,表示它将抓取多少页面。

XML站点地图表明您认为包含的URL比未阻止但不在站点地图中的URL更重要。

您正在使用它来告诉搜索引擎“如果您特别关注这些网址,我会非常感激。”

从本质上讲,它可以帮助您有效地使用爬网预算。

通过仅包含SEO相关页面,您可以帮助搜索引擎更智能地抓取您的网站,以获得更好的索引编制的好处。

你应该排除:

  • 非规范页面。
  • 重复的页面。
  • 分页。
  • 基于参数或会话ID的URL。
  • 网站搜索结果页面。
  • 回复评论网址。
  • 通过电子邮件URL分享。
  • 通过过滤创建的URL对于SEO是不必要的。
  • 存档页面。
  • 任何重定向(3xx),丢失页面(4xx)或服务器错误页面(5xx)。
  • 由robots.txt阻止的页面。
  • 没有索引的页面。
  • 可以通过潜在客户表单访问的资源页面(例如,白皮书PDF)。
  • 实用程序页面对用户有用,但不打算作为登录页面(登录页面,联系我们,隐私政策,帐户页面等)。

我想与Michael Cottam分享一个关于优先页面的例子:

假设您的网站有1,000页。这1,000页中的475页是SEO相关内容。您在XML站点地图中突出显示了这475个页面,实质上是要求Google对其余内容进行优先级排序。

现在,让我们说谷歌抓取那475页,并在算法上决定175是“A”级,200是“B +”,100“B”或“B-”。这是一个很强的平均成绩,可能表示一个高质量的网站,可以发送给用户。

与通过XML站点地图提交所有1,000个页面相反。现在,Google会查看您所说的与SEO相关的内容的1,000个页面,并且超过50%的页面是“D”或“F”页面。你的平均成绩不再那么好了,这可能会损害你的有机课程。

但请记住,Google将仅使用您的XML提交作为您网站上重要内容的线索。

仅仅因为它不在您的XML站点地图中并不一定意味着Google不会将这些页面编入索引。

在SEO方面,整体网站质量是一个关键因素。

网站:搜索以查看Google已编入索引的所有网页。

一旦找到低质量的页面,花时间来修复它们。这不仅对搜索引擎更好,更重要的是提供更好的用户体验。

重点外卖

通过将XML站点地图URL限制为SEO相关页面并减少网站上的低质量页面来管理爬网预算。

通过Google Search Console中的抓取统计信息跟踪优化的影响。

完全利用站点地图报告

虽然Google Search Console站点地图报告对于发现警告和错误很有用(特别是使用新的索引覆盖率报告),但您可以做的不仅仅是简单验证。

如何使站点地图索引数据可操作?

想象一下,你有一个拥有131,000个SEO相关页面的网站。

由于大小,您需要多个站点地图。

无论谷歌和Schema.org显示例子令人鼓舞编号命名。

所以你可能最终得到了这样的东西:

如何使用XML站点地图来提升SEO

不是最有洞察力的命名约定。

知道整个网站有64%的网页编入索引并不是特别有用。

您需要发现哪些类型的页面被遗漏了。

问题是,如果您尝试深入了解,顺序站点地图名称不会指示您的网站的哪个部分遇到索引问题。

在sitemap-3中发现所有类型的页面非常耗时。

而是使用反映您的网站结构的描述性站点地图名称。

如何使用XML站点地图来提升SEO

通过在明确命名的站点地图中对不同类型的页面进行分组,您将人们的产品页面隔离为主要索引问题。

但文章页面也表现不佳。

要了解原因,请根据其他维度将文章站点地图拆分为较小的站点地图。

如何使用XML站点地图来提升SEO

现在我们已经明确了与健康相关的文章,这些文章在索引方面表现不佳。

站点地图应该是互斥的 – 每个URL只存在于一个站点地图中。否则,它会使分析更加困难,您可能会看到比提交的页面更多的索引页面

重点外卖

除了识别警告和错误之外,您还可以使用XML站点地图作为一种调查工具,通过描述性地命名站点地图来反映您的网站架构,从而隔离索引问题。

站点地图不再被分割,因为它们达到了50,000个网址限制。它们被分组以提供关于页面索引(或缺少索引)的可操作的见解。

XML Sitemap最佳实践清单

投入时间:

✓在XML站点地图中包含hreflang标记

✓包括<loc>和<lastmod>标签

✓使用gzip压缩站点地图文件

✓使用站点地图索引文件

✓仅在索引编制推动您的KPI时才使用图片,视频和Google新闻站点地图

✓动态生成XML站点地图

✓参考robots.txt中的站点地图索引URL

✓将站点地图索引提交给Google Search Console和Bing网站管理员工具

✓仅在XML站点地图中包含SEO相关页面

✓修复所有站点地图错误和警告

✓根据页面类型将描述性命名的站点地图中的URL分组

✓从GSC下载站点地图数据以分析指数化率

✓确保URL仅包含在单个站点地图中

现在,去检查自己的站点地图,确保你做得对。

原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/261336.html

(0)
上一篇 2022年5月24日
下一篇 2022年5月24日

相关推荐

发表回复

登录后才能评论