Post by account_disabled on Dec 9, 2023 6:28:54 GMT
来越困难。现在监控网站的索引非常重要;确定探索或索引问题的原因、了解后果并实施适当的解决方案:授权机器人、纠正重定向错误、解决技术问题等。 索引不当会产生什么后果? 能见度和交通 如果一个网站没有正确索引,它就不太可能出现在您正在 SEO 中处理的相关关键字的搜索结果中。事实上,搜索结果可见度的降低可能会导致自然流量下降。 CA 和投资回报率 如果一个网站产生在线销售,那么从逻辑上讲,流量下降可能会导致收入下降。 用户体验(UX) 例如,糟糕的导航和技术错误(例如404错误)可能会阻碍访问者并损害他们的网站体验。 因此,诊断和解决网站的索引问题以最大限度地提高其在搜索结果中的可见性、改善用户体验并保持高流量和收入水平非常重要。 爬行和索引之间的区别 最重要的是,区分探索和索引非常重要。 探索或爬行 谷歌通过称为爬虫的自动化程序从其在互联网上检测到的页面下载文本、图像和视频。因此,此步骤对应于 Google 传递您网站页面的时刻。这一探索阶段也称为“爬行”,谷歌的机器人从一个链接转到另一个链接,浏览不同的网站、不同的页面。因此,谷歌机器人会一页一页地探索这些页面。 索引 谷歌分析页面上存在的文本、图像和视频文件,然后将信息存储在谷歌索引中,这是一个大型数据库。
然后我们将进入索引阶段。为了让您的网页在 Google 搜索结果页 (SERP) 中脱颖而出,您的网页必须编入索引。 总而言之,抓取的 URL 不一定会被索引!(来源) 用于抓取、渲染和索引页面的 Googlebot 进程(来源) 无法对 URL 建立索引的主要 工作职能邮件数据库 原因 以下是可以解释您的网站以及您的页面(有时是战略性的)上的网络索引困难的主要原因: 无索引标签 标签告诉搜索引擎机器人不要索引该页面。如果您的战略页面上存在此标签,您就会明白为什么它没有被索引。 状态码 以下状态代码不允许建立索引: 301(永久重定向), 302(临时重定向), 404(找不到资源), 410(资源不再存在), 500(服务器错误), ETC。 不好的规范 <canonical> 标记中的目标 URL 与您所在页面的 URL 不同。<canonical> 标签用于向网络爬虫指示在以下情况下引用哪个页面: 重复内容 相似内容/相似页面(语义上 – 不包括分页页面) 提醒一下,<canonical> 标签是一个指示,而不是指令。 机器人.txt 这些命令行会阻止一个或多个 URL 参数、一个或多个 URL 目录。管理不善的 robots.txt 限制可能会阻止战略页面的索引。 域名权威 您的域权限较低可能是未编入索引的一个因素。权威分数是一个指标(由一系列测量值组成),用于衡量域或网页的整体质量和SEO性能。 内部网络 如果该网址最近在网站上上线,没有内部链接,该网站不经常被机器人抓取,也没有向 Google Search Console 发送站点地图,这可能会导致索引问题。
采用 <a href> 形式的 URL 链接也可能会导致索引问题。Google 无法跟踪没有 href 标记的 <a> 链接。因此,该 URL 将无法被跟踪/发现 外部网络/网络链接 您的网站没有反向链接,这会影响您的内容在 Google 眼中的相关性。网络链接是一种技术,包括增加指向您网站的超链接或“反向链接”的数量,目的是提高其可见性。对于搜索引擎来说,网站页面收到的链接赋予其价值,因为它们表明其他网站认可并引用其内容。(来源) 完整的 JS 网站,未实现 SSR、预渲染或动态渲染 使用JavaScript渲染也存在风险。Google确实可以读取JavaScript,但是需要更长的时间。因此,动态内容索引的延迟是由 Googlebot 渲染引擎队列造成的。 SSR / 服务器端渲染:每个 HTML 页面在执行期间都在服务器上渲染,然后完全渲染到客户端(浏览器)。这意味着在页面加载之前,服务器需要一些时间来根据请求呈现 HTML 并将其发送到浏览器。此方法可能会降低页面加载速度,特别是在同时发出许多请求的情况下。 预渲染:在构建时为每个 URL 渲染一个 HTML 文件。这意味着网站上的所有 HTML 文件都是预先构建的,以便页面可以根据需要快速加载。缺点是每次更改这些页面都需要重新构建它们。 动态渲染:该网站具有预渲染的 HTML 页面,并且仅将其提供给爬虫。真实用户与客户端呈现的正常版本的网站进行交互。 我们已经在一篇专门讨论SEO 友好 JavaScript 的文章中讨论过它! 可用于帮助诊断和解决 Web 索引问题的工具 谷歌搜索控制台 Google 提供的这款免费工具可让您监控网站的索引并诊断潜在问题。Google Search Console 充满了有关网站“健康状况”的战略数据,特别是有关 Google 搜索结果中页面索引的战略数据。
然后我们将进入索引阶段。为了让您的网页在 Google 搜索结果页 (SERP) 中脱颖而出,您的网页必须编入索引。 总而言之,抓取的 URL 不一定会被索引!(来源) 用于抓取、渲染和索引页面的 Googlebot 进程(来源) 无法对 URL 建立索引的主要 工作职能邮件数据库 原因 以下是可以解释您的网站以及您的页面(有时是战略性的)上的网络索引困难的主要原因: 无索引标签 标签告诉搜索引擎机器人不要索引该页面。如果您的战略页面上存在此标签,您就会明白为什么它没有被索引。 状态码 以下状态代码不允许建立索引: 301(永久重定向), 302(临时重定向), 404(找不到资源), 410(资源不再存在), 500(服务器错误), ETC。 不好的规范 <canonical> 标记中的目标 URL 与您所在页面的 URL 不同。<canonical> 标签用于向网络爬虫指示在以下情况下引用哪个页面: 重复内容 相似内容/相似页面(语义上 – 不包括分页页面) 提醒一下,<canonical> 标签是一个指示,而不是指令。 机器人.txt 这些命令行会阻止一个或多个 URL 参数、一个或多个 URL 目录。管理不善的 robots.txt 限制可能会阻止战略页面的索引。 域名权威 您的域权限较低可能是未编入索引的一个因素。权威分数是一个指标(由一系列测量值组成),用于衡量域或网页的整体质量和SEO性能。 内部网络 如果该网址最近在网站上上线,没有内部链接,该网站不经常被机器人抓取,也没有向 Google Search Console 发送站点地图,这可能会导致索引问题。
采用 <a href> 形式的 URL 链接也可能会导致索引问题。Google 无法跟踪没有 href 标记的 <a> 链接。因此,该 URL 将无法被跟踪/发现 外部网络/网络链接 您的网站没有反向链接,这会影响您的内容在 Google 眼中的相关性。网络链接是一种技术,包括增加指向您网站的超链接或“反向链接”的数量,目的是提高其可见性。对于搜索引擎来说,网站页面收到的链接赋予其价值,因为它们表明其他网站认可并引用其内容。(来源) 完整的 JS 网站,未实现 SSR、预渲染或动态渲染 使用JavaScript渲染也存在风险。Google确实可以读取JavaScript,但是需要更长的时间。因此,动态内容索引的延迟是由 Googlebot 渲染引擎队列造成的。 SSR / 服务器端渲染:每个 HTML 页面在执行期间都在服务器上渲染,然后完全渲染到客户端(浏览器)。这意味着在页面加载之前,服务器需要一些时间来根据请求呈现 HTML 并将其发送到浏览器。此方法可能会降低页面加载速度,特别是在同时发出许多请求的情况下。 预渲染:在构建时为每个 URL 渲染一个 HTML 文件。这意味着网站上的所有 HTML 文件都是预先构建的,以便页面可以根据需要快速加载。缺点是每次更改这些页面都需要重新构建它们。 动态渲染:该网站具有预渲染的 HTML 页面,并且仅将其提供给爬虫。真实用户与客户端呈现的正常版本的网站进行交互。 我们已经在一篇专门讨论SEO 友好 JavaScript 的文章中讨论过它! 可用于帮助诊断和解决 Web 索引问题的工具 谷歌搜索控制台 Google 提供的这款免费工具可让您监控网站的索引并诊断潜在问题。Google Search Console 充满了有关网站“健康状况”的战略数据,特别是有关 Google 搜索结果中页面索引的战略数据。