搜索引擎需要在对你的网站进行排名之前为其编制索引。但是,被索引的页面不一定是正确的页面。例如,应被索引的内容也可能未被索引,而不应被索引的内容却常常被索引。
你可以使用以下六个步骤以确保在你的电商网站被索引的是正确的页面。
1、网页数量
首先要确定你的网站有多少网页应该被索引。
GoogleAnalytics中的“Pages”报告会显示访客访问过的所有网址。转到“Behavior”>“SiteContent”>“AllPages”,然后在右上角设置所需的日期范围,然后滚动到右下角,以查看网站上至少带来一次浏览的页面。
或者,添加所有XML站点地图中的URL,但需要确保你的站点地图准确无误。例如,许多自动生成的XML站点地图不包含产品页面,例如一个销售毛衣的页面的URL使用了“black”和“cotton”过滤条件。
2、被索引的页面数量
GoogleSearchConsoleCoverage报告提供了已爬取的页面、无法索引的页面和以及抓取错误页面的数量。它还显示XML站点地图中未被索引的页面以及不在XML站点地图中的已索引页面。
3、页面价值
并非所有页面都对自然搜索有价值。例如内部搜索、使用条款页面,两者都对网站上的购物者有用,但不应编入索引以显示在搜索结果中。
产品、类别和某些被过滤的页面也具有价值,因为这些网页包含人们会搜索的关键词,例如“blackcottonsweaters”。
分析你的Coverage报告,以确保机器人可以抓取并索引具有价值而不抓取或索引其他无关网页。确保有价值的页面被索引,而没有价值的页面被排除在外。
4、重复内容
你的平台是否会生成重复内容?
如果不同网页上显示了相同的内容,那就是重复的内容。这会降低内容重复页面的链接权重,造成内部网页互相竞争,并影响爬取价值。因此,建议你要尽可能消除重复内容。
电子商务平台经常出现重复内容。常见的原因包括:
协议。你的电子商务网站应使用HTTPS协议,如果输入HTTP协议也会加载页面而不会重定向到使用HTTPS协议的网页,这也是重复内容。
域名。某些企业会在不同的域名上托管相同的网站或类型变体。例如:
子域名。如果你可以在非www的URL和www子域名或任何其他子域名中加载相同的内容,那么这是重复的内容。例如:
顶级域名。不同的顶级域名也可以托管重复的内容。例如:
点击路径。通过不同的点击路径点击相同的子类别或产品页面可能会导致不同的URL,从而导致内容重复。例如:
格式。URL中使用大写或小写字母都显示相同的内容也会导致重复内容。例如:
单个页面的内容可能会产生数百个URL变体。例如,站点可以使用两个协议和两个子域,这将为同一页面创建四个URL,例如:
想象一下,如果一个网站具有上述所有常见的问题,以及其他未提及的问题,那么会存在多少重复页面。
5、结构化数据
每个页面或模板是否包含相关的结构化数据?
结构化数据将页面的相关性和组织结构传达给爬虫机器人。一些元素可以帮助搜索引擎理解页面,而其他因素(例如网站星级评分)可以生成丰富网页摘要以提高listing在搜索结果中的排名,从而吸引搜索者的注意力并增加点击次数。
你可以使用GoogleStructuredDataTestingTool进行验证。如上所示,该工具显示左侧页面的源代码和右侧的结构化数据,错误和警告将以橙色显示。如果Google使用了所有可能的丰富网页摘要功能,则点击绿色按钮可以预览搜索结果列表。
6、PDF优化
PDF文件是否可在网站上查看,并可下载?
说明手册、报告、产品功能和其他信息通常使用PDF格式。网站上通常会显示一个用于下载PDF文件的链接,虽然PDF文件是必要的,但这也会让你错过获得销售的机会。
PDF文件是可索引的,但对于特定关键词,搜索引擎倾向于为普通网页提供更高的排名。此外,PDF文件的搜索者无法导航到你的站点,因为PDF文件页面没有链接、电话号码或可提交的表格。
解决方案是优化PDF,通常是在站点导航中包含专用的“查看器”页面。
(编译/雨果网陈杰)
【特别声明】未经许可同意,任何个人或组织不得复制、转载、或以其他方式使用本网站内容。转载请联系:
上雨果网搜索“跨境资料库”,领取欧美/东南亚各国市场商机、各大平台热销品报告、跨境电商营销白皮书!