AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

99%网站都会存在重复内容——收下这份超全清单!

1895
2019-09-27 12:00
2019-09-27 12:00
1895

网站在切入SEO优化时,往往都是从站内技术问题整改开始,而在这其中,解决“重复内容”是尤为重要且常见的一点。可以毫不夸张的说,99%的网站都会遇到重复内容的问题,但很多人并未意识到它的出现。本文作为一个checklist,希望能帮助大家诊断和解决过多的重复内容页面,完成SEO优化之路的一个重要里程碑。


重复内容的后果

首先了解一下什么是重复内容?重复内容通常是指网站内部或跨域之间完全匹配或大致类似的有一定体量的内容。多数情况下,其成因并不具有欺骗性质,所以并不会导致网站遭受惩罚。


仅在极个别情况下,Google 才会认为重复内容的用意是操纵页面排名并欺骗用户,当此类情况出现时,Google才会对相应网站的索引和排名进行适当的调整。


网站出现大量重复内容,会对网站产生负面影响:

  • 浪费爬虫抓取配额:之前有文章提到过,搜索引擎爬虫花在一个网站上抓取页面的总时间是有限的。大量重复页面只会占用爬虫的抓取配额,导致一些真正重要的页面可能无法被抓取到。

  • 影响页面SERP的可见度:如果页面被搜索引擎识别为重复内容,搜索引擎为了提升用户的搜索体验,在SERP尽可能展现多样化的搜索结果,他会过滤掉一些重复内容,不让其出现在靠前排名结果中。

  • 稀释页面权重:如果一个页面可以通过多个URL访问,对于搜索引擎而言,页面权重是分散传递的,不利于聚合。


重复内容的类型

也许你的网站只是简单的CMS模板搭建,页面数量少,问题不多;也许你的网站拥有上百万个页面和多个目标国家市场,非常复杂;也许你使用的CMS功能限制,自定义程度很高。

无论网站是什么量级和特点,出现的重复内容问题都是类似的,可归类分析的,下文将为您详细介绍,可细想一下哪条你有中招?


Caused by站内技术问题

由于网站内部的技术问题导致大量的重复内容,最常见的就是网站上有多个不同的URL却显示相同的内容。


重复内容类型

  • 首页存在多个URL地址可同时访问,例如/,index.html,index.php。

  • 网站存在大小写不统一的URL,对于搜索引擎而言,大小写不同则意味着不同的页面。

  • 页面URL结尾的斜杠处理不一致,不统一。带与不带斜杠结尾也意味着不同的页面。

  • 网站存在多个Flash,iframe框架等内容的页面,但爬虫识别不了,抓取到的页面是一片空白,会被认为重复页面。

  • 多维度导航中的各个过滤项、排序、属性和参数等都对搜索引擎爬虫可见,网站上应用任意一个筛选条件都会生成一个新的页面,再在新的页面应用新的筛选条件就会继续生成更多的页面,这样最终生成的页面就无穷无尽,如果爬虫顺着这路径爬行下去,就会抓取到非常多的页面并容易陷入死循环出不来。CrossBorderDigital曾帮助客户解决过这个问题,SEO流量立马上涨了30%。

  • 网站内部链接带上了各种跟踪参数,例如GA的UTM参数。

  • 站内搜索的动态链接能被爬虫抓取并索引。如/search?keywords=XXX。

  • 网页的备用版本,例如可打印版本页面也被收录了。



Caused by内容策略不当

除了网站技术引发的重复,网站不恰当的内容策略也会引发此类问题,毕竟身处信息爆炸时代,内容生产和过期的速度都很快。

⭐对于拥有几百万页面的大型资讯站点,内容产出频率高,重复内容和内部竞争的问题很是上头。


重复内容类型

  • 发布许多类似的文章,或版本更新迭代的内容,即文章之间重复率较高。

  • 已被新内容替换的过时内容,但两者并未进行合并,保留了旧文章。

  • 内容过于单薄的页面,或是空白内容页面(文章内容为404无法找到,但页面返回200状态码)。此类页面会在Google Search Console中报告为Soft 404错误,同时被判断为重复页面。


互动问答环节

问:如果其他网站抄袭我们的内容,被动的产生重复内容,怎么办?


答:Google算法已经能很好的识别原创内容的网站,不用担心影响排名。您可以与该网站的站长联系,要求其移除相关内容。此外,也可根据《Digital Millennium Copyright Act》提交请求,以请求 Google 从搜索结果中移除涉嫌侵权的网页。



⭐如果拥有的是零售电商网站呢?网站以产品页面为主,博客文章只占少数,同样不可掉以轻心。



重复内容类型

  • 在不同的产品页面上传重复的客户评论。

  • 大量模板化的产品分类页面description,重复度高,缺少定制化。如下图:

图片
  • 空白的分类页面。例如经过产品调整,某些分类下已没有对应的产品,但站内仍有入口去到该空白页面。

  • 在分页页面中过多的使用重复内容片段。例如产品分类的各个分页页面顶部出现重复的描述内容最为常见。

  • 重复使用样板文字。例如电商网站成百上千的产品页面都重复显示运输、售后等具体条款。

  • 网站的产品文案或详情信息和eBay,Amazon等第三方平台展示的一样。

  • 网站信息直接挪用的供应商提供的原始材料,没有自定义修改。

  • 网站大量页面Title tag和Meta Description内容重复。例如某些B2B网站习惯在每个页面上都堆砌相同的产品关键词。

  • 通过不同的产品分类或促销活动等维度进入到产品页面,URL都是不同的。



Caused by服务器配置问题

如果网站服务器端配置出现错误,也有很大概率出现重复内容问题,但大多数网站运营者都很难意识到。


重复内容类型

  • 网站服务器运用SSL证书之后,http链接却没有重定向到安全协议https,即对搜索引擎而言,网站的所有页面数量*2。

  • www和non-www同时存在。

  • 在备用子域名上配置负载均衡(如www3.),或是IP层的负载均衡。

  • 测试站点页面被收录,导致和正式环境的网站页面形成重复。 



Caused by国际化/多域名的网站

如果你的网站面向国际市场,可能会运营不同的国家顶级域名或二级域名站点,那就需要将您网页的本地化版本告知 Google。


重复内容类型

  • 在针对不同目标市场的域名上发布相同或极度相似的内容。

  • 多语言网站没有正确部署<hreflang="lang">标签,或是没有翻译成本地语言,如果网页的主要内容未经翻译,则该网页的本地化版本仅会被视为重复网页。

  • 独立的移动端(例如二级域名m.crossborderdigital.com)和PC站之前没有做好canonical和alternate的双向注释。



如何诊断?

借助搜索引擎查询命令或是相关检查工具,发现并精准找到问题的原因,对我来说,这是SEO需要掌握的核心内容。为了帮助大家快速诊断网站,下面介绍了三种方式:


Google Search Console索引报告

最直接的方式就是在Google Search Console后台的“Coverage”报告中查看索引错误或被排除索引的问题链接列表,它会很清晰的显示你的网站因为什么原因而没有被索引,如下图所示:

图片


搜索引擎查询命令

查找重复内容的另一种简单方法是使用Google查询命令。只需从您的网站中复制一段文本内容,然后将其用双引号括起来即可在Google上进行搜索。

如果想知道网站被收录了多少页面,除了Google Search Console中的Valid URL数量,使用查询命令site:www.example.com也能得到网站页面索引数(取决于网站的规模,仅作为参考值)

图片


或是将下面的这几个查询命令结合起来使用,快速检测出属于重复内容的页面,事半功倍。

✅ site:www.example.com

    查询网站索引页面数


✅ site:www.example.com intitle:keyword

    查询网站所有包含keyword的页面


✅ site:www.example.com inurl:keyword

    查询网站所有URL包含keyword的页面


✅ site:www.example.com filetype:xml/txt/pdf

    查询网站包含这类资源格式的页面


模拟抓取工具

有需求就有市场,检测网站重复内容的工具越来越多,功能也越来越丰富。找到适合你的,才是最重要的。此处主要推荐模拟爬虫抓取工具,Screaming Frog作为市面上非常流行的模拟抓取工具,它可以帮助你迅速发现网站重复的title,description,h标签,url等信息,并批量导出报告,便于分析。当然,如果你正在使用同类型的抓取工具如Deepcrawl和Sitebulb,综合型SEO工具如Ahrefs和SEMRush,同样可行。

图片


如何优化

当你了解哪些属于重复内容,并且通过诊断精准定位了问题页面后,最重要的就是如何优化并解决重复内容,从而聚合页面权重,提高搜索引擎爬虫对网站的抓取效率,提升有效页面收录量。

设置301重定向

对搜索引擎来说,301重定向意味着永久改变地址,可以传递绝大部分页面权重和排名。

如果一个页面拥有多个URL入口,或是新旧版本文章内容更替等情况,建议整理出我们期望收录的规范化地址,设置其他页面做301重定向到规范化页面,聚合页面权重。


添加rel="canonical"

网站所有页面都应该添加rel="canonical" link 元素,帮助Google选择一个网址作为规范版本并抓取该网址,而将所有其他网址视为重复网址并降低对这些网址的抓取频率,聚合页面权重。


Canonical标签不像301重定向那样可以基本完全传递原来的权重,但大部分的权重还是可以聚合于首选的页面的,前提是标识的这两个页面内容需要相同或高度相似。如果要保留所有的已有的URL均能被正常访问且不好设置301重定向,那么可以使用这种折中方案。


Canonical注意事项:

1)   Canonical标签只是一个建议,并不是指令,所以搜索引擎会在很大程度上考虑这个标签,但并不是百分百遵守,搜索引擎还会考虑其他情况来判断规范化地址。

2)   标签需要使用绝对地址。(即URL需要带上http或https协议)

3)   Canonical指定的首选页面的内容,与其他使用这个标签的非规范化网址内容要完全相同或高度相似,否则很可能不起作用。使用301则没有这个限制。建议站长在使用canonical标签时要仔细检查,确认两个页面是完全相同的。即使页面高度相似,canonical标签被遵守的可能性也会降低。


添加Noindex标签

如果301重定向和Canonical标签都不方便设置,只希望搜索引擎不要收录那些重复页面,这种情况下可以在页面源代码中添加Noindex标签。禁止搜索引擎索引本页面,但允许蜘蛛继续抓取页面上的其他链接,也可以传递权重。如下:

<meta name=“robots” content=“noindex,follow”>


Robots.txt代表禁止抓取(但不影响索引),Noindex代表禁止索引(但不影响抓取),抓取和索引是不同的两个过程,但经验不足的人可能会倾向于阻止使用robots.txt来解决重复页面,属于治标不治本,最好将这些页面设置为noindex(或在不再需要时将其重定向)。例如网站存在一些内容缺失页面,或是网站内部搜索页面都不想被收录,可将这类页面添加Noindex标签,确认其从Google索引中去除后,再添加到robots.txt文件中,禁止爬虫抓取。

确保内链规范化

网站内部链接入口都应确保是规范化地址,即提高爬虫抓取效率,减少重复页面的抓取入口。例如首页导航的Home,网站Logo,面包屑中首页层级入口,都应统一为首选的URL。


尽量减少模板化内容

例如电商网站的各个产品页面不要显示重复的shipping,warranty等条款,建议只用锚文本添加内链即可,链接到能够提供详细信息的单独网页。同时还需要最大限度地减少相似内容,例如网站定期发布版本更新文档,建议考虑增加每个新版本文档的独特性内容,或将这些版本网页合并成一个。


坚持发布原创内容

如果公司同时运营多个平台,例如产品可能会在ebay,amazon和官网上同时售卖,建议保证官网能尽量做到发布原创内容,即网站产品和分类的描述内容尽可能做到单独定制化、可读性强,提高页面的长期竞争力。如果你的产品采购于供应商,那么更需要在供应商提供的产品详情信息上进行优化,避免和其他网站信息产生重复。

PS:如果网站产品SKU过多,内容更新的工作将十分漫长,难以推进,建议先从GA等分析工具中筛选出Top流量的产品页面,从重点品类入手。


保持网站URL稳定

如果可以,网站页面URL尽量不要轻易更改,因为保持URL稳定比在URL中不断填充新的关键词更为重要。时间一长,新旧URL更替容易产生404错误或其他重复问题。


避免网站内容被无条件引用

如果你运营的是一个咨询内容站点,网站拥有大量高质量文档,容易被竞争对手或其他平台所采集、引用等,建议在别人复制我们的网站内容时,设置自动添加网站版权信息和原始页面链接,确保我们内容的原创性。


免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
30年印度电商将达2500亿美元,四大原因助力其增长
AMZ123获悉,近日,德勤与谷歌联合发布《2500亿美元的商业前沿》报告,基于对印度电商市场的交易数据、消费者调研及行业专家访谈,深度解析了当地网购行为变迁、市场格局特征及未来增长动力。核心发现如下:一、电商市场概况(一)整体市场规模2025年,印度电商市场已扩张至900亿美元。尽管线下零售仍占据近90%的市场份额,但电商正在从根本上改变印度消费者发现和购买的方式。从2019年到2025年,约1.1亿新在线购物者的加入,推动了市场的持续扩张。展望2030年,印度在线零售市场预计将增长3倍,达到2500亿美元。届时,人均电商支出将从目前的350-380美元增长至625-650美元,几乎翻倍。
电商平台高度集中与利润承压,26年卖家经营策略大变
AMZ123获悉,近日,Marketplace Pulse发布了《2026年电商卖家销售现状报告》。从卖家运营现状、利润情况、经营模式、物流策略、AI应用以及未来挑战等多个维度,系统分析了全球181位卖家(合计超过20亿美元年收入)的经营状态与结构性变化。报告揭示了一个核心趋势:电商卖家正处于利润持续压缩与电商平台高度集中的阶段。在这种情况下,卖家的经营重点发生了变化,从过去追求规模增长,转向更加注重风险控制和优化业务结构。一、卖家运营现状数据显示,当前电商卖家平均运营2.83个平台,覆盖80个不同平台。其中,亚马逊以92.8%的占比处于绝对主导地位,几乎成为所有卖家的必选平台。
Q1印度电商市场同比增长25%,消费信心回暖
AMZ123获悉,近日,Flipkart与贝恩公司联合发布的《2026印度线上消费报告》显示,2026年第一季度,印度电商市场同比增长25%。报告指出,这一增长主要受宏观经济改善和政策支持带动,消费者信心回升成为关键推动因素。从全年趋势来看,印度电商市场在2025年已呈现恢复态势。报告显示,2025年电商销售额同比增长19%至21%,其中下半年增速达到22%至24%,约为上半年同比增速的1.5倍。与此同时,印度电商GMV(商品交易总额)在过去五年实现翻倍增长,2025年达到650亿至660亿美元规模。消费端结构也在发生变化。报告指出,新增用户主要来自Z世代、二线及以下城市以及中等收入家庭。
3月波兰电商平台排名:Temu用户数第一
AMZ123获悉,近日,根据最新的Mediapanel数据,2026年3月波兰电商市场的用户竞争格局出现明显变化,Temu以约1910万用户位居第一,超过了波兰本土电商平台Allegro的1850万用户。除Temu和Allegro外,进入前十的电商平台还包括Media Expert(1320万用户)、Empik(960万用户)、AliExpress(960万用户)、Erli(870万用户)、Shein(830万用户)、Rossmann(780万用户)、亚马逊(770万用户)以及Vinted(695万用户)。
国产AI伴侣玩具,在TikTok拿下百万GMV
根据央视新闻3月报道,在“世界超市”义乌,搭载人工智能技术的玩具正成为外贸出口的新爆款。这些“会说话”的玩具在欧美、东南亚等市场量价齐升,成为拉动义乌出口增长的新引擎。官方的数据披露为AI玩具撕下了“伪需求”的刻板印象,同时在TikTok美区,与之相关的市场需求也得到了更为直接的数据印证。在TikTok美区,中国品牌「Unee」用旗下炙手可热的AI毛绒伴侣玩具,书写着有关AI商业落地的又一叙事。01近千元的玩具,成TikTok爆款TT123观察到,近7天TikTok美区娃娃与毛绒玩具类目的销售额TOP4,由中国品牌「Unee」旗下的AI毛绒伴侣玩具摘下,数据显示,一周以来这款产品共卖出2.89万美元。
AMZ123会员专享丨4月第2周资讯汇总
亚马逊亚马逊与USPS达成新的包裹配送协议,双方长期合作关系得以延续。根据知情人士透露,在新协议下,USPS将保留约80%的亚马逊包裹配送业务,规模超过每年10亿件,这一结果明显好于此前市场预期的削减三分之二甚至更多业务量的情况。瑞银全球研究部发布最新报告显示,亚马逊印度计划在10至15个主要城市逐步关停4至24小时送达的生鲜配送服务Amazon Fresh,转而全力押注快速电商Amazon Now。据The Information报道,亚马逊在2026年Prime Day前对卖家价格规则进行调整,卖家必须确保所设商品标价与最近在亚马逊或其他品牌的实际购买价格相符,以防止出现误导性促销。
TikTok Shop马来斋月销售额同比增长超130%
AMZ123获悉,近日,根据TikTok Shop发布的数据,2026年斋月和开斋节期间,TikTok Shop实现显著增长。数据显示,今年节日期间TikTok Shop销售额同比增长超过130%,成为马来西亚本地电商市场中增长较快的平台之一。此次增长与TikTok Shop推出的扶持政策密切相关。TikTok Shop表示,其通过#JomLokal Booster激励计划投入了2000万林吉特(RM20 million),为卖家提供支持,同时持续加大在购物安全方面的投入。这一计划自2025年9月推出以来,已为超过5000家中小微企业提供佣金减免支持,并组织了14场培训工作坊,用于提升新卖家的运营能力。
宠物电商平台Chewy收购兽医平台Modern Animal
AMZ123获悉,近日,美国宠物电商平台Chewy宣布,已签署最终协议收购兽医服务平台Modern Animal。此次收购被视为Chewy向“全链路宠物医疗生态系统”转型的重要一步,旨在将医疗服务、电商和相关服务整合在宠物生命周期的各个环节中。根据披露,Modern Animal目前拥有29家自营诊所,提供7×24小时虚拟医疗服务,并采用高留存率的会员制模式。通过此次交易,Chewy预计将新增超过1.25亿美元的年化收入规模,同时将其线下宠物医疗网络规模从原有的18家门店快速扩大至47家,实现线下服务能力的即时扩张。
国产AI伴侣玩具,在TikTok拿下百万GMV
根据央视新闻3月报道,在“世界超市”义乌,搭载人工智能技术的玩具正成为外贸出口的新爆款。这些“会说话”的玩具在欧美、东南亚等市场量价齐升,成为拉动义乌出口增长的新引擎。官方的数据披露为AI玩具撕下了“伪需求”的刻板印象,同时在TikTok美区,与之相关的市场需求也得到了更为直接的数据印证。在TikTok美区,中国品牌「Unee」用旗下炙手可热的AI毛绒伴侣玩具,书写着有关AI商业落地的又一叙事。01近千元的玩具,成TikTok爆款TT123观察到,近7天TikTok美区娃娃与毛绒玩具类目的销售额TOP4,由中国品牌「Unee」旗下的AI毛绒伴侣玩具摘下,数据显示,一周以来这款产品共卖出2.89万美元。
宠物电商平台Chewy收购兽医平台Modern Animal
AMZ123获悉,近日,美国宠物电商平台Chewy宣布,已签署最终协议收购兽医服务平台Modern Animal。此次收购被视为Chewy向“全链路宠物医疗生态系统”转型的重要一步,旨在将医疗服务、电商和相关服务整合在宠物生命周期的各个环节中。根据披露,Modern Animal目前拥有29家自营诊所,提供7×24小时虚拟医疗服务,并采用高留存率的会员制模式。通过此次交易,Chewy预计将新增超过1.25亿美元的年化收入规模,同时将其线下宠物医疗网络规模从原有的18家门店快速扩大至47家,实现线下服务能力的即时扩张。
电商平台高度集中与利润承压,26年卖家经营策略大变
AMZ123获悉,近日,Marketplace Pulse发布了《2026年电商卖家销售现状报告》。从卖家运营现状、利润情况、经营模式、物流策略、AI应用以及未来挑战等多个维度,系统分析了全球181位卖家(合计超过20亿美元年收入)的经营状态与结构性变化。报告揭示了一个核心趋势:电商卖家正处于利润持续压缩与电商平台高度集中的阶段。在这种情况下,卖家的经营重点发生了变化,从过去追求规模增长,转向更加注重风险控制和优化业务结构。一、卖家运营现状数据显示,当前电商卖家平均运营2.83个平台,覆盖80个不同平台。其中,亚马逊以92.8%的占比处于绝对主导地位,几乎成为所有卖家的必选平台。
AMZ123会员专享丨4月第2周资讯汇总
亚马逊亚马逊与USPS达成新的包裹配送协议,双方长期合作关系得以延续。根据知情人士透露,在新协议下,USPS将保留约80%的亚马逊包裹配送业务,规模超过每年10亿件,这一结果明显好于此前市场预期的削减三分之二甚至更多业务量的情况。瑞银全球研究部发布最新报告显示,亚马逊印度计划在10至15个主要城市逐步关停4至24小时送达的生鲜配送服务Amazon Fresh,转而全力押注快速电商Amazon Now。据The Information报道,亚马逊在2026年Prime Day前对卖家价格规则进行调整,卖家必须确保所设商品标价与最近在亚马逊或其他品牌的实际购买价格相符,以防止出现误导性促销。
30年印度电商将达2500亿美元,四大原因助力其增长
AMZ123获悉,近日,德勤与谷歌联合发布《2500亿美元的商业前沿》报告,基于对印度电商市场的交易数据、消费者调研及行业专家访谈,深度解析了当地网购行为变迁、市场格局特征及未来增长动力。核心发现如下:一、电商市场概况(一)整体市场规模2025年,印度电商市场已扩张至900亿美元。尽管线下零售仍占据近90%的市场份额,但电商正在从根本上改变印度消费者发现和购买的方式。从2019年到2025年,约1.1亿新在线购物者的加入,推动了市场的持续扩张。展望2030年,印度在线零售市场预计将增长3倍,达到2500亿美元。届时,人均电商支出将从目前的350-380美元增长至625-650美元,几乎翻倍。
3月波兰电商平台排名:Temu用户数第一
AMZ123获悉,近日,根据最新的Mediapanel数据,2026年3月波兰电商市场的用户竞争格局出现明显变化,Temu以约1910万用户位居第一,超过了波兰本土电商平台Allegro的1850万用户。除Temu和Allegro外,进入前十的电商平台还包括Media Expert(1320万用户)、Empik(960万用户)、AliExpress(960万用户)、Erli(870万用户)、Shein(830万用户)、Rossmann(780万用户)、亚马逊(770万用户)以及Vinted(695万用户)。
Q1印度电商市场同比增长25%,消费信心回暖
AMZ123获悉,近日,Flipkart与贝恩公司联合发布的《2026印度线上消费报告》显示,2026年第一季度,印度电商市场同比增长25%。报告指出,这一增长主要受宏观经济改善和政策支持带动,消费者信心回升成为关键推动因素。从全年趋势来看,印度电商市场在2025年已呈现恢复态势。报告显示,2025年电商销售额同比增长19%至21%,其中下半年增速达到22%至24%,约为上半年同比增速的1.5倍。与此同时,印度电商GMV(商品交易总额)在过去五年实现翻倍增长,2025年达到650亿至660亿美元规模。消费端结构也在发生变化。报告指出,新增用户主要来自Z世代、二线及以下城市以及中等收入家庭。
TikTok Shop马来斋月销售额同比增长超130%
AMZ123获悉,近日,根据TikTok Shop发布的数据,2026年斋月和开斋节期间,TikTok Shop实现显著增长。数据显示,今年节日期间TikTok Shop销售额同比增长超过130%,成为马来西亚本地电商市场中增长较快的平台之一。此次增长与TikTok Shop推出的扶持政策密切相关。TikTok Shop表示,其通过#JomLokal Booster激励计划投入了2000万林吉特(RM20 million),为卖家提供支持,同时持续加大在购物安全方面的投入。这一计划自2025年9月推出以来,已为超过5000家中小微企业提供佣金减免支持,并组织了14场培训工作坊,用于提升新卖家的运营能力。
《全球产业深度研究之清真经济专题》PDF下载
印度尼西亚是全球最大清真消费市场,规模达到2650亿美元;马来西亚是全球认证标准输出中心;沙特阿拉伯是GCC(海湾阿拉伯国家合作委员会)具有战略价值的清真枢纽。这三个国家形成了清真消费三大市场占比60%。
《TikTok Shop2026欧美运动户外类目报告》PDF下载
欧美市场总GMV为15.11亿,整体结构呈现极度集中化的特征,其中美国站点的GMV高达12.32亿,占据了欧美市场的81.52%,月均GMV超过1.02亿。英国站点以 2.40亿的GMV和15.89%的份额位居第二。两大站点贡献了市场总GMV的97%以上。
《TikTok Shop2026东南亚运动户外类目报告》PDF下载
作为东南亚各站点的支柱品类,运动户外凭借其深厚的消费群体基础与高社交属性,相比其他品类规模优势显著,并在近12个月继续保持强劲增长。近一年内,东南亚地区该品类总GMV逼近百亿美元,其中泰国站表现尤为突出,GMV突破4.7亿美元;马印尼站紧随其后,GMV近4亿美元。
《2026中国新能源智能汽车产业链出海研究报告》PDF下载
海外主要汽车市场的国家/地区政策出现分化:以德国、意大利为代表的欧洲主要汽车生产国,携其本土汽车产业巨头,共同构成了推动欧盟调整“禁燃令”的主导力量。从本质上看,此次政策调整的进程,折射出欧盟内部不同国家与产业利益集团之间的复杂博弈。泰国、马来西亚和巴西现阶段开始偏好汽车产能的实际落地希望引入长期资本以支持当地的经济发展。
《2026中国电动微出行出海欧美市场研究报告》PDF下载
动微出行的产品开发逻辑向车规级演进:行业技术架构正加速向机械一电驱一智控体系演进,提升产品研发、安全标准与供应链体系。未来竞争的核心不再是单一的续航或功率参数,而是平台化能力、智能化深度与全生命周期服务体系的构建。
《TikTok Shop突破末次触达归因(LTA)ROAS分析报告》PDF下载
在数字化浪潮中,广告主正面临有效衡量广告支出回报率(ROAS)的挑战。传统未次触达归因(LTA)模型因数据收集难度和归因偏差问题已难以满足广告主的需求,因此,探索新的方法来解决这些问题显得尤为重要。
《未来电商报告:品牌独立站五步升级锁定未来确定性增长》PDF下载
调研显示,出海商家针对家居、时尚及消费电子等品类布局比例均超过30%。独立站凭借其高度品牌化、个性化、场景化及功能性等优势,精准契合上述品类对品牌调性、场景交互及沉浸式体验的核心诉求,正成为商家黑五大促期提升销量、构建品牌竞争壁垒的关键载体。
《TikTok Shop达人真实种草力报告》PDF下载
达人正在将文化内容、社群互动与商业转化深度融合,形成一个高度协同的内容商业生态,其价值早已不再局限于内容带来的直接收入。从更广义的商业视角来看,达人价值的核心在于真实影响力-即其内容对商品与服务产生影响并促成转化所形成的整体商业价值,这一能力正构成达人在内容电商体系中的带货价值基础。
AMZ123选品观察员
选品推荐及选品技巧分享。
跨境学院
跨境电商大小事,尽在跨境学院。
AMZ123卖家导航
这个人很懒,还没有自我介绍
跨境电商赢商荟
跨境电商行业唯一一家一年365天不断更的媒体!
AMZ123跨境电商
专注跨境行业热点事件报道,每日坚持推送原创深度热文
AMZ123会员
「AMZ123会员」为出海者推出的一站式私享服务
跨境数据中心
聚合海量跨境数据,输出跨境研究智慧。
跨境电商干货集结
跨境电商干货集结,是结合亚马逊跨境电商卖家交流群内大家在交流过程中最常遇到的问题,进行收集整理,汇总解答,将会持续更新大家当前最常遇见的问题。欢迎大家加入跨境电商干货集结卖家交流群一起探讨。
首页
跨境头条
文章详情
99%网站都会存在重复内容——收下这份超全清单!
CrossBorder
2019-09-27 12:00
1894

网站在切入SEO优化时,往往都是从站内技术问题整改开始,而在这其中,解决“重复内容”是尤为重要且常见的一点。可以毫不夸张的说,99%的网站都会遇到重复内容的问题,但很多人并未意识到它的出现。本文作为一个checklist,希望能帮助大家诊断和解决过多的重复内容页面,完成SEO优化之路的一个重要里程碑。


重复内容的后果

首先了解一下什么是重复内容?重复内容通常是指网站内部或跨域之间完全匹配或大致类似的有一定体量的内容。多数情况下,其成因并不具有欺骗性质,所以并不会导致网站遭受惩罚。


仅在极个别情况下,Google 才会认为重复内容的用意是操纵页面排名并欺骗用户,当此类情况出现时,Google才会对相应网站的索引和排名进行适当的调整。


网站出现大量重复内容,会对网站产生负面影响:

  • 浪费爬虫抓取配额:之前有文章提到过,搜索引擎爬虫花在一个网站上抓取页面的总时间是有限的。大量重复页面只会占用爬虫的抓取配额,导致一些真正重要的页面可能无法被抓取到。

  • 影响页面SERP的可见度:如果页面被搜索引擎识别为重复内容,搜索引擎为了提升用户的搜索体验,在SERP尽可能展现多样化的搜索结果,他会过滤掉一些重复内容,不让其出现在靠前排名结果中。

  • 稀释页面权重:如果一个页面可以通过多个URL访问,对于搜索引擎而言,页面权重是分散传递的,不利于聚合。


重复内容的类型

也许你的网站只是简单的CMS模板搭建,页面数量少,问题不多;也许你的网站拥有上百万个页面和多个目标国家市场,非常复杂;也许你使用的CMS功能限制,自定义程度很高。

无论网站是什么量级和特点,出现的重复内容问题都是类似的,可归类分析的,下文将为您详细介绍,可细想一下哪条你有中招?


Caused by站内技术问题

由于网站内部的技术问题导致大量的重复内容,最常见的就是网站上有多个不同的URL却显示相同的内容。


重复内容类型

  • 首页存在多个URL地址可同时访问,例如/,index.html,index.php。

  • 网站存在大小写不统一的URL,对于搜索引擎而言,大小写不同则意味着不同的页面。

  • 页面URL结尾的斜杠处理不一致,不统一。带与不带斜杠结尾也意味着不同的页面。

  • 网站存在多个Flash,iframe框架等内容的页面,但爬虫识别不了,抓取到的页面是一片空白,会被认为重复页面。

  • 多维度导航中的各个过滤项、排序、属性和参数等都对搜索引擎爬虫可见,网站上应用任意一个筛选条件都会生成一个新的页面,再在新的页面应用新的筛选条件就会继续生成更多的页面,这样最终生成的页面就无穷无尽,如果爬虫顺着这路径爬行下去,就会抓取到非常多的页面并容易陷入死循环出不来。CrossBorderDigital曾帮助客户解决过这个问题,SEO流量立马上涨了30%。

  • 网站内部链接带上了各种跟踪参数,例如GA的UTM参数。

  • 站内搜索的动态链接能被爬虫抓取并索引。如/search?keywords=XXX。

  • 网页的备用版本,例如可打印版本页面也被收录了。



Caused by内容策略不当

除了网站技术引发的重复,网站不恰当的内容策略也会引发此类问题,毕竟身处信息爆炸时代,内容生产和过期的速度都很快。

⭐对于拥有几百万页面的大型资讯站点,内容产出频率高,重复内容和内部竞争的问题很是上头。


重复内容类型

  • 发布许多类似的文章,或版本更新迭代的内容,即文章之间重复率较高。

  • 已被新内容替换的过时内容,但两者并未进行合并,保留了旧文章。

  • 内容过于单薄的页面,或是空白内容页面(文章内容为404无法找到,但页面返回200状态码)。此类页面会在Google Search Console中报告为Soft 404错误,同时被判断为重复页面。


互动问答环节

问:如果其他网站抄袭我们的内容,被动的产生重复内容,怎么办?


答:Google算法已经能很好的识别原创内容的网站,不用担心影响排名。您可以与该网站的站长联系,要求其移除相关内容。此外,也可根据《Digital Millennium Copyright Act》提交请求,以请求 Google 从搜索结果中移除涉嫌侵权的网页。



⭐如果拥有的是零售电商网站呢?网站以产品页面为主,博客文章只占少数,同样不可掉以轻心。



重复内容类型

  • 在不同的产品页面上传重复的客户评论。

  • 大量模板化的产品分类页面description,重复度高,缺少定制化。如下图:

图片
  • 空白的分类页面。例如经过产品调整,某些分类下已没有对应的产品,但站内仍有入口去到该空白页面。

  • 在分页页面中过多的使用重复内容片段。例如产品分类的各个分页页面顶部出现重复的描述内容最为常见。

  • 重复使用样板文字。例如电商网站成百上千的产品页面都重复显示运输、售后等具体条款。

  • 网站的产品文案或详情信息和eBay,Amazon等第三方平台展示的一样。

  • 网站信息直接挪用的供应商提供的原始材料,没有自定义修改。

  • 网站大量页面Title tag和Meta Description内容重复。例如某些B2B网站习惯在每个页面上都堆砌相同的产品关键词。

  • 通过不同的产品分类或促销活动等维度进入到产品页面,URL都是不同的。



Caused by服务器配置问题

如果网站服务器端配置出现错误,也有很大概率出现重复内容问题,但大多数网站运营者都很难意识到。


重复内容类型

  • 网站服务器运用SSL证书之后,http链接却没有重定向到安全协议https,即对搜索引擎而言,网站的所有页面数量*2。

  • www和non-www同时存在。

  • 在备用子域名上配置负载均衡(如www3.),或是IP层的负载均衡。

  • 测试站点页面被收录,导致和正式环境的网站页面形成重复。 



Caused by国际化/多域名的网站

如果你的网站面向国际市场,可能会运营不同的国家顶级域名或二级域名站点,那就需要将您网页的本地化版本告知 Google。


重复内容类型

  • 在针对不同目标市场的域名上发布相同或极度相似的内容。

  • 多语言网站没有正确部署<hreflang="lang">标签,或是没有翻译成本地语言,如果网页的主要内容未经翻译,则该网页的本地化版本仅会被视为重复网页。

  • 独立的移动端(例如二级域名m.crossborderdigital.com)和PC站之前没有做好canonical和alternate的双向注释。



如何诊断?

借助搜索引擎查询命令或是相关检查工具,发现并精准找到问题的原因,对我来说,这是SEO需要掌握的核心内容。为了帮助大家快速诊断网站,下面介绍了三种方式:


Google Search Console索引报告

最直接的方式就是在Google Search Console后台的“Coverage”报告中查看索引错误或被排除索引的问题链接列表,它会很清晰的显示你的网站因为什么原因而没有被索引,如下图所示:

图片


搜索引擎查询命令

查找重复内容的另一种简单方法是使用Google查询命令。只需从您的网站中复制一段文本内容,然后将其用双引号括起来即可在Google上进行搜索。

如果想知道网站被收录了多少页面,除了Google Search Console中的Valid URL数量,使用查询命令site:www.example.com也能得到网站页面索引数(取决于网站的规模,仅作为参考值)

图片


或是将下面的这几个查询命令结合起来使用,快速检测出属于重复内容的页面,事半功倍。

✅ site:www.example.com

    查询网站索引页面数


✅ site:www.example.com intitle:keyword

    查询网站所有包含keyword的页面


✅ site:www.example.com inurl:keyword

    查询网站所有URL包含keyword的页面


✅ site:www.example.com filetype:xml/txt/pdf

    查询网站包含这类资源格式的页面


模拟抓取工具

有需求就有市场,检测网站重复内容的工具越来越多,功能也越来越丰富。找到适合你的,才是最重要的。此处主要推荐模拟爬虫抓取工具,Screaming Frog作为市面上非常流行的模拟抓取工具,它可以帮助你迅速发现网站重复的title,description,h标签,url等信息,并批量导出报告,便于分析。当然,如果你正在使用同类型的抓取工具如Deepcrawl和Sitebulb,综合型SEO工具如Ahrefs和SEMRush,同样可行。

图片


如何优化

当你了解哪些属于重复内容,并且通过诊断精准定位了问题页面后,最重要的就是如何优化并解决重复内容,从而聚合页面权重,提高搜索引擎爬虫对网站的抓取效率,提升有效页面收录量。

设置301重定向

对搜索引擎来说,301重定向意味着永久改变地址,可以传递绝大部分页面权重和排名。

如果一个页面拥有多个URL入口,或是新旧版本文章内容更替等情况,建议整理出我们期望收录的规范化地址,设置其他页面做301重定向到规范化页面,聚合页面权重。


添加rel="canonical"

网站所有页面都应该添加rel="canonical" link 元素,帮助Google选择一个网址作为规范版本并抓取该网址,而将所有其他网址视为重复网址并降低对这些网址的抓取频率,聚合页面权重。


Canonical标签不像301重定向那样可以基本完全传递原来的权重,但大部分的权重还是可以聚合于首选的页面的,前提是标识的这两个页面内容需要相同或高度相似。如果要保留所有的已有的URL均能被正常访问且不好设置301重定向,那么可以使用这种折中方案。


Canonical注意事项:

1)   Canonical标签只是一个建议,并不是指令,所以搜索引擎会在很大程度上考虑这个标签,但并不是百分百遵守,搜索引擎还会考虑其他情况来判断规范化地址。

2)   标签需要使用绝对地址。(即URL需要带上http或https协议)

3)   Canonical指定的首选页面的内容,与其他使用这个标签的非规范化网址内容要完全相同或高度相似,否则很可能不起作用。使用301则没有这个限制。建议站长在使用canonical标签时要仔细检查,确认两个页面是完全相同的。即使页面高度相似,canonical标签被遵守的可能性也会降低。


添加Noindex标签

如果301重定向和Canonical标签都不方便设置,只希望搜索引擎不要收录那些重复页面,这种情况下可以在页面源代码中添加Noindex标签。禁止搜索引擎索引本页面,但允许蜘蛛继续抓取页面上的其他链接,也可以传递权重。如下:

<meta name=“robots” content=“noindex,follow”>


Robots.txt代表禁止抓取(但不影响索引),Noindex代表禁止索引(但不影响抓取),抓取和索引是不同的两个过程,但经验不足的人可能会倾向于阻止使用robots.txt来解决重复页面,属于治标不治本,最好将这些页面设置为noindex(或在不再需要时将其重定向)。例如网站存在一些内容缺失页面,或是网站内部搜索页面都不想被收录,可将这类页面添加Noindex标签,确认其从Google索引中去除后,再添加到robots.txt文件中,禁止爬虫抓取。

确保内链规范化

网站内部链接入口都应确保是规范化地址,即提高爬虫抓取效率,减少重复页面的抓取入口。例如首页导航的Home,网站Logo,面包屑中首页层级入口,都应统一为首选的URL。


尽量减少模板化内容

例如电商网站的各个产品页面不要显示重复的shipping,warranty等条款,建议只用锚文本添加内链即可,链接到能够提供详细信息的单独网页。同时还需要最大限度地减少相似内容,例如网站定期发布版本更新文档,建议考虑增加每个新版本文档的独特性内容,或将这些版本网页合并成一个。


坚持发布原创内容

如果公司同时运营多个平台,例如产品可能会在ebay,amazon和官网上同时售卖,建议保证官网能尽量做到发布原创内容,即网站产品和分类的描述内容尽可能做到单独定制化、可读性强,提高页面的长期竞争力。如果你的产品采购于供应商,那么更需要在供应商提供的产品详情信息上进行优化,避免和其他网站信息产生重复。

PS:如果网站产品SKU过多,内容更新的工作将十分漫长,难以推进,建议先从GA等分析工具中筛选出Top流量的产品页面,从重点品类入手。


保持网站URL稳定

如果可以,网站页面URL尽量不要轻易更改,因为保持URL稳定比在URL中不断填充新的关键词更为重要。时间一长,新旧URL更替容易产生404错误或其他重复问题。


避免网站内容被无条件引用

如果你运营的是一个咨询内容站点,网站拥有大量高质量文档,容易被竞争对手或其他平台所采集、引用等,建议在别人复制我们的网站内容时,设置自动添加网站版权信息和原始页面链接,确保我们内容的原创性。


咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部