AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

99%网站都会存在重复内容——收下这份超全清单!

1662
2019-09-27 12:00
2019-09-27 12:00
1662

网站在切入SEO优化时,往往都是从站内技术问题整改开始,而在这其中,解决“重复内容”是尤为重要且常见的一点。可以毫不夸张的说,99%的网站都会遇到重复内容的问题,但很多人并未意识到它的出现。本文作为一个checklist,希望能帮助大家诊断和解决过多的重复内容页面,完成SEO优化之路的一个重要里程碑。


重复内容的后果

首先了解一下什么是重复内容?重复内容通常是指网站内部或跨域之间完全匹配或大致类似的有一定体量的内容。多数情况下,其成因并不具有欺骗性质,所以并不会导致网站遭受惩罚。


仅在极个别情况下,Google 才会认为重复内容的用意是操纵页面排名并欺骗用户,当此类情况出现时,Google才会对相应网站的索引和排名进行适当的调整。


网站出现大量重复内容,会对网站产生负面影响:

  • 浪费爬虫抓取配额:之前有文章提到过,搜索引擎爬虫花在一个网站上抓取页面的总时间是有限的。大量重复页面只会占用爬虫的抓取配额,导致一些真正重要的页面可能无法被抓取到。

  • 影响页面SERP的可见度:如果页面被搜索引擎识别为重复内容,搜索引擎为了提升用户的搜索体验,在SERP尽可能展现多样化的搜索结果,他会过滤掉一些重复内容,不让其出现在靠前排名结果中。

  • 稀释页面权重:如果一个页面可以通过多个URL访问,对于搜索引擎而言,页面权重是分散传递的,不利于聚合。


重复内容的类型

也许你的网站只是简单的CMS模板搭建,页面数量少,问题不多;也许你的网站拥有上百万个页面和多个目标国家市场,非常复杂;也许你使用的CMS功能限制,自定义程度很高。

无论网站是什么量级和特点,出现的重复内容问题都是类似的,可归类分析的,下文将为您详细介绍,可细想一下哪条你有中招?


Caused by站内技术问题

由于网站内部的技术问题导致大量的重复内容,最常见的就是网站上有多个不同的URL却显示相同的内容。


重复内容类型

  • 首页存在多个URL地址可同时访问,例如/,index.html,index.php。

  • 网站存在大小写不统一的URL,对于搜索引擎而言,大小写不同则意味着不同的页面。

  • 页面URL结尾的斜杠处理不一致,不统一。带与不带斜杠结尾也意味着不同的页面。

  • 网站存在多个Flash,iframe框架等内容的页面,但爬虫识别不了,抓取到的页面是一片空白,会被认为重复页面。

  • 多维度导航中的各个过滤项、排序、属性和参数等都对搜索引擎爬虫可见,网站上应用任意一个筛选条件都会生成一个新的页面,再在新的页面应用新的筛选条件就会继续生成更多的页面,这样最终生成的页面就无穷无尽,如果爬虫顺着这路径爬行下去,就会抓取到非常多的页面并容易陷入死循环出不来。CrossBorderDigital曾帮助客户解决过这个问题,SEO流量立马上涨了30%。

  • 网站内部链接带上了各种跟踪参数,例如GA的UTM参数。

  • 站内搜索的动态链接能被爬虫抓取并索引。如/search?keywords=XXX。

  • 网页的备用版本,例如可打印版本页面也被收录了。



Caused by内容策略不当

除了网站技术引发的重复,网站不恰当的内容策略也会引发此类问题,毕竟身处信息爆炸时代,内容生产和过期的速度都很快。

⭐对于拥有几百万页面的大型资讯站点,内容产出频率高,重复内容和内部竞争的问题很是上头。


重复内容类型

  • 发布许多类似的文章,或版本更新迭代的内容,即文章之间重复率较高。

  • 已被新内容替换的过时内容,但两者并未进行合并,保留了旧文章。

  • 内容过于单薄的页面,或是空白内容页面(文章内容为404无法找到,但页面返回200状态码)。此类页面会在Google Search Console中报告为Soft 404错误,同时被判断为重复页面。


互动问答环节

问:如果其他网站抄袭我们的内容,被动的产生重复内容,怎么办?


答:Google算法已经能很好的识别原创内容的网站,不用担心影响排名。您可以与该网站的站长联系,要求其移除相关内容。此外,也可根据《Digital Millennium Copyright Act》提交请求,以请求 Google 从搜索结果中移除涉嫌侵权的网页。



⭐如果拥有的是零售电商网站呢?网站以产品页面为主,博客文章只占少数,同样不可掉以轻心。



重复内容类型

  • 在不同的产品页面上传重复的客户评论。

  • 大量模板化的产品分类页面description,重复度高,缺少定制化。如下图:

图片
  • 空白的分类页面。例如经过产品调整,某些分类下已没有对应的产品,但站内仍有入口去到该空白页面。

  • 在分页页面中过多的使用重复内容片段。例如产品分类的各个分页页面顶部出现重复的描述内容最为常见。

  • 重复使用样板文字。例如电商网站成百上千的产品页面都重复显示运输、售后等具体条款。

  • 网站的产品文案或详情信息和eBay,Amazon等第三方平台展示的一样。

  • 网站信息直接挪用的供应商提供的原始材料,没有自定义修改。

  • 网站大量页面Title tag和Meta Description内容重复。例如某些B2B网站习惯在每个页面上都堆砌相同的产品关键词。

  • 通过不同的产品分类或促销活动等维度进入到产品页面,URL都是不同的。



Caused by服务器配置问题

如果网站服务器端配置出现错误,也有很大概率出现重复内容问题,但大多数网站运营者都很难意识到。


重复内容类型

  • 网站服务器运用SSL证书之后,http链接却没有重定向到安全协议https,即对搜索引擎而言,网站的所有页面数量*2。

  • www和non-www同时存在。

  • 在备用子域名上配置负载均衡(如www3.),或是IP层的负载均衡。

  • 测试站点页面被收录,导致和正式环境的网站页面形成重复。 



Caused by国际化/多域名的网站

如果你的网站面向国际市场,可能会运营不同的国家顶级域名或二级域名站点,那就需要将您网页的本地化版本告知 Google。


重复内容类型

  • 在针对不同目标市场的域名上发布相同或极度相似的内容。

  • 多语言网站没有正确部署<hreflang="lang">标签,或是没有翻译成本地语言,如果网页的主要内容未经翻译,则该网页的本地化版本仅会被视为重复网页。

  • 独立的移动端(例如二级域名m.crossborderdigital.com)和PC站之前没有做好canonical和alternate的双向注释。



如何诊断?

借助搜索引擎查询命令或是相关检查工具,发现并精准找到问题的原因,对我来说,这是SEO需要掌握的核心内容。为了帮助大家快速诊断网站,下面介绍了三种方式:


Google Search Console索引报告

最直接的方式就是在Google Search Console后台的“Coverage”报告中查看索引错误或被排除索引的问题链接列表,它会很清晰的显示你的网站因为什么原因而没有被索引,如下图所示:

图片


搜索引擎查询命令

查找重复内容的另一种简单方法是使用Google查询命令。只需从您的网站中复制一段文本内容,然后将其用双引号括起来即可在Google上进行搜索。

如果想知道网站被收录了多少页面,除了Google Search Console中的Valid URL数量,使用查询命令site:www.example.com也能得到网站页面索引数(取决于网站的规模,仅作为参考值)

图片


或是将下面的这几个查询命令结合起来使用,快速检测出属于重复内容的页面,事半功倍。

✅ site:www.example.com

    查询网站索引页面数


✅ site:www.example.com intitle:keyword

    查询网站所有包含keyword的页面


✅ site:www.example.com inurl:keyword

    查询网站所有URL包含keyword的页面


✅ site:www.example.com filetype:xml/txt/pdf

    查询网站包含这类资源格式的页面


模拟抓取工具

有需求就有市场,检测网站重复内容的工具越来越多,功能也越来越丰富。找到适合你的,才是最重要的。此处主要推荐模拟爬虫抓取工具,Screaming Frog作为市面上非常流行的模拟抓取工具,它可以帮助你迅速发现网站重复的title,description,h标签,url等信息,并批量导出报告,便于分析。当然,如果你正在使用同类型的抓取工具如Deepcrawl和Sitebulb,综合型SEO工具如Ahrefs和SEMRush,同样可行。

图片


如何优化

当你了解哪些属于重复内容,并且通过诊断精准定位了问题页面后,最重要的就是如何优化并解决重复内容,从而聚合页面权重,提高搜索引擎爬虫对网站的抓取效率,提升有效页面收录量。

设置301重定向

对搜索引擎来说,301重定向意味着永久改变地址,可以传递绝大部分页面权重和排名。

如果一个页面拥有多个URL入口,或是新旧版本文章内容更替等情况,建议整理出我们期望收录的规范化地址,设置其他页面做301重定向到规范化页面,聚合页面权重。


添加rel="canonical"

网站所有页面都应该添加rel="canonical" link 元素,帮助Google选择一个网址作为规范版本并抓取该网址,而将所有其他网址视为重复网址并降低对这些网址的抓取频率,聚合页面权重。


Canonical标签不像301重定向那样可以基本完全传递原来的权重,但大部分的权重还是可以聚合于首选的页面的,前提是标识的这两个页面内容需要相同或高度相似。如果要保留所有的已有的URL均能被正常访问且不好设置301重定向,那么可以使用这种折中方案。


Canonical注意事项:

1)   Canonical标签只是一个建议,并不是指令,所以搜索引擎会在很大程度上考虑这个标签,但并不是百分百遵守,搜索引擎还会考虑其他情况来判断规范化地址。

2)   标签需要使用绝对地址。(即URL需要带上http或https协议)

3)   Canonical指定的首选页面的内容,与其他使用这个标签的非规范化网址内容要完全相同或高度相似,否则很可能不起作用。使用301则没有这个限制。建议站长在使用canonical标签时要仔细检查,确认两个页面是完全相同的。即使页面高度相似,canonical标签被遵守的可能性也会降低。


添加Noindex标签

如果301重定向和Canonical标签都不方便设置,只希望搜索引擎不要收录那些重复页面,这种情况下可以在页面源代码中添加Noindex标签。禁止搜索引擎索引本页面,但允许蜘蛛继续抓取页面上的其他链接,也可以传递权重。如下:

<meta name=“robots” content=“noindex,follow”>


Robots.txt代表禁止抓取(但不影响索引),Noindex代表禁止索引(但不影响抓取),抓取和索引是不同的两个过程,但经验不足的人可能会倾向于阻止使用robots.txt来解决重复页面,属于治标不治本,最好将这些页面设置为noindex(或在不再需要时将其重定向)。例如网站存在一些内容缺失页面,或是网站内部搜索页面都不想被收录,可将这类页面添加Noindex标签,确认其从Google索引中去除后,再添加到robots.txt文件中,禁止爬虫抓取。

确保内链规范化

网站内部链接入口都应确保是规范化地址,即提高爬虫抓取效率,减少重复页面的抓取入口。例如首页导航的Home,网站Logo,面包屑中首页层级入口,都应统一为首选的URL。


尽量减少模板化内容

例如电商网站的各个产品页面不要显示重复的shipping,warranty等条款,建议只用锚文本添加内链即可,链接到能够提供详细信息的单独网页。同时还需要最大限度地减少相似内容,例如网站定期发布版本更新文档,建议考虑增加每个新版本文档的独特性内容,或将这些版本网页合并成一个。


坚持发布原创内容

如果公司同时运营多个平台,例如产品可能会在ebay,amazon和官网上同时售卖,建议保证官网能尽量做到发布原创内容,即网站产品和分类的描述内容尽可能做到单独定制化、可读性强,提高页面的长期竞争力。如果你的产品采购于供应商,那么更需要在供应商提供的产品详情信息上进行优化,避免和其他网站信息产生重复。

PS:如果网站产品SKU过多,内容更新的工作将十分漫长,难以推进,建议先从GA等分析工具中筛选出Top流量的产品页面,从重点品类入手。


保持网站URL稳定

如果可以,网站页面URL尽量不要轻易更改,因为保持URL稳定比在URL中不断填充新的关键词更为重要。时间一长,新旧URL更替容易产生404错误或其他重复问题。


避免网站内容被无条件引用

如果你运营的是一个咨询内容站点,网站拥有大量高质量文档,容易被竞争对手或其他平台所采集、引用等,建议在别人复制我们的网站内容时,设置自动添加网站版权信息和原始页面链接,确保我们内容的原创性。


免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
Stripe正考虑收购PayPal全部或部分业务
Fin123获悉,近日,据路透社最新报道,支付公司Stripe正在考虑收购PayPal的全部或部分业务。相关讨论仍处于初步阶段,尚未确定是否会达成交易。双方公司均拒绝就此发表评论。受报道影响,PayPal股价当天收盘上涨近7%。根据LSEG数据,PayPal当前市值超过400亿美元。不过,从整体走势来看,PayPal股价今年以来已累计下跌超过19%,仅2025年全年跌幅就接近三分之一。Stripe是一家未上市金融科技公司。2月24日,Stripe完成面向员工和股东的二次股票出售交易,最新估值达到1590亿美元,较此前915亿美元的估值大幅提升。
Etsy公布25财年财报:营收28.84亿美元,同比增长2.7%
AMZ123获悉,近日,Etsy发布截至2025年12月31日的2025财年第四季度及全年财报。Etsy平台在第四季度实现GMS(商品交易总额)同比小幅增长,并预计2026财年全年GMS将恢复增长。以下为Q4财务亮点:①GMS为35.93亿美元,同比下降3.8%;若剔除已出售Reverb业务对上年同期的影响,同比增长2.4%。②营收为8.82亿美元,同比增长3.5%;若剔除Reverb影响,同比增长6.6%。③收入抽成率(Take Rate)为24.5%,同比提升170个基点。④市场收入为6.12亿美元,同比增长0.8%。⑤服务收入为2.69亿美元,同比增长9.9%。⑥毛利润为6.44亿美元,同比增长1.5%。
28天进账620w+!跨境卖家靠瑜伽服赚麻了
TikTok爆卖10万单,这件运动单品被美国人疯抢!
同比大增76.85%,影石创新年营收将达百亿!
AMZ123获悉,2月中旬,影石创新发布2025年度业绩快报,在上市首年交出了一份“增收不增利”的成绩单。据其公告,2025年影石创新实现营业收入 98.58亿元,同比大幅增长76.85%;实现归母净利润 9.64亿元,同比降低3.08%;扣非净利润 8.82亿元,同比降低6.74%。业绩数据显示,报告期内影石创新营业收入同比增长76.85%,主要得益于市场开拓力度加大、新品迭代加快以及线上线下渠道协同发力,销售规模稳步扩大。然而,与营收高增长形成反差的是,公司净利润表现未能同步。
5家估值超10亿美元!XbotPark累计孵化超30家公司
品牌方舟获悉,据媒体报道,2月24日,在广州召开的广东省高质量发展大会上,XbotPark机器人基地发起人李泽湘分享了一组关于制造业转型的调研观察。2025年底,他所在的团队走访了广东省内17家制造企业,发现普遍存在“毛利率低、人均产值低、规模小”的困境。在他看来,传统制造面临“转型还是转移”的选择题,而转型的真正痛点在于产品创新能力和人才供给的不足。针对这一课题,一种“1地+1(N)校+1平台+1园区”的科创孵化体系正在多地落地。据李泽湘介绍,该模式已在8个城市铺开,合作高校超过30所。
TikTok推出AI卖家助手和达人精选等新功能
AMZ123获悉,近日,TikTok宣布,为TikTok Shop卖家推出多项新工具,包括扩大Seller Assistant(卖家助手)AI机器人使用范围、优化网红合作样品寄送流程、新增直播自动剪辑和发布功能,同时在欧洲市场推出新的广告产品,并加入欧洲广告标准联盟。在电商工具方面,TikTok已将Seller Assistant工具在卖家中心全面开放。该工具为卖家提供全天候AI助手支持,用户可通过屏幕右下角的闪光图标进入,直接在后台页面提出与商品上架、数据分析和功能使用相关的问题。Seller Assistant可提供实时业绩洞察、个性化建议以及人工客服支持,帮助卖家在不离开管理界面的情况下完成操作和优化。
亚马逊更新BSA协议,卖家需审查AI工具合规性
AMZ123获悉,近日,亚马逊宣布,将于2026年3月4日起更新《Amazon Services Business Solutions Agreement》(BSA亚马逊服务商业解决方案协议),并新增一项“Agent Policy(代理政策)”,对人工智能使用及自动化系统提出新的合规要求。同时,亚马逊还将对争议解决机制进行调整。亚马逊已于2月17日通过电子邮件和公告板通知卖家,要求卖家在新规生效前完成相关工具的合规审查,时间窗口为两周。根据公告,此次更新重点包括对AI和机器学习使用的限制。亚马逊将在BSA中新增条款,禁止使用亚马逊的材料或服务来开发或改进人工智能或机器学习模型,并加强对逆向工程行为的保护。
26-cv-01713、26-cv-01896,手绘粉笔艺术成雷区!Lily & Val连环维权,367家跨境店铺危在旦夕!
2026年2月17日至19日,Keith律所代理美国知名创意设计公司 Lily & Val, LLC 连发两起TRO案件,针对367家跨境店铺未经授权使用其手写体图案、海报设计及文具模板的行为发起维权。
今日起!旧关税停止征收,10%临时关税生效
从“暂停”到“替代”,美国贸易政策正在进入新的不确定阶段。此前AMZ123在文章中提及,2025年10月底美国宣布延长对部分中国商品24%加征关税的暂停期限至一年,一度让跨境行业短暂找回了一点确定性。美国进口商重新补库存,卖家开始重谈报价,甚至有人认真讨论起“成本正常化”的可能。但如今春节刚过,美国贸易政策又突然踩下新的油门。AMZ123获悉,近日,美国海关与边境保护局(CBP)发布最新执行通知,宣布自2026年2月24日起停止征收依据《国际紧急经济权力法》(IEEPA)实施的一系列紧急关税措施。其中包括此前备受关注的“对等关税”、“芬太尼关税”,以及部分以国家紧急状态为依据推出的全球性临时关税安排。
突发!特朗普10%的全球关税已经生效
AMZ123获悉,据外媒报道,近日,美国的关税政策经历了剧烈震荡。美东时间2月20日,美国最高法院以6比3的结果作出裁定,认定特朗普政府援引《国际紧急经济权力法》加征关税的做法越权。法院认为,该法并未明确授权总统以紧急状态为由开征大规模进口关税,政府此举缺乏足够法律依据。裁决公布后,特朗普当天即作出回应。他表示不同意法院的决定,但是同时签署行政令,正式终止此前依据《国际紧急经济权力法》实施的相关关税措施。这意味着,自2024年起以芬太尼危机等理由对多国加征的关税失去了法律支撑。但特朗普并未因此停下关税步伐。
25年美国电商市场达1.2万亿美元,亚马逊与Shopify主导
AMZ123获悉,近日,根据Marketplace Pulse估算,亚马逊与Shopify两家公司合计已占据美国电商市场约50%的份额,成为该领域最核心的两大力量。这一变化被业内视为美国电商进入成熟阶段的重要标志,也体现出电商平台模式与基础设施模式并行发展的趋势。数据显示,2025年美国电商市场规模约为1.2万亿美元。其中,亚马逊美国的销售额约4400亿美元,占整体市场的35.7%。这一数字涵盖其自营零售业务及第三方市场业务。而Shopify的2025年第四季度财报显示,美国市场占比达到14%,高于上一年的12%。2025年亚马逊与Shopify的合计市场份额达到49.7%。
28天进账620w+!跨境卖家靠瑜伽服赚麻了
TikTok爆卖10万单,这件运动单品被美国人疯抢!
亚马逊年营收首超沃尔玛,达到7169亿美元!
AMZ123获悉,近日,根据亚马逊和沃尔玛两家公司最新发布的财报数据,亚马逊在刚刚结束的财年实现总收入7169亿美元,而传统零售巨头沃尔玛同期的营收为7132亿美元。这意味着,亚马逊首次在全年营收规模上超越沃尔玛,结束了后者长达26年的“全美收入最高公司”历史。事实上,这一变化已有征兆。大约一年前,亚马逊就曾在季度销售额上首次超过沃尔玛,为此次年度排名的更替埋下伏笔。从亚马逊和沃尔玛两家公司的收入结构来看,双方的驱动力已呈现出明显差异。尽管在线零售依然是亚马逊的核心业务,但它的收入构成正变得更加多元化。
亚马逊更新BSA协议,卖家需审查AI工具合规性
AMZ123获悉,近日,亚马逊宣布,将于2026年3月4日起更新《Amazon Services Business Solutions Agreement》(BSA亚马逊服务商业解决方案协议),并新增一项“Agent Policy(代理政策)”,对人工智能使用及自动化系统提出新的合规要求。同时,亚马逊还将对争议解决机制进行调整。亚马逊已于2月17日通过电子邮件和公告板通知卖家,要求卖家在新规生效前完成相关工具的合规审查,时间窗口为两周。根据公告,此次更新重点包括对AI和机器学习使用的限制。亚马逊将在BSA中新增条款,禁止使用亚马逊的材料或服务来开发或改进人工智能或机器学习模型,并加强对逆向工程行为的保护。
2025年出口额已突破千亿!SHEIN将投百亿建智慧供应链总部
AMZ123获悉,据媒体报道,2月24日,在广州召开的全省高质量发展大会上,时尚零售巨头SHEIN(希音)的创始人许仰天作为企业代表发言,分享了这家扎根广东的企业,如何用十年时间成长为全球时尚行业巨头的历程。他透露,2025年SHEIN平台出口额已突破千亿元大关,业务网络覆盖超过160个国家和地区。在许仰天看来,SHEIN独创的“小单快反”模式之所以能跑通,核心在于广东得天独厚的产业土壤。从番禺的服装制造车间,到白云的国际物流枢纽,省内高度集聚的产业链条,让一件衣服从设计稿到送达消费者手中的周期,能够被压缩到惊人的2至3周。他认为,这种速度正是广东制造极致效率与国际物流高效协同的产物。
涨幅高达550%!Shopee巴西卖家费用将大幅调整
MZ123获悉,近日,Shopee宣布,自2026年3月1日起,实施新的佣金和费用政策,并大幅调整每件商品的固定费用结构,同时优化免运费和支付补贴规则。相关调整适用于CNPJ和CPF两类卖家。在新的费率体系下,Shopee的基础佣金比例维持不变,仍为14%或20%,具体取决于卖家选择的佣金模式,但每件商品收取的固定费用将进行分级调整。自2026年起,79.99雷亚尔及以下商品固定费用仍为4雷亚尔;80至99.99雷亚尔区间为16雷亚尔;100至199.99雷亚尔为20雷亚尔;200雷亚尔以上为26雷亚尔。部分区间涨幅最高达550%,费率结构较以往更为细分。此次调整的核心变化之一是取消了100雷亚尔佣金上限。
《中企出海美国季度研究报告》PDF下载
近年来,随着全球化进程的深化与中国经济实力的持续提升,越来越多的中国企业将目光投向海外市场。美国作为全球最大经济体创新高地和消费市场,始终是中企出海战略中的关键目标。从制造业到科技领域,从消费品到金融服务,中国企业的国际化步伐不断加快,既彰显了“中国智造”的全球竞争力,也面临复杂的政策环境、文化差异与市场竞争等挑战。
《跨境蓝海拉美市场洞察 - 墨西哥篇》PDF下载
墨西哥位于北美大陆南部,北邻美国,政局稳定,法律健全,是拉丁美洲地区第一贸易大国和重要的外国直接投资目的地。墨西哥拥有 1.28亿人口,是仅次于巴西的拉美第二大经济体,同时也是拉美第三大线上零售市场,无论是互联网的普及率还是使用率在拉美市场都处于佼佼者。
《东南亚出海合规实操指南手册》PDF下载
近年来,东南亚电商市场以迅猛的增长态势成为全球贸易的新蓝海,印尼马来西亚、新加坡等六国凭借庞大的人口基数、持续提升的互联网渗透率吸引着无数中国卖家前来布局。
《2025中国新能源汽车产业链出海洞察报告 - 匈牙利篇》PDF下载
中国汽车市场新能源汽车渗透率已达50%,各主机厂纷纷开启价格战,让利消费者,并承担相应的利润损失,在中国新能源汽车市场逐渐成为红海的的大背景下,海逐渐成为各主机厂主动或被动的选择。
《2024哥伦比亚电商市场概览报告》PDF下载
哥伦比亚位于南美洲西北部,是拉丁美洲第三大国家,北部是加勒比海,东部与委内瑞拉接壤,东南方是巴西,南方是秘鲁和厄瓜多尔,西部是巴拿马和太平洋。

《2026独立站卖家日历》PDF下载
2026 独立站卖家日历 2026 全年营销节奏
《2025中东北非消费者数字经济报告》PDF下载
2025年的报告不仅持续跟踪数字经济的同比增长,也更深入:我们探讨了新兴技术对下一波数字化转型的影响力,还首次将中东北非国家及地区的消费者行为偏好与全球其他市场进行对比。
《2025年终大促旺季AI消费趋势报告》PDF下载
随着人工智能 AI的爆发式增长,如 ChatGPT、Perplexity 和Llama等交互式聊天机器人正在渐渐成为大众研究和推荐的首选工具。根据 AI智能体功能的更新迭代,目前已经可以完成网购下单、预订服务、及交易支付,现已被统称为 AI智能体电商Agentic Commerce,且其采用率正呈现出滚雪球式的增长。
欧洲电商资讯
AMZ123旗下欧洲跨境电商新闻栏目,专注欧洲跨境电商热点资讯,为广大卖家提供欧洲跨境电商最新动态、最热新闻。
AMZ123会员
「AMZ123会员」为出海者推出的一站式私享服务
跨境平台资讯
AMZ123旗下跨境电商平台新闻栏目,专注全球跨境电商平台热点事件,为广大卖家提供跨境电商平台最新动态、最热新闻。
跨境电商赢商荟
跨境电商行业唯一一家一年365天不断更的媒体!
亚马逊资讯
AMZ123旗下亚马逊资讯发布平台,专注亚马逊全球热点事件,为广大卖家提供亚马逊最新动态、最热新闻。
亿邦动力网
消除一切电商知识鸿沟,每日发布独家重磅新闻。
AMZ123卖家导航
这个人很懒,还没有自我介绍
亚马逊公告
AMZ123旗下亚马逊公告发布平台,实时更新亚马逊最新公告,致力打造最及时和有态度的亚马逊公告栏目!
首页
跨境头条
文章详情
99%网站都会存在重复内容——收下这份超全清单!
CrossBorder
2019-09-27 12:00
1662

网站在切入SEO优化时,往往都是从站内技术问题整改开始,而在这其中,解决“重复内容”是尤为重要且常见的一点。可以毫不夸张的说,99%的网站都会遇到重复内容的问题,但很多人并未意识到它的出现。本文作为一个checklist,希望能帮助大家诊断和解决过多的重复内容页面,完成SEO优化之路的一个重要里程碑。


重复内容的后果

首先了解一下什么是重复内容?重复内容通常是指网站内部或跨域之间完全匹配或大致类似的有一定体量的内容。多数情况下,其成因并不具有欺骗性质,所以并不会导致网站遭受惩罚。


仅在极个别情况下,Google 才会认为重复内容的用意是操纵页面排名并欺骗用户,当此类情况出现时,Google才会对相应网站的索引和排名进行适当的调整。


网站出现大量重复内容,会对网站产生负面影响:

  • 浪费爬虫抓取配额:之前有文章提到过,搜索引擎爬虫花在一个网站上抓取页面的总时间是有限的。大量重复页面只会占用爬虫的抓取配额,导致一些真正重要的页面可能无法被抓取到。

  • 影响页面SERP的可见度:如果页面被搜索引擎识别为重复内容,搜索引擎为了提升用户的搜索体验,在SERP尽可能展现多样化的搜索结果,他会过滤掉一些重复内容,不让其出现在靠前排名结果中。

  • 稀释页面权重:如果一个页面可以通过多个URL访问,对于搜索引擎而言,页面权重是分散传递的,不利于聚合。


重复内容的类型

也许你的网站只是简单的CMS模板搭建,页面数量少,问题不多;也许你的网站拥有上百万个页面和多个目标国家市场,非常复杂;也许你使用的CMS功能限制,自定义程度很高。

无论网站是什么量级和特点,出现的重复内容问题都是类似的,可归类分析的,下文将为您详细介绍,可细想一下哪条你有中招?


Caused by站内技术问题

由于网站内部的技术问题导致大量的重复内容,最常见的就是网站上有多个不同的URL却显示相同的内容。


重复内容类型

  • 首页存在多个URL地址可同时访问,例如/,index.html,index.php。

  • 网站存在大小写不统一的URL,对于搜索引擎而言,大小写不同则意味着不同的页面。

  • 页面URL结尾的斜杠处理不一致,不统一。带与不带斜杠结尾也意味着不同的页面。

  • 网站存在多个Flash,iframe框架等内容的页面,但爬虫识别不了,抓取到的页面是一片空白,会被认为重复页面。

  • 多维度导航中的各个过滤项、排序、属性和参数等都对搜索引擎爬虫可见,网站上应用任意一个筛选条件都会生成一个新的页面,再在新的页面应用新的筛选条件就会继续生成更多的页面,这样最终生成的页面就无穷无尽,如果爬虫顺着这路径爬行下去,就会抓取到非常多的页面并容易陷入死循环出不来。CrossBorderDigital曾帮助客户解决过这个问题,SEO流量立马上涨了30%。

  • 网站内部链接带上了各种跟踪参数,例如GA的UTM参数。

  • 站内搜索的动态链接能被爬虫抓取并索引。如/search?keywords=XXX。

  • 网页的备用版本,例如可打印版本页面也被收录了。



Caused by内容策略不当

除了网站技术引发的重复,网站不恰当的内容策略也会引发此类问题,毕竟身处信息爆炸时代,内容生产和过期的速度都很快。

⭐对于拥有几百万页面的大型资讯站点,内容产出频率高,重复内容和内部竞争的问题很是上头。


重复内容类型

  • 发布许多类似的文章,或版本更新迭代的内容,即文章之间重复率较高。

  • 已被新内容替换的过时内容,但两者并未进行合并,保留了旧文章。

  • 内容过于单薄的页面,或是空白内容页面(文章内容为404无法找到,但页面返回200状态码)。此类页面会在Google Search Console中报告为Soft 404错误,同时被判断为重复页面。


互动问答环节

问:如果其他网站抄袭我们的内容,被动的产生重复内容,怎么办?


答:Google算法已经能很好的识别原创内容的网站,不用担心影响排名。您可以与该网站的站长联系,要求其移除相关内容。此外,也可根据《Digital Millennium Copyright Act》提交请求,以请求 Google 从搜索结果中移除涉嫌侵权的网页。



⭐如果拥有的是零售电商网站呢?网站以产品页面为主,博客文章只占少数,同样不可掉以轻心。



重复内容类型

  • 在不同的产品页面上传重复的客户评论。

  • 大量模板化的产品分类页面description,重复度高,缺少定制化。如下图:

图片
  • 空白的分类页面。例如经过产品调整,某些分类下已没有对应的产品,但站内仍有入口去到该空白页面。

  • 在分页页面中过多的使用重复内容片段。例如产品分类的各个分页页面顶部出现重复的描述内容最为常见。

  • 重复使用样板文字。例如电商网站成百上千的产品页面都重复显示运输、售后等具体条款。

  • 网站的产品文案或详情信息和eBay,Amazon等第三方平台展示的一样。

  • 网站信息直接挪用的供应商提供的原始材料,没有自定义修改。

  • 网站大量页面Title tag和Meta Description内容重复。例如某些B2B网站习惯在每个页面上都堆砌相同的产品关键词。

  • 通过不同的产品分类或促销活动等维度进入到产品页面,URL都是不同的。



Caused by服务器配置问题

如果网站服务器端配置出现错误,也有很大概率出现重复内容问题,但大多数网站运营者都很难意识到。


重复内容类型

  • 网站服务器运用SSL证书之后,http链接却没有重定向到安全协议https,即对搜索引擎而言,网站的所有页面数量*2。

  • www和non-www同时存在。

  • 在备用子域名上配置负载均衡(如www3.),或是IP层的负载均衡。

  • 测试站点页面被收录,导致和正式环境的网站页面形成重复。 



Caused by国际化/多域名的网站

如果你的网站面向国际市场,可能会运营不同的国家顶级域名或二级域名站点,那就需要将您网页的本地化版本告知 Google。


重复内容类型

  • 在针对不同目标市场的域名上发布相同或极度相似的内容。

  • 多语言网站没有正确部署<hreflang="lang">标签,或是没有翻译成本地语言,如果网页的主要内容未经翻译,则该网页的本地化版本仅会被视为重复网页。

  • 独立的移动端(例如二级域名m.crossborderdigital.com)和PC站之前没有做好canonical和alternate的双向注释。



如何诊断?

借助搜索引擎查询命令或是相关检查工具,发现并精准找到问题的原因,对我来说,这是SEO需要掌握的核心内容。为了帮助大家快速诊断网站,下面介绍了三种方式:


Google Search Console索引报告

最直接的方式就是在Google Search Console后台的“Coverage”报告中查看索引错误或被排除索引的问题链接列表,它会很清晰的显示你的网站因为什么原因而没有被索引,如下图所示:

图片


搜索引擎查询命令

查找重复内容的另一种简单方法是使用Google查询命令。只需从您的网站中复制一段文本内容,然后将其用双引号括起来即可在Google上进行搜索。

如果想知道网站被收录了多少页面,除了Google Search Console中的Valid URL数量,使用查询命令site:www.example.com也能得到网站页面索引数(取决于网站的规模,仅作为参考值)

图片


或是将下面的这几个查询命令结合起来使用,快速检测出属于重复内容的页面,事半功倍。

✅ site:www.example.com

    查询网站索引页面数


✅ site:www.example.com intitle:keyword

    查询网站所有包含keyword的页面


✅ site:www.example.com inurl:keyword

    查询网站所有URL包含keyword的页面


✅ site:www.example.com filetype:xml/txt/pdf

    查询网站包含这类资源格式的页面


模拟抓取工具

有需求就有市场,检测网站重复内容的工具越来越多,功能也越来越丰富。找到适合你的,才是最重要的。此处主要推荐模拟爬虫抓取工具,Screaming Frog作为市面上非常流行的模拟抓取工具,它可以帮助你迅速发现网站重复的title,description,h标签,url等信息,并批量导出报告,便于分析。当然,如果你正在使用同类型的抓取工具如Deepcrawl和Sitebulb,综合型SEO工具如Ahrefs和SEMRush,同样可行。

图片


如何优化

当你了解哪些属于重复内容,并且通过诊断精准定位了问题页面后,最重要的就是如何优化并解决重复内容,从而聚合页面权重,提高搜索引擎爬虫对网站的抓取效率,提升有效页面收录量。

设置301重定向

对搜索引擎来说,301重定向意味着永久改变地址,可以传递绝大部分页面权重和排名。

如果一个页面拥有多个URL入口,或是新旧版本文章内容更替等情况,建议整理出我们期望收录的规范化地址,设置其他页面做301重定向到规范化页面,聚合页面权重。


添加rel="canonical"

网站所有页面都应该添加rel="canonical" link 元素,帮助Google选择一个网址作为规范版本并抓取该网址,而将所有其他网址视为重复网址并降低对这些网址的抓取频率,聚合页面权重。


Canonical标签不像301重定向那样可以基本完全传递原来的权重,但大部分的权重还是可以聚合于首选的页面的,前提是标识的这两个页面内容需要相同或高度相似。如果要保留所有的已有的URL均能被正常访问且不好设置301重定向,那么可以使用这种折中方案。


Canonical注意事项:

1)   Canonical标签只是一个建议,并不是指令,所以搜索引擎会在很大程度上考虑这个标签,但并不是百分百遵守,搜索引擎还会考虑其他情况来判断规范化地址。

2)   标签需要使用绝对地址。(即URL需要带上http或https协议)

3)   Canonical指定的首选页面的内容,与其他使用这个标签的非规范化网址内容要完全相同或高度相似,否则很可能不起作用。使用301则没有这个限制。建议站长在使用canonical标签时要仔细检查,确认两个页面是完全相同的。即使页面高度相似,canonical标签被遵守的可能性也会降低。


添加Noindex标签

如果301重定向和Canonical标签都不方便设置,只希望搜索引擎不要收录那些重复页面,这种情况下可以在页面源代码中添加Noindex标签。禁止搜索引擎索引本页面,但允许蜘蛛继续抓取页面上的其他链接,也可以传递权重。如下:

<meta name=“robots” content=“noindex,follow”>


Robots.txt代表禁止抓取(但不影响索引),Noindex代表禁止索引(但不影响抓取),抓取和索引是不同的两个过程,但经验不足的人可能会倾向于阻止使用robots.txt来解决重复页面,属于治标不治本,最好将这些页面设置为noindex(或在不再需要时将其重定向)。例如网站存在一些内容缺失页面,或是网站内部搜索页面都不想被收录,可将这类页面添加Noindex标签,确认其从Google索引中去除后,再添加到robots.txt文件中,禁止爬虫抓取。

确保内链规范化

网站内部链接入口都应确保是规范化地址,即提高爬虫抓取效率,减少重复页面的抓取入口。例如首页导航的Home,网站Logo,面包屑中首页层级入口,都应统一为首选的URL。


尽量减少模板化内容

例如电商网站的各个产品页面不要显示重复的shipping,warranty等条款,建议只用锚文本添加内链即可,链接到能够提供详细信息的单独网页。同时还需要最大限度地减少相似内容,例如网站定期发布版本更新文档,建议考虑增加每个新版本文档的独特性内容,或将这些版本网页合并成一个。


坚持发布原创内容

如果公司同时运营多个平台,例如产品可能会在ebay,amazon和官网上同时售卖,建议保证官网能尽量做到发布原创内容,即网站产品和分类的描述内容尽可能做到单独定制化、可读性强,提高页面的长期竞争力。如果你的产品采购于供应商,那么更需要在供应商提供的产品详情信息上进行优化,避免和其他网站信息产生重复。

PS:如果网站产品SKU过多,内容更新的工作将十分漫长,难以推进,建议先从GA等分析工具中筛选出Top流量的产品页面,从重点品类入手。


保持网站URL稳定

如果可以,网站页面URL尽量不要轻易更改,因为保持URL稳定比在URL中不断填充新的关键词更为重要。时间一长,新旧URL更替容易产生404错误或其他重复问题。


避免网站内容被无条件引用

如果你运营的是一个咨询内容站点,网站拥有大量高质量文档,容易被竞争对手或其他平台所采集、引用等,建议在别人复制我们的网站内容时,设置自动添加网站版权信息和原始页面链接,确保我们内容的原创性。


咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部