AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

99%网站都会存在重复内容——收下这份超全清单!

1445
2019-09-27 12:00
2019-09-27 12:00
1445

网站在切入SEO优化时,往往都是从站内技术问题整改开始,而在这其中,解决“重复内容”是尤为重要且常见的一点。可以毫不夸张的说,99%的网站都会遇到重复内容的问题,但很多人并未意识到它的出现。本文作为一个checklist,希望能帮助大家诊断和解决过多的重复内容页面,完成SEO优化之路的一个重要里程碑。


重复内容的后果

首先了解一下什么是重复内容?重复内容通常是指网站内部或跨域之间完全匹配或大致类似的有一定体量的内容。多数情况下,其成因并不具有欺骗性质,所以并不会导致网站遭受惩罚。


仅在极个别情况下,Google 才会认为重复内容的用意是操纵页面排名并欺骗用户,当此类情况出现时,Google才会对相应网站的索引和排名进行适当的调整。


网站出现大量重复内容,会对网站产生负面影响:

  • 浪费爬虫抓取配额:之前有文章提到过,搜索引擎爬虫花在一个网站上抓取页面的总时间是有限的。大量重复页面只会占用爬虫的抓取配额,导致一些真正重要的页面可能无法被抓取到。

  • 影响页面SERP的可见度:如果页面被搜索引擎识别为重复内容,搜索引擎为了提升用户的搜索体验,在SERP尽可能展现多样化的搜索结果,他会过滤掉一些重复内容,不让其出现在靠前排名结果中。

  • 稀释页面权重:如果一个页面可以通过多个URL访问,对于搜索引擎而言,页面权重是分散传递的,不利于聚合。


重复内容的类型

也许你的网站只是简单的CMS模板搭建,页面数量少,问题不多;也许你的网站拥有上百万个页面和多个目标国家市场,非常复杂;也许你使用的CMS功能限制,自定义程度很高。

无论网站是什么量级和特点,出现的重复内容问题都是类似的,可归类分析的,下文将为您详细介绍,可细想一下哪条你有中招?


Caused by站内技术问题

由于网站内部的技术问题导致大量的重复内容,最常见的就是网站上有多个不同的URL却显示相同的内容。


重复内容类型

  • 首页存在多个URL地址可同时访问,例如/,index.html,index.php。

  • 网站存在大小写不统一的URL,对于搜索引擎而言,大小写不同则意味着不同的页面。

  • 页面URL结尾的斜杠处理不一致,不统一。带与不带斜杠结尾也意味着不同的页面。

  • 网站存在多个Flash,iframe框架等内容的页面,但爬虫识别不了,抓取到的页面是一片空白,会被认为重复页面。

  • 多维度导航中的各个过滤项、排序、属性和参数等都对搜索引擎爬虫可见,网站上应用任意一个筛选条件都会生成一个新的页面,再在新的页面应用新的筛选条件就会继续生成更多的页面,这样最终生成的页面就无穷无尽,如果爬虫顺着这路径爬行下去,就会抓取到非常多的页面并容易陷入死循环出不来。CrossBorderDigital曾帮助客户解决过这个问题,SEO流量立马上涨了30%。

  • 网站内部链接带上了各种跟踪参数,例如GA的UTM参数。

  • 站内搜索的动态链接能被爬虫抓取并索引。如/search?keywords=XXX。

  • 网页的备用版本,例如可打印版本页面也被收录了。



Caused by内容策略不当

除了网站技术引发的重复,网站不恰当的内容策略也会引发此类问题,毕竟身处信息爆炸时代,内容生产和过期的速度都很快。

⭐对于拥有几百万页面的大型资讯站点,内容产出频率高,重复内容和内部竞争的问题很是上头。


重复内容类型

  • 发布许多类似的文章,或版本更新迭代的内容,即文章之间重复率较高。

  • 已被新内容替换的过时内容,但两者并未进行合并,保留了旧文章。

  • 内容过于单薄的页面,或是空白内容页面(文章内容为404无法找到,但页面返回200状态码)。此类页面会在Google Search Console中报告为Soft 404错误,同时被判断为重复页面。


互动问答环节

问:如果其他网站抄袭我们的内容,被动的产生重复内容,怎么办?


答:Google算法已经能很好的识别原创内容的网站,不用担心影响排名。您可以与该网站的站长联系,要求其移除相关内容。此外,也可根据《Digital Millennium Copyright Act》提交请求,以请求 Google 从搜索结果中移除涉嫌侵权的网页。



⭐如果拥有的是零售电商网站呢?网站以产品页面为主,博客文章只占少数,同样不可掉以轻心。



重复内容类型

  • 在不同的产品页面上传重复的客户评论。

  • 大量模板化的产品分类页面description,重复度高,缺少定制化。如下图:

图片
  • 空白的分类页面。例如经过产品调整,某些分类下已没有对应的产品,但站内仍有入口去到该空白页面。

  • 在分页页面中过多的使用重复内容片段。例如产品分类的各个分页页面顶部出现重复的描述内容最为常见。

  • 重复使用样板文字。例如电商网站成百上千的产品页面都重复显示运输、售后等具体条款。

  • 网站的产品文案或详情信息和eBay,Amazon等第三方平台展示的一样。

  • 网站信息直接挪用的供应商提供的原始材料,没有自定义修改。

  • 网站大量页面Title tag和Meta Description内容重复。例如某些B2B网站习惯在每个页面上都堆砌相同的产品关键词。

  • 通过不同的产品分类或促销活动等维度进入到产品页面,URL都是不同的。



Caused by服务器配置问题

如果网站服务器端配置出现错误,也有很大概率出现重复内容问题,但大多数网站运营者都很难意识到。


重复内容类型

  • 网站服务器运用SSL证书之后,http链接却没有重定向到安全协议https,即对搜索引擎而言,网站的所有页面数量*2。

  • www和non-www同时存在。

  • 在备用子域名上配置负载均衡(如www3.),或是IP层的负载均衡。

  • 测试站点页面被收录,导致和正式环境的网站页面形成重复。 



Caused by国际化/多域名的网站

如果你的网站面向国际市场,可能会运营不同的国家顶级域名或二级域名站点,那就需要将您网页的本地化版本告知 Google。


重复内容类型

  • 在针对不同目标市场的域名上发布相同或极度相似的内容。

  • 多语言网站没有正确部署<hreflang="lang">标签,或是没有翻译成本地语言,如果网页的主要内容未经翻译,则该网页的本地化版本仅会被视为重复网页。

  • 独立的移动端(例如二级域名m.crossborderdigital.com)和PC站之前没有做好canonical和alternate的双向注释。



如何诊断?

借助搜索引擎查询命令或是相关检查工具,发现并精准找到问题的原因,对我来说,这是SEO需要掌握的核心内容。为了帮助大家快速诊断网站,下面介绍了三种方式:


Google Search Console索引报告

最直接的方式就是在Google Search Console后台的“Coverage”报告中查看索引错误或被排除索引的问题链接列表,它会很清晰的显示你的网站因为什么原因而没有被索引,如下图所示:

图片


搜索引擎查询命令

查找重复内容的另一种简单方法是使用Google查询命令。只需从您的网站中复制一段文本内容,然后将其用双引号括起来即可在Google上进行搜索。

如果想知道网站被收录了多少页面,除了Google Search Console中的Valid URL数量,使用查询命令site:www.example.com也能得到网站页面索引数(取决于网站的规模,仅作为参考值)

图片


或是将下面的这几个查询命令结合起来使用,快速检测出属于重复内容的页面,事半功倍。

✅ site:www.example.com

    查询网站索引页面数


✅ site:www.example.com intitle:keyword

    查询网站所有包含keyword的页面


✅ site:www.example.com inurl:keyword

    查询网站所有URL包含keyword的页面


✅ site:www.example.com filetype:xml/txt/pdf

    查询网站包含这类资源格式的页面


模拟抓取工具

有需求就有市场,检测网站重复内容的工具越来越多,功能也越来越丰富。找到适合你的,才是最重要的。此处主要推荐模拟爬虫抓取工具,Screaming Frog作为市面上非常流行的模拟抓取工具,它可以帮助你迅速发现网站重复的title,description,h标签,url等信息,并批量导出报告,便于分析。当然,如果你正在使用同类型的抓取工具如Deepcrawl和Sitebulb,综合型SEO工具如Ahrefs和SEMRush,同样可行。

图片


如何优化

当你了解哪些属于重复内容,并且通过诊断精准定位了问题页面后,最重要的就是如何优化并解决重复内容,从而聚合页面权重,提高搜索引擎爬虫对网站的抓取效率,提升有效页面收录量。

设置301重定向

对搜索引擎来说,301重定向意味着永久改变地址,可以传递绝大部分页面权重和排名。

如果一个页面拥有多个URL入口,或是新旧版本文章内容更替等情况,建议整理出我们期望收录的规范化地址,设置其他页面做301重定向到规范化页面,聚合页面权重。


添加rel="canonical"

网站所有页面都应该添加rel="canonical" link 元素,帮助Google选择一个网址作为规范版本并抓取该网址,而将所有其他网址视为重复网址并降低对这些网址的抓取频率,聚合页面权重。


Canonical标签不像301重定向那样可以基本完全传递原来的权重,但大部分的权重还是可以聚合于首选的页面的,前提是标识的这两个页面内容需要相同或高度相似。如果要保留所有的已有的URL均能被正常访问且不好设置301重定向,那么可以使用这种折中方案。


Canonical注意事项:

1)   Canonical标签只是一个建议,并不是指令,所以搜索引擎会在很大程度上考虑这个标签,但并不是百分百遵守,搜索引擎还会考虑其他情况来判断规范化地址。

2)   标签需要使用绝对地址。(即URL需要带上http或https协议)

3)   Canonical指定的首选页面的内容,与其他使用这个标签的非规范化网址内容要完全相同或高度相似,否则很可能不起作用。使用301则没有这个限制。建议站长在使用canonical标签时要仔细检查,确认两个页面是完全相同的。即使页面高度相似,canonical标签被遵守的可能性也会降低。


添加Noindex标签

如果301重定向和Canonical标签都不方便设置,只希望搜索引擎不要收录那些重复页面,这种情况下可以在页面源代码中添加Noindex标签。禁止搜索引擎索引本页面,但允许蜘蛛继续抓取页面上的其他链接,也可以传递权重。如下:

<meta name=“robots” content=“noindex,follow”>


Robots.txt代表禁止抓取(但不影响索引),Noindex代表禁止索引(但不影响抓取),抓取和索引是不同的两个过程,但经验不足的人可能会倾向于阻止使用robots.txt来解决重复页面,属于治标不治本,最好将这些页面设置为noindex(或在不再需要时将其重定向)。例如网站存在一些内容缺失页面,或是网站内部搜索页面都不想被收录,可将这类页面添加Noindex标签,确认其从Google索引中去除后,再添加到robots.txt文件中,禁止爬虫抓取。

确保内链规范化

网站内部链接入口都应确保是规范化地址,即提高爬虫抓取效率,减少重复页面的抓取入口。例如首页导航的Home,网站Logo,面包屑中首页层级入口,都应统一为首选的URL。


尽量减少模板化内容

例如电商网站的各个产品页面不要显示重复的shipping,warranty等条款,建议只用锚文本添加内链即可,链接到能够提供详细信息的单独网页。同时还需要最大限度地减少相似内容,例如网站定期发布版本更新文档,建议考虑增加每个新版本文档的独特性内容,或将这些版本网页合并成一个。


坚持发布原创内容

如果公司同时运营多个平台,例如产品可能会在ebay,amazon和官网上同时售卖,建议保证官网能尽量做到发布原创内容,即网站产品和分类的描述内容尽可能做到单独定制化、可读性强,提高页面的长期竞争力。如果你的产品采购于供应商,那么更需要在供应商提供的产品详情信息上进行优化,避免和其他网站信息产生重复。

PS:如果网站产品SKU过多,内容更新的工作将十分漫长,难以推进,建议先从GA等分析工具中筛选出Top流量的产品页面,从重点品类入手。


保持网站URL稳定

如果可以,网站页面URL尽量不要轻易更改,因为保持URL稳定比在URL中不断填充新的关键词更为重要。时间一长,新旧URL更替容易产生404错误或其他重复问题。


避免网站内容被无条件引用

如果你运营的是一个咨询内容站点,网站拥有大量高质量文档,容易被竞争对手或其他平台所采集、引用等,建议在别人复制我们的网站内容时,设置自动添加网站版权信息和原始页面链接,确保我们内容的原创性。


免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
冬季需求拉动增长,10款汽配产品在亚马逊月销过万
AMZ123获悉,近日,亚马逊各类产品搜索量增长显著,以下10款产品在亚马逊上销量表现突出,深受消费者欢迎。1. 便携轮胎充气泵预计销售额:679.99万美元/月销量:100,000+星级评分:4.3好评数量:23,615+图源:亚马逊产品介绍:这款便携式轮胎充气泵采用电池供电设计,体积小巧,可放置于手套箱或后备箱,适用于汽车、SUV、摩托车、自行车及球类等。支持最高 120 PSI 的精准充气,内置数字胎压显示屏,可在 PSI、kPa、Bar 等多种单位间切换,并通过按键设定目标胎压,到达设定值后自动停止,降低过度充气风险。配套多种充气接口和LED照明灯,满足日常补气和应急使用需求。
荷兰Q3网购支出降至77亿欧元,玩具品类表现突出
AMZ123获悉,近日,最新发布的《荷兰网购市场监测》报告显示,2025年第三季度,荷兰消费者在线支出总额为 77 亿欧元,同比下降 2%。不过,在线购物订单数仍保持增长,达到 8600 万笔,同比增长 3%,显示出消费者网购频次持续提升,但单笔消费金额有所回落。从设备使用情况看,智能手机在在线购物中的重要性进一步上升。第三季度,43% 的在线购物通过智能手机完成,首次与台式机和笔记本电脑的占比持平,标志着移动端已成为荷兰电商的核心渠道之一。这一变化在多个品类中表现明显,尤其是在食品和家居生活类别。食品中,智能手机下单占比提升至 53%;在服装品类中,智能手机已成为最主要的购物设备。
25年假日季持续增长,全球线上销售额已达1万亿美元
AMZ123获悉,近日,Salesforce最新数据显示,随着圣诞节临近,2025年全球线上假日购物继续保持增长态势。在2025年假日季前45天(11月1日至12月15日),全球线上销售额同比增长7%,由去年同期的8490亿美元增至1.033万亿美元,提前突破1万亿美元大关。其中,美国线上销售额同比增长4%,达到2380亿美元。从价格与订单结构来看,2025年假日季全球线上商品平均售价同比上涨6%,美国市场上涨7%。与此同时,订单量也保持小幅增长,全球订单量同比增加3%,美国同比增长1%,显示消费增长并非完全由价格推动。在消费者行为方面,线上购物活跃度明显提升。
TikTok签署协议成立美国合资公司,预计明年1月完成交易
AMZ123获悉,近日,据外媒报道,TikTok母公司字节跳动已签署协议,将成立一家由美国投资者控股的美国合资公司,从而推进TikTok美国业务剥离计划。根据内部备忘录披露,该交易由甲骨文、银湖资本以及阿布扎比投资公司MGX牵头,预计将于2026年1月22日完成交割。按照协议安排,新成立的美国合资公司将作为独立实体运营,负责美国市场的数据保护、内容审核和算法安全事务,并由一个由七名成员组成、以美国籍董事为多数的董事会进行治理。合资公司股权结构显示,新的投资者财团合计持有50%的股份,其中甲骨文、银湖资本和MGX各持有15%;字节跳动现有投资者关联方持有30.1%;字节跳动自身保留19.9%的股份。
陈天桥再撰文:系统的融化——从AI赋能到AI原生
从AI赋能到AI原生,意味着AI不再是外挂的插件,而是业务流转的核心生产力。
Capcom对旗下热门游戏《Monster Hunter》《Resident Evil》启动维权行动!
01Monster Hunter起诉时间:2025/12/16案件号:25-cv-25905原告品牌:Monster Hunter品牌方:Capcom Co., Ltd律所:TME起诉原因:商标、版权侵权Monster Hunter是日本Capcom开发和发行动作角色扮演游戏系列,自平台发布以来,已成为全球知名的游戏品牌。该系列以狩猎巨大怪物、收集材料、制作装备 为核心玩法,结合多人合作和战术策略元素,深受玩家喜爱。
对话Canva可画:当把AI放进创作入口,品牌表达也进入下一个阶段 | 《AI营销新范式》08期
未来的内容竞争,在于谁更懂得什么时候该说,以及该如何一起说。
蓝标传媒陈麒艳:流量成本比中国低N倍,在东南亚怎么才能赚到钱? | Morketing灵眸大赏2025
12月3日-4日,第十届灵眸大赏Morketing Summit·智启于中国上海举办。次日,在第十届灵眸大赏“智启·新兴市场”论坛上,蓝标传媒越南及印尼公司总经理陈麒艳就《From Traffic to Trust:重塑东南亚品牌增长新路径》这一主题进行了分享。当前中国品牌的出海热情已经从“试水”回归理性,同时东南亚市场早已告别“躺赢”时代。“东南亚的CPM比中国便宜5倍以上,但随着中国卖家的大量涌入,各类成本持续上涨,单纯的产品平移与买量逻辑难以为继”,陈麒艳分享道。她表示,结合实战观察,东南亚市场正呈现三大核心趋势:趋势一:东南亚的消费市场极度年轻;趋势二:支付与物流体系日趋成熟;趋势三:电商生态迭代速度快。
抢攻新兴蓝海,一批中国卖家已爆单!
你眼中的非洲,是什么样的?偏远、贫瘠、基建差……在这些刻板印象的束缚下,过去很长一段时间里,许多卖家对于非洲的认知都停留在“待开发的潜力股”上,因此鲜少有人在攻略新城池时考虑到非洲电商市场。然而士别三日,当刮目相看。如今去到非洲国家,这样的场景已十分普遍:尼日利亚拉各斯的街头,电商配送车穿梭在车流中,装载着从中国跨境而来的电子产品与时尚服饰;在肯尼亚内罗毕的社区,年轻人正在Jumia的橙色自提点前排起长队,领取他们通过手机订购的中国商品。 这片被误解的电商新大陆,正在成为藏金纳银的财富洼地。
新入口曝光!亚马逊广告后台新增 Prompts(提示词)功能
今日分享「结合数据高效优化老品广告」
亚马逊如何结合竞价,优化广告位置表现
在亚马逊平台的标品运营中,流量结构的精准布局是决定 ASIN 成长效率与成熟期收益的核心要素之一。标品(如标准化 3C 配件、家居日用品等)具有用户决策链路短、搜索意图明确的特征,其流量资源的分配需高度聚焦于高转化曝光位。本文将系统解析适用于标品成长 / 成熟期 ASIN 的流量结构”,明确其逻辑框架、落地步骤与效果验证,为新人卖家提供可复用的运营范式。一、模式 1 的核心定义与适配场景模式 1 是针对标品成长 / 成熟期 ASIN设计的流量结构策略,其核心特征为 “三角形流量布局”—— 即通过资源倾斜,将大部分流量集中于 “搜索结果首页首位” 这一核心曝光位。
美国圣诞节后预计迎来退货高峰,退货率或将高出35%
AMZ123获悉,近日,Adobe最新发布的假日购物数据分析显示,2025年假日季至今,美国消费者的退货行为较去年同期有所放缓,但整体趋势仍需谨慎看待。11月1日至12月12日,线上购物退货量同比下降2.5%;而在黑五周(Cyber Week)结束后的7天内,退货量仅同比下降0.1%,降幅明显收窄。Adobe指出,当前的退货下降并不意味着假日季整体退货压力减轻。按照历史规律,圣诞节后将迎来集中退货高峰。预计12月26日至12月31日期间,退货量将较11月1日至12月12日这一阶段高出25%至35%。根据2024年假日季数据,每8笔退货中就有1笔发生在这一6天内,Adobe预计这一趋势将在今年延续。
25年健康品牌TOP10榜单出炉,功能型健康产品爆火
AMZ123获悉,近日,AI 市场研究平台 Spate 基于 Google、TikTok 和 Instagram 的搜索与互动数据,对健康品牌的年度热度变化进行了统计,整理出 2025 年最受关注、同比增长最快的十大健康品牌。随着“长寿”“功能性健康”等议题持续升温,线上健康消费品牌的关注度在2025年显著提升。这些品牌主要集中在营养补充、功能性食品、运动营养和情绪健康等领域,反映出消费者在压力管理、肠道健康、能量补充和整体健康管理方面的需求持续扩大。数据显示,2025 年热度排名第一的品牌为 Goli,其年度“人气指数”增长达 15 亿次,同比提升 217%。
扎心了,超7成跨境人今年无年终奖
年终奖取消,公司岌岌可危,跨境人:今年太难了
亚马逊走9810退税模式的灵魂拷问!
亚马逊走9810退税模式的灵魂拷问!
跨境电商的入场券,变了
2025年,跨境电商仍在增长,但增长的方式已悄然改写——它不再均匀洒向每一个卖家,而是像一场“定向灌溉”,愈发向头部与合规能力强的卖家集中。平台数据揭示出这一分化:2025年1—9月,亚马逊中国卖家上新数量同比提升近25%;销售额达到200万、500万、800万美元的卖家数量增幅均超过20%;而销售额超过1000万美元的头部卖家,增幅接近30%。这不是简单的强弱分化,而是一次行业的深层迁移:平台正在亲手改写规则,把“可控”定为第一要义。随之而来的,是三条谁都绕不开的趋势——它们共同把跨境电商,从过去的“流量快跑”,推向了如今的“系统耐力赛”。
《亚马逊生活日用品类攻略手册》PDF下载
作为日常生活不可或缺的重要组成,生活百货品类覆盖范围广泛,包括家居用品、家具、车用配件、户外装备、园艺 工具、运动器材、家装用品、厨房、玩具以及宠物用品等众多领域。这类产品不仅是满足基本生活所需,更体现了人们对美好生活的向往和追求。
《掘金泰国-市场洞察与战略机遇报告2025》PDF下载
随着全球经济一体化的加速,泰国作为东盟的核心枢纽,凭借其独特的地缘优势庞大的消费市场以及持续优化的营商环境,成为众多企业战略布局的重要目标。本报告深入剖析泰国市场的政策红利、消费趋势、产业机遇以及合规挑战,旨在为有志于开拓泰国市场的中国企业提供行动指南,助力企业在东盟这片充满活力的土地上把握机遇、应对挑战、!实现可持续发展。
《2025欧美假日购物季营销指南》PDF下载
2025年美国假日购物季零售额预计同比仅增长1.2%,总销售额约1.359万亿美元,虽仍保持正增长,但为2009年以来最低增速,市场正在步入低增长的新常态。
《2025年跨境电商东南亚市场进入战略白皮书》PDF下载
东南亚电商,正以惊人的速度复刻中国电商高速增长的黄金时代。2024年东南亚电商GMV达到1284亿美元,短短5年涨幅超过3倍。全球电商2024年GMV增幅最快的十大市场中,东南亚独占四席。东南亚是拥有约6.7亿人口的广阔市场,在现今全球关税的不确定性大格局下,因其电商基建完善,利好的贸易政策,和更高的年轻人口占比,成为跨境卖家生意拓张焦点之一。
《2025年TikTok Shop玩具品类行业报告(欧美站)》PDF下载
分析TikTok Shop美国市场、英国市场、西班牙市场、墨西哥市场等主流市场点短视频及直播电商数据,选取TikTok与玩具爱好品类相关的内容进行分析报告。
《2025 洗护品类趋势与创新洞察》PDF下载
本报告独特价值:将消费者的“行为结果”据),揭示消费者深层心理动机、并能精准预判未来增长机会
《亚马逊双轨增长指南》PDF下载
亚马逊以“以客户为中心”为核心理念,通过整合B2B与B2C的全渠道服务,帮助卖家实现“一店双拓”-- 一次上架,同步触达个人消费者与企业买家,获得双重收益。同时,基于Direct to Buyer(直接触达买家)的模式,更能有效减少中间环节,提升利润空间与品牌掌控力。
《亚马逊全球线上商采趋势与区域洞察》PDF下载
随着全球企业数字化转型的深入推进,B2B商采有望成为下一个万亿级别的蓝海市场然而,中国卖家在开拓海外企业商采市场时往往面临着一个关键挑战:难以准确把握海外企业买家的商采行为和决策模式。这种认知偏差不仅影响了产品开发方向,也制约了市场拓展策略的制定。
跨境平台资讯
AMZ123旗下跨境电商平台新闻栏目,专注全球跨境电商平台热点事件,为广大卖家提供跨境电商平台最新动态、最热新闻。
AMZ123选品观察员
选品推荐及选品技巧分享。
AMZ123卖家导航
这个人很懒,还没有自我介绍
跨境数据中心
聚合海量跨境数据,输出跨境研究智慧。
欧洲电商资讯
AMZ123旗下欧洲跨境电商新闻栏目,专注欧洲跨境电商热点资讯,为广大卖家提供欧洲跨境电商最新动态、最热新闻。
侃侃跨境那些事儿
不侃废话,挣钱要紧!
亚马逊资讯
AMZ123旗下亚马逊资讯发布平台,专注亚马逊全球热点事件,为广大卖家提供亚马逊最新动态、最热新闻。
亚马逊公告
AMZ123旗下亚马逊公告发布平台,实时更新亚马逊最新公告,致力打造最及时和有态度的亚马逊公告栏目!
首页
跨境头条
文章详情
99%网站都会存在重复内容——收下这份超全清单!
CrossBorder
2019-09-27 12:00
1445

网站在切入SEO优化时,往往都是从站内技术问题整改开始,而在这其中,解决“重复内容”是尤为重要且常见的一点。可以毫不夸张的说,99%的网站都会遇到重复内容的问题,但很多人并未意识到它的出现。本文作为一个checklist,希望能帮助大家诊断和解决过多的重复内容页面,完成SEO优化之路的一个重要里程碑。


重复内容的后果

首先了解一下什么是重复内容?重复内容通常是指网站内部或跨域之间完全匹配或大致类似的有一定体量的内容。多数情况下,其成因并不具有欺骗性质,所以并不会导致网站遭受惩罚。


仅在极个别情况下,Google 才会认为重复内容的用意是操纵页面排名并欺骗用户,当此类情况出现时,Google才会对相应网站的索引和排名进行适当的调整。


网站出现大量重复内容,会对网站产生负面影响:

  • 浪费爬虫抓取配额:之前有文章提到过,搜索引擎爬虫花在一个网站上抓取页面的总时间是有限的。大量重复页面只会占用爬虫的抓取配额,导致一些真正重要的页面可能无法被抓取到。

  • 影响页面SERP的可见度:如果页面被搜索引擎识别为重复内容,搜索引擎为了提升用户的搜索体验,在SERP尽可能展现多样化的搜索结果,他会过滤掉一些重复内容,不让其出现在靠前排名结果中。

  • 稀释页面权重:如果一个页面可以通过多个URL访问,对于搜索引擎而言,页面权重是分散传递的,不利于聚合。


重复内容的类型

也许你的网站只是简单的CMS模板搭建,页面数量少,问题不多;也许你的网站拥有上百万个页面和多个目标国家市场,非常复杂;也许你使用的CMS功能限制,自定义程度很高。

无论网站是什么量级和特点,出现的重复内容问题都是类似的,可归类分析的,下文将为您详细介绍,可细想一下哪条你有中招?


Caused by站内技术问题

由于网站内部的技术问题导致大量的重复内容,最常见的就是网站上有多个不同的URL却显示相同的内容。


重复内容类型

  • 首页存在多个URL地址可同时访问,例如/,index.html,index.php。

  • 网站存在大小写不统一的URL,对于搜索引擎而言,大小写不同则意味着不同的页面。

  • 页面URL结尾的斜杠处理不一致,不统一。带与不带斜杠结尾也意味着不同的页面。

  • 网站存在多个Flash,iframe框架等内容的页面,但爬虫识别不了,抓取到的页面是一片空白,会被认为重复页面。

  • 多维度导航中的各个过滤项、排序、属性和参数等都对搜索引擎爬虫可见,网站上应用任意一个筛选条件都会生成一个新的页面,再在新的页面应用新的筛选条件就会继续生成更多的页面,这样最终生成的页面就无穷无尽,如果爬虫顺着这路径爬行下去,就会抓取到非常多的页面并容易陷入死循环出不来。CrossBorderDigital曾帮助客户解决过这个问题,SEO流量立马上涨了30%。

  • 网站内部链接带上了各种跟踪参数,例如GA的UTM参数。

  • 站内搜索的动态链接能被爬虫抓取并索引。如/search?keywords=XXX。

  • 网页的备用版本,例如可打印版本页面也被收录了。



Caused by内容策略不当

除了网站技术引发的重复,网站不恰当的内容策略也会引发此类问题,毕竟身处信息爆炸时代,内容生产和过期的速度都很快。

⭐对于拥有几百万页面的大型资讯站点,内容产出频率高,重复内容和内部竞争的问题很是上头。


重复内容类型

  • 发布许多类似的文章,或版本更新迭代的内容,即文章之间重复率较高。

  • 已被新内容替换的过时内容,但两者并未进行合并,保留了旧文章。

  • 内容过于单薄的页面,或是空白内容页面(文章内容为404无法找到,但页面返回200状态码)。此类页面会在Google Search Console中报告为Soft 404错误,同时被判断为重复页面。


互动问答环节

问:如果其他网站抄袭我们的内容,被动的产生重复内容,怎么办?


答:Google算法已经能很好的识别原创内容的网站,不用担心影响排名。您可以与该网站的站长联系,要求其移除相关内容。此外,也可根据《Digital Millennium Copyright Act》提交请求,以请求 Google 从搜索结果中移除涉嫌侵权的网页。



⭐如果拥有的是零售电商网站呢?网站以产品页面为主,博客文章只占少数,同样不可掉以轻心。



重复内容类型

  • 在不同的产品页面上传重复的客户评论。

  • 大量模板化的产品分类页面description,重复度高,缺少定制化。如下图:

图片
  • 空白的分类页面。例如经过产品调整,某些分类下已没有对应的产品,但站内仍有入口去到该空白页面。

  • 在分页页面中过多的使用重复内容片段。例如产品分类的各个分页页面顶部出现重复的描述内容最为常见。

  • 重复使用样板文字。例如电商网站成百上千的产品页面都重复显示运输、售后等具体条款。

  • 网站的产品文案或详情信息和eBay,Amazon等第三方平台展示的一样。

  • 网站信息直接挪用的供应商提供的原始材料,没有自定义修改。

  • 网站大量页面Title tag和Meta Description内容重复。例如某些B2B网站习惯在每个页面上都堆砌相同的产品关键词。

  • 通过不同的产品分类或促销活动等维度进入到产品页面,URL都是不同的。



Caused by服务器配置问题

如果网站服务器端配置出现错误,也有很大概率出现重复内容问题,但大多数网站运营者都很难意识到。


重复内容类型

  • 网站服务器运用SSL证书之后,http链接却没有重定向到安全协议https,即对搜索引擎而言,网站的所有页面数量*2。

  • www和non-www同时存在。

  • 在备用子域名上配置负载均衡(如www3.),或是IP层的负载均衡。

  • 测试站点页面被收录,导致和正式环境的网站页面形成重复。 



Caused by国际化/多域名的网站

如果你的网站面向国际市场,可能会运营不同的国家顶级域名或二级域名站点,那就需要将您网页的本地化版本告知 Google。


重复内容类型

  • 在针对不同目标市场的域名上发布相同或极度相似的内容。

  • 多语言网站没有正确部署<hreflang="lang">标签,或是没有翻译成本地语言,如果网页的主要内容未经翻译,则该网页的本地化版本仅会被视为重复网页。

  • 独立的移动端(例如二级域名m.crossborderdigital.com)和PC站之前没有做好canonical和alternate的双向注释。



如何诊断?

借助搜索引擎查询命令或是相关检查工具,发现并精准找到问题的原因,对我来说,这是SEO需要掌握的核心内容。为了帮助大家快速诊断网站,下面介绍了三种方式:


Google Search Console索引报告

最直接的方式就是在Google Search Console后台的“Coverage”报告中查看索引错误或被排除索引的问题链接列表,它会很清晰的显示你的网站因为什么原因而没有被索引,如下图所示:

图片


搜索引擎查询命令

查找重复内容的另一种简单方法是使用Google查询命令。只需从您的网站中复制一段文本内容,然后将其用双引号括起来即可在Google上进行搜索。

如果想知道网站被收录了多少页面,除了Google Search Console中的Valid URL数量,使用查询命令site:www.example.com也能得到网站页面索引数(取决于网站的规模,仅作为参考值)

图片


或是将下面的这几个查询命令结合起来使用,快速检测出属于重复内容的页面,事半功倍。

✅ site:www.example.com

    查询网站索引页面数


✅ site:www.example.com intitle:keyword

    查询网站所有包含keyword的页面


✅ site:www.example.com inurl:keyword

    查询网站所有URL包含keyword的页面


✅ site:www.example.com filetype:xml/txt/pdf

    查询网站包含这类资源格式的页面


模拟抓取工具

有需求就有市场,检测网站重复内容的工具越来越多,功能也越来越丰富。找到适合你的,才是最重要的。此处主要推荐模拟爬虫抓取工具,Screaming Frog作为市面上非常流行的模拟抓取工具,它可以帮助你迅速发现网站重复的title,description,h标签,url等信息,并批量导出报告,便于分析。当然,如果你正在使用同类型的抓取工具如Deepcrawl和Sitebulb,综合型SEO工具如Ahrefs和SEMRush,同样可行。

图片


如何优化

当你了解哪些属于重复内容,并且通过诊断精准定位了问题页面后,最重要的就是如何优化并解决重复内容,从而聚合页面权重,提高搜索引擎爬虫对网站的抓取效率,提升有效页面收录量。

设置301重定向

对搜索引擎来说,301重定向意味着永久改变地址,可以传递绝大部分页面权重和排名。

如果一个页面拥有多个URL入口,或是新旧版本文章内容更替等情况,建议整理出我们期望收录的规范化地址,设置其他页面做301重定向到规范化页面,聚合页面权重。


添加rel="canonical"

网站所有页面都应该添加rel="canonical" link 元素,帮助Google选择一个网址作为规范版本并抓取该网址,而将所有其他网址视为重复网址并降低对这些网址的抓取频率,聚合页面权重。


Canonical标签不像301重定向那样可以基本完全传递原来的权重,但大部分的权重还是可以聚合于首选的页面的,前提是标识的这两个页面内容需要相同或高度相似。如果要保留所有的已有的URL均能被正常访问且不好设置301重定向,那么可以使用这种折中方案。


Canonical注意事项:

1)   Canonical标签只是一个建议,并不是指令,所以搜索引擎会在很大程度上考虑这个标签,但并不是百分百遵守,搜索引擎还会考虑其他情况来判断规范化地址。

2)   标签需要使用绝对地址。(即URL需要带上http或https协议)

3)   Canonical指定的首选页面的内容,与其他使用这个标签的非规范化网址内容要完全相同或高度相似,否则很可能不起作用。使用301则没有这个限制。建议站长在使用canonical标签时要仔细检查,确认两个页面是完全相同的。即使页面高度相似,canonical标签被遵守的可能性也会降低。


添加Noindex标签

如果301重定向和Canonical标签都不方便设置,只希望搜索引擎不要收录那些重复页面,这种情况下可以在页面源代码中添加Noindex标签。禁止搜索引擎索引本页面,但允许蜘蛛继续抓取页面上的其他链接,也可以传递权重。如下:

<meta name=“robots” content=“noindex,follow”>


Robots.txt代表禁止抓取(但不影响索引),Noindex代表禁止索引(但不影响抓取),抓取和索引是不同的两个过程,但经验不足的人可能会倾向于阻止使用robots.txt来解决重复页面,属于治标不治本,最好将这些页面设置为noindex(或在不再需要时将其重定向)。例如网站存在一些内容缺失页面,或是网站内部搜索页面都不想被收录,可将这类页面添加Noindex标签,确认其从Google索引中去除后,再添加到robots.txt文件中,禁止爬虫抓取。

确保内链规范化

网站内部链接入口都应确保是规范化地址,即提高爬虫抓取效率,减少重复页面的抓取入口。例如首页导航的Home,网站Logo,面包屑中首页层级入口,都应统一为首选的URL。


尽量减少模板化内容

例如电商网站的各个产品页面不要显示重复的shipping,warranty等条款,建议只用锚文本添加内链即可,链接到能够提供详细信息的单独网页。同时还需要最大限度地减少相似内容,例如网站定期发布版本更新文档,建议考虑增加每个新版本文档的独特性内容,或将这些版本网页合并成一个。


坚持发布原创内容

如果公司同时运营多个平台,例如产品可能会在ebay,amazon和官网上同时售卖,建议保证官网能尽量做到发布原创内容,即网站产品和分类的描述内容尽可能做到单独定制化、可读性强,提高页面的长期竞争力。如果你的产品采购于供应商,那么更需要在供应商提供的产品详情信息上进行优化,避免和其他网站信息产生重复。

PS:如果网站产品SKU过多,内容更新的工作将十分漫长,难以推进,建议先从GA等分析工具中筛选出Top流量的产品页面,从重点品类入手。


保持网站URL稳定

如果可以,网站页面URL尽量不要轻易更改,因为保持URL稳定比在URL中不断填充新的关键词更为重要。时间一长,新旧URL更替容易产生404错误或其他重复问题。


避免网站内容被无条件引用

如果你运营的是一个咨询内容站点,网站拥有大量高质量文档,容易被竞争对手或其他平台所采集、引用等,建议在别人复制我们的网站内容时,设置自动添加网站版权信息和原始页面链接,确保我们内容的原创性。


咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部