AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

分享日出千单的亚马逊大神对Review权重的详细讲解,超级干货呀!

2308
2021-09-27 10:16
2021-09-27 10:16
2308

分享日出千单的亚马逊大神对Review权重的详细讲解,超级干货呀!

亚马逊从未对外公布过对Review权重的内容,卖家对Review权重的理解全是在运营过程中得到的经验,review的重要性,好的review和差的review对转化的影响力。


为了更好的找到Review权重的内容,换了一个思路去理解它,那就是如何甄别假review。从这个角度出发,我找到了一个网站旨在帮助消费者还原产品的真实评分。总的来说,这个网站和亚马逊都在做同一件事,就是找出假review且删除它的影响。根据网站的数据可以试着去推出竞争对手的上评方式,或者避免刷review被发现。


评分的权重由每个评论者组成,将每个Reviewer的特征整合在一起会对我们很有启发性,理解每个账号的权重出发会帮助我们理解LISTING中评分的权重。


权重因素:
1.Easy Graders 易给高评分者
2.Overrepresented participation 过度参与的群组
3.Reviews on high volume days 在评论集中日评论
4.One-Hit Wonders 一次性评论者
5.Substantial repeated phrases 大量重复短语
6.Brand Loyalists 品牌粉丝
7.Brand Monogamists 品牌铁杆粉
8.Incentivized reviews 带鼓励性质的评论
9.Brand Repeaters 品牌重复购买者
10.Take-Back Reviewers 被删过评的用户
11.Unverified purchases 未认证购买
12.Overrepresented word counts 评论字数过度参与组
13.Substantial overlapping history 交叉购买记录
14.Never-Verified Reviewers 黑号
15.Same-Day Reviewers 都在一天留评用户


One-Hit Wonders 一次性评论者:
这些账户写了一篇评论,这意味着这些账户只评论了某个产品。无偏见的评论者往往是一个网站的长期成员,他们一般不会只针对某个产品做出评论。如果某个产品有过多的一次性评论者,可以表明有操作评论的嫌疑。虽然有许多原因可能会导致某个产品中一次性评论者,但有几个常见的原因包括:假号、或以某种方式诱导不写评论的人群留评。


Take-Back Reviewers 被删过评的用户:
包括在历史记录中有删除评论的评论者。这些评论者很可疑是因为评论内容很可能是由于违反服务条款而被亚马逊删除。评论者以前曾被抓到操纵评论,不确定他们是否已停止违反规则。还有一些删评的原因:1.买家自己想删除。2.品牌联系到买家以删除评论-通常为负面评论。3.Amazon认为其违反了规则,则可能会删除评论-通常是正面评论。4.发布评论后,平台更改了规则导致删除。例如,在亚马逊更新评论政策后,许多现有的诱导性评论被删除。另一个例子是,亚马逊降低了每种产品的Vine评论上限,因此删除了许多超过该限制的Vine评论。


Single-Day Reviewers 一天评论买家:
在一天内发布了所有评论的买家被标记为一天评论买家。这些买家的账号存在疑问是因为他们没有像大多数人那样留评,也不排除心血来潮。

Substantial repeated phrases 大量重复短语:
如果使用重复短语的评论数量较多,则可能表明该评论不是自然创建的。但是仍然有很多充分的理由说明重复出现一些短语,这些短语不一定表示评论有偏见。比如电子产品,很多买家都会提到产品的功能,这些词的重复是很正常的。但是,如果有几位买家完全逐字地写了相同的营销语言或者主观性的词,则可能表明这些买家是枪手。


Overrepresented participation 过度参与的群组:
1.卖家通过礼物或其他方式让买家评论他们的产品。这会让平时不写评论的买家未为产品写评论,从而导致少留评记录的买家群体过多。


2.卖家找服务商刷,这将导致买家的结构异常。以上是Review权重的影响因素,还有一些解释。影响权重的不仅仅是买家的账号,还有LISTING下评论的结构,包括句子、上评日期等。更多的内容可以参考这个网站:http://reviewmeta.com

评论词数比较(其中一个维度)


通过算法可以发现买家操纵评论的痕迹。首先进行每一篇评论的词数比较,进而识别出不符合常规的内容。尽管买家评论的内容不受个人偏见的影响,但通过这个算法来分析所有评论中的次数可以得出某些评论数组的异常情况,从而辨别出哪些评论内容是虚假的。正常情况下评论的词数是完全随机的,所以在LISTING下的评论应该是处于一个合理的词数分布:有的长,有的短,有的介于两者之间。如果我们看到比正常情况下大很多比例的词数组,那么就有操纵评论的嫌疑。


首先将产品的每一个评论放到一个词数组。比如,一篇23字的评论属于“21-25字统计组”,一篇109字的评论属于“101-125字统计组”,一篇600字的评论属于“201+字统计组”。从字数定义我们的评论词数组,仅仅一个产品的词数分布并不能给我们有效的回答,进而需要比较产品类目的所有评论的词数分布作为一个预期分布,最后进行比较。


一旦我们得到了产品的词数分布和类目的预期词数分布。我们通过比较这两个分布并找到产品的词数分布远高于类目的预期词数分布的组。对于每一个数量较多的评论词数组进行显著性检验,确保数据不受随机因素或其他因素的影响,最终去判断这个词数组的真实情况。如果一个产品没那么多的评论,我们就通过其他维度去避免随机因素的影响。但如果这些词数组的差异在统计学是显著的,就是不符合假设,就将此组标记为占比过多词数组。(用线性回归和概率论去计算的逻辑)


有很多合理的解释去解释为什么一个产品会有一个词数组分布不符合期望的词数组分布。比如一个产品的争议性很高或者用起来很复杂,那么它在201+词数范围会有很多评论。或者有些产品设计的很简单,用起来也很简单,那么在50以下词数范围会有很多评论,就说USB数据线,能写啥,这线又长又细?你看这头又方又正?


这就是为什么要将产品的词数分布和类目的预期词数分布进行比较,而不是分析LISTING上的每个评论。不同产品的预期词数分布都有很大的差异,所以要为每一类产品建立不同的预期模型对应其类目的产品。


如果有产品不符合假设的词数组,这里面肯定是有人为干预的因素。这些因素其实无法判断是Postive还是Negative,但这些因素会造成评分出现偏差:1.买家叫粉丝来写,或者给礼物。那么为了要礼物的大多会随便写,那么在低词数组会出现一个峰值。2.买家组织“专业评论的人”写又长又详细看起来很诚实的评论,这会导致在较长的词数组出现一个峰值。3.刷单。无论自己的号还是中介,都会在数据上出现问题。典型的人工评论会一次又一次使用某几个词,有的为了节省时间就写那么几个词,这些行为在数据上都会出现异常情况。


最后,报告会挑出LISTING中不合理的词数组,如果超出了模型的预期,那么会标记为Unnatural。此外,如果LISTING中词数组很多,那么可以比较某个组的平均评分和其他组的平均评分,如果评分的差异不具备统计学意义或者说超出了合理范围,那么这个LISTING组的评论可信度是非常低的。


包含重复短语的评论(其中一个维度)
判断Review真实性的方法之一是分析LISTING中每个评论使用的短语。首先要意识到我们很难从单个评论的短语得出任何结论,但我们能汇总所有评论中的短语,然后去帮我们确认哪些评论是可能有问题的。


重复短语测试的过程比其他测试要复杂一些,首先要为一个既定的产品编辑一个曾在多个评论中使用的短语列表,其次再去确认哪些评论包含了这些短语,最后将他们的平均评分和不包含这些短语的评论的平均评分进行比较。


在编辑重复短语列表的方面,我们首先要找到一个LISTING下多个不同评论中出现3个及以上单词组成的短语,另外设置一个公式确保内容的实质性。比如三个字的短语'it was the'不具备任何意义,但'excelled all expectances'是具备实质性的。公式考虑了短语的长度、复杂性和所用单词的类型,确保列表中的每个短语不是日常英语中常用的哪些介词、不定冠词和代词之类的。


一旦我们有了重复短语的列表,那么就要检查每一个评论,看看他们是否(以及频率)使用这些短语。我们给每个评论一个权重,从词数、重复短语数量和短语的实质性方面入手。低分表示该评论中很少或没有使用重复短语,超过某个分值的评论会被标记为使用重复短语。


如果有很多评论使用某个重复短语,这些评论可能会是有问题的。首先对某些重复短语的使用是很正常的,不能直接说明问题,具体的内容还是要根据自己的判断。比如,我们经常看到买家提到某个产品的功能,这很正常,这是编写一条详细评论的必备内容。但是,如果一群买家一字不差的完全重复使用某种营销短语或主观性语言,那么这些评论是有人为操纵的嫌疑的。


为了确定这些评论的属性,我们要将所有带有重复短语的评论分组并确定它们的总体百分比。如果看到有一部分的评论中有重复短语,那并不会马上判定为是有问题的,但过多的评论是会引起嫌疑的。


接下来,我们要去对比有重复短语的评论是否比没有重复短语的评论有更高的平均评分,如果有,我们就要检验这个差异是否符合原假设。可以通过一个公式来计算数据,这个公式包含了总评分和重复短语评分的差异,通过数学模型去判断这种差异的合理性。如果有重复词评论的评分比没用重复词的评分高很多,且不符合原假设,那么可以认为这个重复词组的评分是有人为操纵的嫌疑的。(显著性检验)

免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
靠一件吊带裙,TikTok卖家7天拿下百万订单
国产女装杀疯了,这件清凉单品在TikTok卖了上千万
全球二手服饰市场加速增长,2029年规模将达3670亿美元
AMZ123获悉,近日,美国二手服饰电商平台ThredUp发布的第13份年度《转售报告》显示,在消费者需求变化、技术发展以及外部经济环境影响下,二手服饰市场正在加速增长。数据显示,2024年美国二手服饰市场同比增长14%,为2021年以来的最快增速,增速达到整体服装零售市场的5倍。其中,美国线上二手服饰市场连续第二年加速增长,2024年增速达23%,同样为2021年以来最高水平。预计未来5年,美国在线二手服饰市场将以13%的复合年增长率扩张,到2029年规模将接近翻倍,达到400亿美元。同时,全球二手服饰市场预计到2029年将达到3670亿美元,复合年增长率为10%,美国市场规模预计将达到740亿美元。
支出将达1650亿美元!26年美国宠物行业报告出炉
AMZ123获悉,近日,根据美国宠物用品协会(APPA)最新发布的《2026年行业状况报告》,美国宠物行业在2025年的总支出达到1580亿美元,同比增长3.7%,预计2026年将继续增长至1650亿美元,全年增速约4.4%。报告显示,尽管经济环境存在压力,美国养宠家庭规模依然稳步扩大,2025年共有9500万户家庭至少拥有一只宠物,宠物已成为美国家庭的重要组成部分。数据显示,年轻人正在成为市场核心消费力。千禧一代养宠人士占比30%,Z世代占比20%,X世代占比25%,婴儿潮一代占25%。
Global Payments位列美国收单机构目录榜首
Fin123获悉,近日,根据TSG最新发布的《2026年美国商户收单机构目录》,全球支付公司(Global Payments Inc.)以2025年约2.8万亿美元的处理交易量,首次登顶美国收单机构排行榜,取代自2023年以来一直位居榜首的摩根大通(JPMorgan Chase & Co.)。在前十名中,摩根大通以2.5万亿美元位列第二,费赛尔(Fiserv)以2.2万亿美元排名第三。
沙特央行向支付公司Lean发放首张开放银行牌照
Fin123获悉,近日,沙特中央银行Saudi Central Bank(SAMA)宣布,正式向金融科技公司颁发开放银行服务许可证(Major Payment Institution licence),这标志着开放银行从此前的监管沙盒测试阶段,进入到正式持牌运营阶段。在这一新框架下,中东和北非地区支付基础设施公司Lean Technologies获得首张“主要支付机构(MPI)”牌照,成为沙特首家获得许可的开放银行服务提供商。
巴西电商支出到2036年将增长104%,新兴市场加速崛起
AMZ123获悉,近日,由EBANX与World Data Lab联合发布、收录于《2026超越国界》报告的数据显示,巴西电商在整体消费结构中的占比持续提升。到2036年,巴西消费者线上支出预计增长104%,明显高于整体消费(包含线上与线下)66%的增速。目前,巴西消费者已将11.5%的消费支出用于电商,这一比例已经高于多个发达国家,包括美国(9.1%)、荷兰(9%)、法国(6.9%)、德国(6.4%)和意大利(5.4%)。未来十年,巴西消费者线上支出占比预计将进一步提升至15.2%。类似趋势也出现在印度、印度尼西亚和尼日利亚等新兴市场,这些国家的电商增长速度整体快于发达市场。
25年韩国线上购物报告发布:支出创1880亿美元新纪录
AMZ123获悉,近日,韩国国家数据部门发布《2025年12月及全年在线购物报告》。2025年,韩国线上消费规模继续扩大,全年在线购物交易额达到2720.398万亿韩元(约1880亿美元),同比增长4.9%,创下历史新高。报告显示,移动端已成为推动线上消费增长的核心动力。2025年移动购物交易额达到2111.448万亿韩元,同比增长6.5%,同样创下历史最高水平。12月在线购物交易额为24.2904万亿韩元,同比增长6.2%,其中移动端交易额为18.7991万亿韩元,占比达到77.4%,与上年同期持平。12月增长主要来自食品服务(+9.1%)、食品饮料(+10.2%)以及汽车及汽车用品(+66.4%)。
突发!亚马逊搜索页大变天,Rufus 直接 “抢” 走大词流量
亚马逊搜索页更新!Rufus 截流大词,卖家如何保住流量?
世贸组织电商关税禁令谈判陷入僵局
AMZ123获悉,近日,据外媒报道,World Trade Organization(世贸组织)第14届部长级会议(MC14)围绕是否延长跨境电商关税禁令展开激烈讨论,但成员之间始终存在分歧。该禁令自1998年实施以来,要求各成员不对电商(如数字下载和在线服务)征收关税,并在过去近30年中每两年延长一次。在本次会议中,多方一度考虑将该禁令延长五年,甚至有草案提出将期限延长至2031年6月30日。然而,截至会议结束,各方仍未达成最终一致意见。会议在喀麦隆首都雅温得举行,为期四天,最终未能形成正式协议或部长宣言。
深圳制造又出爆款,电热冰淇淋勺在TikTok爆单
又一国产小家电火遍海外,TikTok卖家已入账数百万
亚马逊生意,加速向少数卖家集中
“强者愈强、富者愈富”的马太效应,正在亚马逊美国站疯狂上演。来自Marketplace Pulse的最新数据显示,截至2026年2月,在亚马逊美国站上,仅7760名的头部卖家就包揽了平台第三方总GMV的50%,而这部分卖家占活跃卖家总数的比例仅为1.6%。对比三年前,这项数据呈现出的趋势更为显著:2023年贡献50%份额的卖家尚有15000名,不到三年时间,撑起亚马逊半壁江山的卖家数量几乎锐减了一半,财富集中度正急剧上升。属于草根卖家的野蛮生长时代,正在彻底宣告落幕。中国卖家们在性价比的战场上大打出手,在品牌化的舞台上却有些力不从心。
2026年亚马逊权重逻辑巨变:别再堆关键词了,AI正在“冷落”你的Listing
如果你的运营思路还停留在“堆砌大词、狂烧广告”,那么你的链接很可能正在被系统悄悄降权。
趣味开瓶器爆火,靠情绪价值在TikTok拿下百万GMV
近年来,从圣诞树造型的厨房隔热垫,马卡龙配色的高颜值五金工具,再到能在浴室K歌的麦克风花洒,不难看出这些TikTok爆品的共性在于,跳出了 “纯工具、纯实用” 的刻板框架,转而以颜值、趣味、娱乐社交属性等为突破口,给人耳目一新的体验感。近期在TikTok美区,又一司空见惯的厨房用品成为被“选中的孩子”,凭借赋能后的趣味技能点在酒桌上开辟出一片“整活修罗场”。01TikTok爆款开瓶器TT123观察到,在一周的TikTok美区视频带货热销榜,新入围了一款炒热酒桌氛围的神器,发令枪开瓶器。近一周时间, 这款产品在一则播放突破420万+视频的拉动下,成为炙手可热的单品。
霍尔木兹海峡突传大消息!伊朗拟参照苏伊士运河实施收费制度,特朗普再放狠话...
全球航运、能源运输“咽喉”再起波澜。当地时间3月30日,伊朗方面释放重磅信号——正考虑对通过霍尔木兹海峡的船只实施准入许可与收费制度,模式或参照苏伊士运河等国际水道。这一动向叠加当前中东紧张局势,引发航运、能源及金融市场高度关注。美国总统特朗普再次释放强硬的信号。他在社交媒体上表示,美伊之间的磋商“已取得重大进展”,但若短期内无法达成协议且海峡未恢复正常通航,美方可能对伊朗关键基础设施实施打击,包括发电站、油井以及重要能源枢纽哈尔克岛等。霍尔木兹海峡局势近日出现新的变化。
欧盟拟对跨境电商包裹加收新处理费,最迟11月实施
AMZ123获悉,近日,欧洲议会与欧盟理事会就欧盟关税法改革达成初步协议,这是自1968年以来最重要的一次改革。该改革重点围绕电商平台责任、包裹收费机制以及海关系统数字化等方面展开,旨在加强对来自欧盟以外国家商品的监管,提升市场公平性与安全性。根据协议,未来从非欧盟国家直接寄送至欧洲消费者的商品,将新增一项“处理费用”,用于覆盖不断增长的小额包裹带来的额外海关处理成本。该费用将由负责缴纳关税的同一主体承担,以避免成本转嫁给消费者。具体收费标准将由欧盟委员会制定,并每两年进行一次评估。成员国需在相关信息系统上线后开始征收,最迟不晚于2026年11月1日实施。
境外主体也难逃!亚马逊Q4税务数据穿透公司外壳,直指中国卖家!
注册地不再是“护身符”,税务合规已成跨境生存底线!
《TikTok Shop 2025年度报告》PDF下载
2025年,TikTok Shop进一步加快扩张步伐,在巩固欧美成熟市场的同时,积极开拓新兴市场,先后上线德国、意大利、法国、日本等站点。此举不仅为平台带来新增量,也体现出其多元化市场战略的初步成效,以分散地缘政治风险。
《Shopee2025印尼站点X 汽车摩托品类专题》PDF下载
印尼当地汽车保有量并不高,每一千人的机动车保有量仅96人,未来可提升的空间仍大。空间参照系可以看泰国和马来,2024年泰国汽车保有量为322辆/千人,马来西亚为531辆/千人。
《2026年Shopee运动户外类目自行车爆品分享》PDF下载
巴西骑行爱好群体广泛,但平台上热销品呈现出的国际大牌极少,推测可能原因是国际品牌可能主要通过线下经销或自行渠道销售,未深度参与Shopee等本土电商。因此巴西用户在平台上几乎接触不到这些高端品牌产品。平台上巴西用户更倾向购买本土品牌的自行车,可能出于价格实惠和售后便利考虑。
2025年TikTok生态发展白皮书
2025年,全球内容电商迈入深度跃迁的新周期。TikTokShop正以前所未有的速度拓展市场版图,完成从高速增长向高质量增长的跃迁。在这一进程中,生态结构重构、参与者多元化、全球政策协同等因素叠加,构成内容电商演进的核心变量。
《2026美妆健康与保健创新报告》PDF下载
每年,我们都会分析美妆与个护以及健康与家居类目的动态变化。但2026 年呈现了一个意外的新现象:这两个类目不再孤立运营。美妆和健康正与食品杂货融合,形成由配方创新、成分病毒式传播和消费者行为演变所驱动的强大三方生态系统。
《中国宠物食品行业出海国别机会洞察报告》PDF下载
本报告旨在深入分析中国宠物食品的全球出口机遇与国别差异,通过对行业发展现状、出口趋势及各国政策环境的研究,揭示中国宠物食品企业在国际市场中的竞争优势与面临的潜在挑战。
《市场洞察:2025中国汽车出海英国市场动态追踪》PDF下载
根据英国汽车制造商与贸易商协会数据显示,2025年1-9月中国汽车出海英国累计销量142,684辆,同比增长91%,远超英国整体市场4.2%增速。中国汽车出海英国市场份额从年初5%升至9月12.4%,成为英国第二大汽车来源国,仅次于德国。
《2026取暖电器行业简析报告》PDF下载
系统梳理了行业发展脉络、市场格局与未来趋势。取暖电器按能源类型与产品形态可分为电取暖、燃气取暖、辅助本报告为 2026 年中国取暖电器行业专业简析,集成类三大核心品类,行业发展历经萌芽起步、快速成长、加速升级、高质量发展四大阶段,完成了从单一功能向智能化、节能化、场景化的全面演进。
AMZ123卖家导航
这个人很懒,还没有自我介绍
跨境科普达人
科普各种跨境小知识,科普那些你不知道的事...
跨境学院
跨境电商大小事,尽在跨境学院。
跨境电商干货集结
跨境电商干货集结,是结合亚马逊跨境电商卖家交流群内大家在交流过程中最常遇到的问题,进行收集整理,汇总解答,将会持续更新大家当前最常遇见的问题。欢迎大家加入跨境电商干货集结卖家交流群一起探讨。
AMZ123跨境电商
专注跨境行业热点事件报道,每日坚持推送原创深度热文
跨境平台资讯
AMZ123旗下跨境电商平台新闻栏目,专注全球跨境电商平台热点事件,为广大卖家提供跨境电商平台最新动态、最热新闻。
亚马逊全球开店
亚马逊全球开店官方公众号,致力于为中国跨境卖家提供最新,最全亚马逊全球开店资讯,运营干货分享及开店支持。
AMZ123选品观察员
选品推荐及选品技巧分享。
首页
跨境头条
文章详情
分享日出千单的亚马逊大神对Review权重的详细讲解,超级干货呀!
唐僧跨境服务
2021-09-27 10:16
2308

分享日出千单的亚马逊大神对Review权重的详细讲解,超级干货呀!

亚马逊从未对外公布过对Review权重的内容,卖家对Review权重的理解全是在运营过程中得到的经验,review的重要性,好的review和差的review对转化的影响力。


为了更好的找到Review权重的内容,换了一个思路去理解它,那就是如何甄别假review。从这个角度出发,我找到了一个网站旨在帮助消费者还原产品的真实评分。总的来说,这个网站和亚马逊都在做同一件事,就是找出假review且删除它的影响。根据网站的数据可以试着去推出竞争对手的上评方式,或者避免刷review被发现。


评分的权重由每个评论者组成,将每个Reviewer的特征整合在一起会对我们很有启发性,理解每个账号的权重出发会帮助我们理解LISTING中评分的权重。


权重因素:
1.Easy Graders 易给高评分者
2.Overrepresented participation 过度参与的群组
3.Reviews on high volume days 在评论集中日评论
4.One-Hit Wonders 一次性评论者
5.Substantial repeated phrases 大量重复短语
6.Brand Loyalists 品牌粉丝
7.Brand Monogamists 品牌铁杆粉
8.Incentivized reviews 带鼓励性质的评论
9.Brand Repeaters 品牌重复购买者
10.Take-Back Reviewers 被删过评的用户
11.Unverified purchases 未认证购买
12.Overrepresented word counts 评论字数过度参与组
13.Substantial overlapping history 交叉购买记录
14.Never-Verified Reviewers 黑号
15.Same-Day Reviewers 都在一天留评用户


One-Hit Wonders 一次性评论者:
这些账户写了一篇评论,这意味着这些账户只评论了某个产品。无偏见的评论者往往是一个网站的长期成员,他们一般不会只针对某个产品做出评论。如果某个产品有过多的一次性评论者,可以表明有操作评论的嫌疑。虽然有许多原因可能会导致某个产品中一次性评论者,但有几个常见的原因包括:假号、或以某种方式诱导不写评论的人群留评。


Take-Back Reviewers 被删过评的用户:
包括在历史记录中有删除评论的评论者。这些评论者很可疑是因为评论内容很可能是由于违反服务条款而被亚马逊删除。评论者以前曾被抓到操纵评论,不确定他们是否已停止违反规则。还有一些删评的原因:1.买家自己想删除。2.品牌联系到买家以删除评论-通常为负面评论。3.Amazon认为其违反了规则,则可能会删除评论-通常是正面评论。4.发布评论后,平台更改了规则导致删除。例如,在亚马逊更新评论政策后,许多现有的诱导性评论被删除。另一个例子是,亚马逊降低了每种产品的Vine评论上限,因此删除了许多超过该限制的Vine评论。


Single-Day Reviewers 一天评论买家:
在一天内发布了所有评论的买家被标记为一天评论买家。这些买家的账号存在疑问是因为他们没有像大多数人那样留评,也不排除心血来潮。

Substantial repeated phrases 大量重复短语:
如果使用重复短语的评论数量较多,则可能表明该评论不是自然创建的。但是仍然有很多充分的理由说明重复出现一些短语,这些短语不一定表示评论有偏见。比如电子产品,很多买家都会提到产品的功能,这些词的重复是很正常的。但是,如果有几位买家完全逐字地写了相同的营销语言或者主观性的词,则可能表明这些买家是枪手。


Overrepresented participation 过度参与的群组:
1.卖家通过礼物或其他方式让买家评论他们的产品。这会让平时不写评论的买家未为产品写评论,从而导致少留评记录的买家群体过多。


2.卖家找服务商刷,这将导致买家的结构异常。以上是Review权重的影响因素,还有一些解释。影响权重的不仅仅是买家的账号,还有LISTING下评论的结构,包括句子、上评日期等。更多的内容可以参考这个网站:http://reviewmeta.com

评论词数比较(其中一个维度)


通过算法可以发现买家操纵评论的痕迹。首先进行每一篇评论的词数比较,进而识别出不符合常规的内容。尽管买家评论的内容不受个人偏见的影响,但通过这个算法来分析所有评论中的次数可以得出某些评论数组的异常情况,从而辨别出哪些评论内容是虚假的。正常情况下评论的词数是完全随机的,所以在LISTING下的评论应该是处于一个合理的词数分布:有的长,有的短,有的介于两者之间。如果我们看到比正常情况下大很多比例的词数组,那么就有操纵评论的嫌疑。


首先将产品的每一个评论放到一个词数组。比如,一篇23字的评论属于“21-25字统计组”,一篇109字的评论属于“101-125字统计组”,一篇600字的评论属于“201+字统计组”。从字数定义我们的评论词数组,仅仅一个产品的词数分布并不能给我们有效的回答,进而需要比较产品类目的所有评论的词数分布作为一个预期分布,最后进行比较。


一旦我们得到了产品的词数分布和类目的预期词数分布。我们通过比较这两个分布并找到产品的词数分布远高于类目的预期词数分布的组。对于每一个数量较多的评论词数组进行显著性检验,确保数据不受随机因素或其他因素的影响,最终去判断这个词数组的真实情况。如果一个产品没那么多的评论,我们就通过其他维度去避免随机因素的影响。但如果这些词数组的差异在统计学是显著的,就是不符合假设,就将此组标记为占比过多词数组。(用线性回归和概率论去计算的逻辑)


有很多合理的解释去解释为什么一个产品会有一个词数组分布不符合期望的词数组分布。比如一个产品的争议性很高或者用起来很复杂,那么它在201+词数范围会有很多评论。或者有些产品设计的很简单,用起来也很简单,那么在50以下词数范围会有很多评论,就说USB数据线,能写啥,这线又长又细?你看这头又方又正?


这就是为什么要将产品的词数分布和类目的预期词数分布进行比较,而不是分析LISTING上的每个评论。不同产品的预期词数分布都有很大的差异,所以要为每一类产品建立不同的预期模型对应其类目的产品。


如果有产品不符合假设的词数组,这里面肯定是有人为干预的因素。这些因素其实无法判断是Postive还是Negative,但这些因素会造成评分出现偏差:1.买家叫粉丝来写,或者给礼物。那么为了要礼物的大多会随便写,那么在低词数组会出现一个峰值。2.买家组织“专业评论的人”写又长又详细看起来很诚实的评论,这会导致在较长的词数组出现一个峰值。3.刷单。无论自己的号还是中介,都会在数据上出现问题。典型的人工评论会一次又一次使用某几个词,有的为了节省时间就写那么几个词,这些行为在数据上都会出现异常情况。


最后,报告会挑出LISTING中不合理的词数组,如果超出了模型的预期,那么会标记为Unnatural。此外,如果LISTING中词数组很多,那么可以比较某个组的平均评分和其他组的平均评分,如果评分的差异不具备统计学意义或者说超出了合理范围,那么这个LISTING组的评论可信度是非常低的。


包含重复短语的评论(其中一个维度)
判断Review真实性的方法之一是分析LISTING中每个评论使用的短语。首先要意识到我们很难从单个评论的短语得出任何结论,但我们能汇总所有评论中的短语,然后去帮我们确认哪些评论是可能有问题的。


重复短语测试的过程比其他测试要复杂一些,首先要为一个既定的产品编辑一个曾在多个评论中使用的短语列表,其次再去确认哪些评论包含了这些短语,最后将他们的平均评分和不包含这些短语的评论的平均评分进行比较。


在编辑重复短语列表的方面,我们首先要找到一个LISTING下多个不同评论中出现3个及以上单词组成的短语,另外设置一个公式确保内容的实质性。比如三个字的短语'it was the'不具备任何意义,但'excelled all expectances'是具备实质性的。公式考虑了短语的长度、复杂性和所用单词的类型,确保列表中的每个短语不是日常英语中常用的哪些介词、不定冠词和代词之类的。


一旦我们有了重复短语的列表,那么就要检查每一个评论,看看他们是否(以及频率)使用这些短语。我们给每个评论一个权重,从词数、重复短语数量和短语的实质性方面入手。低分表示该评论中很少或没有使用重复短语,超过某个分值的评论会被标记为使用重复短语。


如果有很多评论使用某个重复短语,这些评论可能会是有问题的。首先对某些重复短语的使用是很正常的,不能直接说明问题,具体的内容还是要根据自己的判断。比如,我们经常看到买家提到某个产品的功能,这很正常,这是编写一条详细评论的必备内容。但是,如果一群买家一字不差的完全重复使用某种营销短语或主观性语言,那么这些评论是有人为操纵的嫌疑的。


为了确定这些评论的属性,我们要将所有带有重复短语的评论分组并确定它们的总体百分比。如果看到有一部分的评论中有重复短语,那并不会马上判定为是有问题的,但过多的评论是会引起嫌疑的。


接下来,我们要去对比有重复短语的评论是否比没有重复短语的评论有更高的平均评分,如果有,我们就要检验这个差异是否符合原假设。可以通过一个公式来计算数据,这个公式包含了总评分和重复短语评分的差异,通过数学模型去判断这种差异的合理性。如果有重复词评论的评分比没用重复词的评分高很多,且不符合原假设,那么可以认为这个重复词组的评分是有人为操纵的嫌疑的。(显著性检验)

咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部