AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境问答正文

怎么对AB测试的结果做分析

2025-04-26 20:2768


本文目录

  1. ab型人格测试分析
  2. AB测试介绍与案例分析
  3. 详解完整的AB测试流程
  4. 关于AA测试和AB测试的一些思考

ab型人格测试分析

ab型人格测试分析

AB型人格测试是一种常见的性格测试,它能够揭示人们的性格特质和个性倾向。AB型人格的人通常被认为具有复杂的性格,既有A型人格的冲动和着急,也有B型人格的冷静和慢性子。本文将从多个角度分析AB型人格测试,并展示一些有用的结论和建议。

1.什么是AB型人格?

AB型人格指的是一种既有A型人格的特质,又有B型人格的特质的人。A型人格的特点是热情、积极、竞争心强、易冲动、容易压力大,而B型人格的特点是冷静、沉着、不论事情如何都不会特别紧张,但气质比较软和散漫,也不太有冲劲。AB型人格则是这两种性格特质的结合,能够兼具A和B型人格的优点。AB型人格测试通过对被试者的性格特点的测试,得出一个人是否为AB型人格。

2. AB型人格测试有哪些方面?

AB型人格测试可以从多个方面进行测试,以反映人们的性格特质、行为模式、情感状态等。以下是一些常见的测试方面:

(1)性格类型:测试结果会告诉你,你的性格类型是什么,包括是否为AB型人格、A型人格、B型人格还是其他类型的人格。

(2)做事方式:测试会测试你的工作习惯、思维方式、任务执行效率等方面,以反映你在工作学习等方面的表现。

(3)情感状态:测试会测试你的情绪管理能力、压力抗衡能力等方面,以反映你的情感状态。

3. AB型人格测试的意义

AB型人格测试的意义在于,通过对测试结果的分析,可以更深入地了解一个人的个性特征和行为模式。测试结果可以帮助人们更好地了解自己,提高自我认知水平,从而更好地发掘自己的优势和缺陷,增强自身实力。此外,测试结果还可以为人们的择业、职业发展、学习规划提供借鉴和建议。

4.如何应对AB型人格的缺点?

虽然AB型人格具有A型人格和B型人格的优点,但也会有一些缺点。比如,AB型人格容易着急、冲动,也容易失去耐心和兴致,导致做事不够稳定。因此,要避免AB型人格的缺点,需要有针对性地进行一些自我修炼和自我调节。例如:保持一颗平静的心态,不要过于焦虑和紧张;加强自我控制,避免情绪波动过大;定时休息,避免疲劳和压力过大等。

AB测试介绍与案例分析

AB测试介绍:

概念:AB测试是为web或APP界面、流程等制作两个或多个版本,在同一时间维度,分别让成分相同的访客群随机访问这些版本,收集各群组的用户体验数据和业务数据,最后分析评估出最优版本并正式采用。简而言之,AB测试是通过设计对照实验来对比不同版本的效果。

关键点:

对照实验:需要有两个或多个版本的对照。随机分配:访客群需随机访问不同版本。数据收集与分析:收集用户体验和业务数据,并进行评估分析。

AB测试案例分析:

明确问题:案例中,目标是对web新旧页面的AB测试结果进行分析,判断两者在用户转化情况上是否有显著区别。

数据准备:

导入数据:使用分析包导入数据文件,并查看数据字段及其含义。数据清洗:处理异常值和重复值。

假设检验:

确定假设:设定零假设和备选假设。检验方向:根据备选假设确定检验方向。抽样分布类型:根据数据特点确定抽样分布类型。检验类型和统计量:选择合适的检验类型和计算检验统计量。显著性水平:设定显著性水平,用于判断结果是否显著。

结果分析:

计算统计量:使用公式或Python函数计算检验统计量,并与显著性水平对应的分位数进行比较。判断结果:根据统计量是否落入拒绝域来判断是否拒绝零假设。效应量分析:计算效应量来衡量差异的大小。

结论:

转化率对比:新页面平均转化率略高于旧页面。统计显著性:在显著性水平5%下,新页面转化率高于旧页面的结论是统计显著的。效应量:尽管有统计显著差异,但效应量很小,说明新旧页面转化率差异不大。

详解完整的AB测试流程

本文详细剖析了完整的AB测试流程,包括关键步骤及其作用。

首先,AB测试流程涉及以下几个步骤:

选择实验指标:确定核心指标,如点击转化率,同时设定观测和反向指标以全面评估效果。

构建实验假设:针对核心指标设定零假设(无影响)和备择假设(有提升),明确实验目标。

实验单位选择:用户、设备或行为粒度,其中用户粒度最推荐,以确保数据置信。

设定最小提升预期:考虑成本效益,设定实验成功的基本标准。

计算最小样本量:确保实验功效,避免无效流量投入和错误结论。

流量分割策略:互斥或正交实验设计,合理分配流量。

确定实验时长:考虑样本量、用户活跃度和可能的周期性变化。

数据统计:采用合适的检验方法(T或Z检验),关注diff、p值和置信区间。

得出评估实验结果的显著性,考虑是否推广,以及MDE最小检测效应。

理解这些步骤有助于确保AB测试的有效性和准确性。若遇到不显著结果,可通过调整策略或增加样本量来优化实验。希望这些指导对您的实践有所帮助,欢迎讨论。

关于AA测试和AB测试的一些思考

老规矩,由于对知乎平台的怀疑,我一定多写一份写在我的博客,作为防删备份:

起因

一般的AA/AB测试都怎么做呢?正常来说,取一部分用户,然后把用户分成2组(也可以是多组,本文中我们只讨论最典型的2组的情况),在一段时间的运行以后,比较其结果。

AB测试自不必说,主要测试新的算法在指定的监测指标上又没有达到预期,AA测试则一般用来测试AB测试和用户的稳定性,也可以作为AB测试的一个预演和对AB测试工具的测试。有了AA测试,可以对AB测试的结果更为自信,当然,也有很多的文章讨论AA测试究竟是不是必要的,例如这一篇:A/A Testing: A Waste of Time or Useful Best Practice?

就我的实践而言,AB测试中的确容易出现两组天然存在指标差异的情况,尤其是样本或者用户少的时候更容易发生,比如有的时候你就是不幸多分了几个Heavy User到某一个组去,导致你怎么测试都得不到正确的结果……当然,在实践中,这个问题造成的误差并不大,一般CTR误差都在0.1%这个量级,而且误差可以随着时间收敛,基本算法带来的提升都应该能覆盖这个误差。

AB测试中出现两组天然存在指标差异带来的更大问题是,AA测试通不过,有的时候换个分组的Salt Key结果就不一样了。造成这个问题的原因是,随着采样数据的上升,AA测试中两组的方差都逐渐收敛,这个时候两组之间的天然差异会被“固化”,这个时候AA测试就失败了。

这个问题困扰我们挺久,但是到我们之前的AA测试只有Pass/Fail两个结果,所以我们考虑不妨把AA测试变成标定AB测试的工具,故事就从这里开始了。

改善

假设在一次试验(或者试验的某个片段中)收集到如下数据:

我们假定点击这个事件是服从Bernoulli分布的,也就是每次展示等价于抛一枚正反面概率固定为p的硬币(这里的假设是错误的,爆款新闻,突发事件,甚至只是单纯的周末或者深夜等等特殊时间都会影响点击率)。那我们做了N次这样的试验,所以 [公式],C指的就是点击次数这个随机变量,p是二项分布试验的概率,那么C/N自然就是实际观测到的点击(转换)率CTR了,之后我们用符号x表示这个变量。根据中心极限定理,当n特别大的时候,C是服从正态分布的(注意了,N一定要特别大),表达为 [公式]。我们稍作转换 [公式]。我们用表中的数据代入,我们就可以得到对照组和测试组的点击率分布。记作: [公式]和 [公式]。其中, [公式], [公式]。这里我们遇到第二个有点脏的点:用观测的CTR取代 [公式],好在CTR是 [公式]的无偏估计,N又特别大,忍了。

直观的画出来,大概长这个样子:

我觉得两个随机变量还是太多,由于我们关注的并不是CTR本身,而是CTR的差异。不妨设[公式],我们可以根据正态分布求和公式轻易得到 [公式]。

到此为止,我们所有的理论准备完成。

实战AA测试

AA测试,主要是估计一个提升的下确界,也就是我们最少要提升多少CTR,这个CTR甚至有可能是负数。举个例子,当试验组就是比对照组CTR要小一些的时候,哪怕在之后的测试中两者持平,我也可以判定对照组胜利,这和于老爷子出门没捡着钱就算丢的理论有异曲同工之妙。

在求这个数值之前,我们首先要确定一个单侧的置信度,比如0.05,或者0.01,根据你的容忍程度决定。随后我们可以根据这个数值,计算我们最少应该提升的CTR,如果形象的画个示意图,差不多是这个样子:

简单的写个代码实现一下:

AB测试

我们用AA测试得到了一个最少提升的参数,不妨记这个最小提升为ϵepsilonϵ。

那我们AB测试究竟过了没有(过了的意思是,测试组的算法对于对照组来说有提升),或者说,我们能以怎样的置信度判断AB测试过了。也就是说我们要求: [公式]。由于 [公式],所以也就是判断 [公式]。

根据公式很容易得到:

[公式]

简单的写个代码实现一下:

展望

其实我们不仅仅可以使用正态分布,我们还可以借鉴Thompson Sampling中的思路,利用Beta分布对CTR进行建模,而Bandit本身,其实可以看作一个实时的,特殊的AB Testing。详细可以参见这篇:

但是我还没搞出来,因为还没有得到CTR误差的解析解。而Thompson Sampling是利用一种类似蒙特卡洛的方式来解决这个问题的。

等我下次无聊的时候,或许会尝试去计算一下吧。

写得比较急,要出门了,请各位帮忙纠错了,错别字也行。

感谢@萝卜他姓胡的勘误,norm的第二个参数的输入是标准差不是方差。

AMZ123跨境卖家导航旗下公众号【AMZ123跨境电商】深耕跨境行业,专注热点报道。
扫描右边二维码,关注后回复【加群】,加入优质卖家交流群~
目前30W+卖家关注我们
二维码
最新热门报告作者标签
DHL将在波兰新建货运航站楼,每小时处理超6000件包裹
AMZ123获悉,近日,据外媒报道,DHL与Górnośląskie Towarzystwo Lotnicze达成合作协议,计划在波兰卡托维兹(Katowice)机场建设一座新的货运航站楼。根据协议,该项目预计在2028年底前完成建设,并于2029年正式投入使用。新航站楼将直接连接机场停机坪,设计处理能力最高可达每小时6000件货物。根据规划,新设施将包含约4500平方米的仓储空间,配备13个干线运输装卸口和60个快递装卸口,并预留扩展空间。此外,项目还将建设约1500平方米的三层办公区域。DHL将在新航站楼内部署先进的自动分拣系统,使整体处理效率达到每小时最多6000件包裹,从而显著提升运营能力。
需求上升,Allegro推出二手产品大促活动
AMZ123获悉,近日,据外媒报道,波兰电商平台Allegro启动了“Outlet热销(Hity Outletu)”促销活动,集中销售翻新、展示机以及退货类电子产品。该活动将持续至4月30日,Allegro预计通过约10万条带有“Hit Outletu”标识的商品,帮助消费者以更低价格购买到由专业卖家提供、成色较好的电子设备。此次促销活动覆盖多个主流品牌产品,包括苹果、三星和索尼等,品类涵盖智能手机、笔记本电脑、游戏主机以及各类家用电子设备。所有参与活动的商品均需满足一定标准,包括买家评分不低于4.5分,并且需从波兰本地发货。
玻璃水瓶靠“极简美学”,在TikTok美区月入上百万
TikTok喝水瓶赛道现“新贵”,上线28天卖了110万
遭垄断指控!印尼监管机构初步审查TikTok Shop
AMZ123获悉,近日,据外媒报道,印尼竞争监管机构(KPPU)已收到来自电商物流协会Asosiasi Pengusaha Logistik E-commerce(APLE)的正式报告,内容涉及对TikTok Pte. Ltd.、TikTok Nusantara (SG) Pte. Ltd.、与Tokopedia整合的TikTok Shop涉嫌垄断和不正当竞争行为的指控。KPPU方面披露,该报告于4月15日提交,目前已进入初步审查阶段。监管机构将对材料的行政完整性进行审核,并评估是否存在违反《1999年第5号关于禁止垄断和不正当竞争行为法》的初步迹象。
AI支出飙升!字节25年净利润同比下滑超70%
加拿大运动品牌lululemon在墨西哥正式上线电商网站,加快推进线上与线下一体化布局。
美国正式退税,头部卖家最新回应!
美国关税退款终于进入实操阶段。此前AMZ123在文章中提到,当地时间4月13日,美国海关与边境保护局(CBP)发布公告称,其已基本完成向进口商大规模进行关税退款的报关系统(CAPE)新功能第一阶段研发,将于2026年4月20日正式部署上线。而在昨日,CAPE系统正式落地,市场盯了许久的这笔退款,也终于开始进入实际申报环节。AMZ123获悉,从CBP最新发布的消息来看,CAPE系统已经正式投入使用,进口商以及经授权的报关行,现已可以通过ACE门户提交相关退款申报。这意味着,围绕IEEPA关税退款的处理,终于有了一个正式入口。
25年欧洲电商平台销售额占比已达61%,影响力持续提升
AMZ123获悉,近日,根据ECDB最新数据,2025年,电商平台(marketplaces)占欧洲电商商品交易总额(GMV)的61%,成为线上交易的主要渠道。相比之下,品牌自营网站(first-party online stores)仅占16.6%,约为整体线上交易规模的六分之一。数据还显示,这一趋势在全球范围内更加明显,2025年全球电商中,电商平台销售额占比已达到83.4%,意味着绝大多数在线交易都发生在第三方电商平台上。从时间维度来看,欧洲平台化趋势正在持续加强。电商平台在欧洲的GMV占比从2023年的56.2%提升至2025年的60.8%,两年内增长明显。
亚马逊Alexa+进军墨西哥市场
AMZ123获悉,近日,亚马逊宣布,在墨西哥推出新一代语音助手 Alexa+,这是该产品首次进入非英语市场。此次上线不仅是语言扩展,更强调对本地文化的理解。根据官方信息,Alexa+在墨西哥的版本能够理解当地的语言习惯、幽默表达以及社交语境。例如,它不仅能识别西班牙语,还能理解墨西哥常见的俚语和表达方式,如“chido”(表示“很棒”)以及“buena onda”(形容人很好)。此外,“ahorita”这一词在不同语境下可能表示几分钟或更长时间,系统也能够根据具体场景进行判断。这种能力来自于对当地文化数据的深度训练,包括电视节目文本和社交媒体内容,使模型不仅理解字面含义,还能掌握隐含的社会规则。
亚马逊价格垄断案将于2027年开庭
AMZ123获悉,近日,据外媒报道,美国加利福尼亚州总检察长办公室披露了一批此前被遮盖的内部文件,指控亚马逊在其电商平台上对第三方卖家施压,要求其在其他平台(如沃尔玛和塔吉特)上提高商品价格,以维持亚马逊平台上的价格优势。亚马逊方面则否认存在价格操控行为。这批文件包括内部邮件、证词记录以及公司机密演示材料,是加州总检察长Rob Bonta在2022年提起的反垄断诉讼的一部分。相关材料已提交至旧金山高等法院,但尚未完全公开。根据披露内容,部分此前被大面积遮挡的段落和页面已被解密,但仍有部分内容在亚马逊要求下被保留。
亚马逊虚拟视频认证都答对也不过?一批法人挂在“背题”上…
近些年来,随着亚马逊合规化进程的加速,关于视频认证的消息愈发层出不穷:“视频认证不过将被封号、亚马逊收紧审查”等频频成为悬在卖家头上的达摩克里斯之剑。 为避免最坏的结果,不少卖家往往会提前让法人做足准备——根据市面上多数服务商的建议,让法人背题库,独自上阵。然而从近期业内反馈来看,这种“靠背题通关”的模式在如今的审查员面前,已经没有以前那么好用了。凯漩跨境创始人王跃凯直言:部分审核员现在专查“假关系”和“念稿人”,自信、自然、行为不诡异,比死记硬背标准答案重要一万倍。
月入超百万,TikTok又一厨房神器靠AI带货爆单
登顶TikTok榜一,2元“削皮神器”在海外卖爆了
亚马逊Q1美妆榜Top25:Medicube登顶
AMZ123获悉,近日,根据BeautyMatter发布的2026年第一季度亚马逊美妆与个护类目销量榜单,消费者需求正在进一步向高频使用、日常护理类产品集中,护肤品占比显著提升,同时跨渠道引流和转化成为品牌增长的重要驱动力。从具体排名来看,2026年第一季度Top 25榜单由Medicube Toner Pads Zero Pore Pad 2.0(收缩毛孔化妆棉片)位列第一,这是该产品自2025年第一季度进入榜单以来首次登顶。
亚马逊新建美国尤马市配送中心,加快美墨跨境电商配送
AMZ123获悉,近日,亚马逊在美国亚利桑那州尤马市新建并启用一座配送中心,该项目不仅优化了区域物流网络,也对跨境电商配送产生直接影响。该配送中心的设立,主要用于提升区域内包裹分发与运输效率。随着该设施投入使用,当地整体配送速度得到提升,同时为当地创造了超过200个就业岗位,涵盖仓储、分拣及配送等多个环节。这一举措也使尤马在美国西南部物流网络中的地位进一步提升,成为连接区域电商运输的重要节点。从区域影响来看,该配送中心不仅服务美国本土市场,还对邻近的跨境电商物流产生带动作用。由于尤马靠近美墨边境,该设施有助于加快面向墨西哥西北部地区的商品配送,尤其是对圣路易斯里奥科罗拉多等城市的订单履约效率带来明显改善。
能“变脸”的抽象眼罩在TikTok热度飙升!7天卖了40多万
丑萌成睡眠经济又一流量密码,TikTok一款眼罩7天爆单6000+
亚马逊被指控干预品牌定价,涉及Levi’s、Hanes等
AMZ123获悉,近日,据外媒报道,美国加州总检察长公布的一批最新解密文件显示,在针对亚马逊的反垄断诉讼中,监管机构指控亚马逊通过多种方式影响市场价格,并要求合作品牌在其他电商平台上提高售价,从而维持其平台价格优势。这些文件属于2022年提起的诉讼的一部分,内容包括企业内部沟通记录以及与供应商之间的往来信息,进一步揭示了相关操作细节。根据加州总检察长罗布·邦塔披露的信息,亚马逊曾向多家大型品牌施压,包括Levi Strauss和Hanes,要求它们推动竞争对手平台如沃尔玛、塔吉特和家得宝上的商品价格上涨。监管机构认为,这种做法属于价格操控行为,可能抬高整个市场的商品价格。
泰国启动全面税改,跨境电商平台拟征20%所得税
AMZ123获悉,近日,泰国参议院经济、货币与财政事务委员会提出一份涵盖广泛的税制改革方案,其中包括上调增值税(VAT),以应对不断上升的公共债务风险。该方案预计将在未来几年内逐步影响财政结构,并引发社会与经济层面的广泛讨论。该委员会由参议员Kamphon Suphaphaeng担任主席,目前已完成税制重组研究,并计划于4月21日提交参议院审议,随后再转交内阁进一步处理。报告指出,泰国过去十年的财政赤字长期存在,平均约占国内生产总值(GDP)的4%,已高于财政可持续框架设定的3%上限。报告认为,这一问题部分源于以政治目标为导向的税收政策,使政府收入难以覆盖不断增长的支出需求。
《全球电商平台概览报告》PDF下载
全球正在见证新形态、新商机的诞生:TIKTOKSHOP以兴趣驱动形成新的内容和交易闭环;TEMU和SHEIN用中国制造加速物流体系挑战传统平台节奏;而在东南亚、拉美、中东等市场,本地平台构建起自己的流量生态与支付和履约体系。电商平台不再是可供挑选的“销售渠道”,而是彼此割裂、竞争激烈的“市场入口
《2026年值得关注的全球营销趋势报告》PDF下载
本指南重点介绍的2026年15项重大趋势,值得每一位传播、公关以及社交媒体领域负责人关注。这些趋势涵盖:从答案引擎优化(也被称作生成式引擎优化) 的兴起到红人电商的专业化进程;从视频内容的全面主导到社会化客户关怀的关键作用。
《2025东南亚膳食营养补充剂市场报告》PDF下载
基于2025年Shopee平台全年数据,东南亚膳食营养补充剂市场总规模已达25.32亿美元。该市场呈现出以泰国和印度尼西亚为核心的双核心结构,二者合计占总市场份额的46.5%。
《全球产业深度研究之清真经济专题》PDF下载
印度尼西亚是全球最大清真消费市场,规模达到2650亿美元;马来西亚是全球认证标准输出中心;沙特阿拉伯是GCC(海湾阿拉伯国家合作委员会)具有战略价值的清真枢纽。这三个国家形成了清真消费三大市场占比60%。
《TikTok Shop2026欧美运动户外类目报告》PDF下载
欧美市场总GMV为15.11亿,整体结构呈现极度集中化的特征,其中美国站点的GMV高达12.32亿,占据了欧美市场的81.52%,月均GMV超过1.02亿。英国站点以 2.40亿的GMV和15.89%的份额位居第二。两大站点贡献了市场总GMV的97%以上。
《TikTok Shop2026东南亚运动户外类目报告》PDF下载
作为东南亚各站点的支柱品类,运动户外凭借其深厚的消费群体基础与高社交属性,相比其他品类规模优势显著,并在近12个月继续保持强劲增长。近一年内,东南亚地区该品类总GMV逼近百亿美元,其中泰国站表现尤为突出,GMV突破4.7亿美元;马印尼站紧随其后,GMV近4亿美元。
《2026中国新能源智能汽车产业链出海研究报告》PDF下载
海外主要汽车市场的国家/地区政策出现分化:以德国、意大利为代表的欧洲主要汽车生产国,携其本土汽车产业巨头,共同构成了推动欧盟调整“禁燃令”的主导力量。从本质上看,此次政策调整的进程,折射出欧盟内部不同国家与产业利益集团之间的复杂博弈。泰国、马来西亚和巴西现阶段开始偏好汽车产能的实际落地希望引入长期资本以支持当地的经济发展。
跨境学院
跨境电商大小事,尽在跨境学院。
亚马逊公告
AMZ123旗下亚马逊公告发布平台,实时更新亚马逊最新公告,致力打造最及时和有态度的亚马逊公告栏目!
跨境数据中心
聚合海量跨境数据,输出跨境研究智慧。
AMZ123跨境电商
专注跨境行业热点事件报道,每日坚持推送原创深度热文
AMZ123会员
「AMZ123会员」为出海者推出的一站式私享服务
跨境电商赢商荟
跨境电商行业唯一一家一年365天不断更的媒体!
亿邦动力网
消除一切电商知识鸿沟,每日发布独家重磅新闻。
AMZ123选品观察员
选品推荐及选品技巧分享。
咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部