AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境问答正文

怎么对AB测试的结果做分析

2025-04-26 20:2772


本文目录

  1. ab型人格测试分析
  2. AB测试介绍与案例分析
  3. 详解完整的AB测试流程
  4. 关于AA测试和AB测试的一些思考

ab型人格测试分析

ab型人格测试分析

AB型人格测试是一种常见的性格测试,它能够揭示人们的性格特质和个性倾向。AB型人格的人通常被认为具有复杂的性格,既有A型人格的冲动和着急,也有B型人格的冷静和慢性子。本文将从多个角度分析AB型人格测试,并展示一些有用的结论和建议。

1.什么是AB型人格?

AB型人格指的是一种既有A型人格的特质,又有B型人格的特质的人。A型人格的特点是热情、积极、竞争心强、易冲动、容易压力大,而B型人格的特点是冷静、沉着、不论事情如何都不会特别紧张,但气质比较软和散漫,也不太有冲劲。AB型人格则是这两种性格特质的结合,能够兼具A和B型人格的优点。AB型人格测试通过对被试者的性格特点的测试,得出一个人是否为AB型人格。

2. AB型人格测试有哪些方面?

AB型人格测试可以从多个方面进行测试,以反映人们的性格特质、行为模式、情感状态等。以下是一些常见的测试方面:

(1)性格类型:测试结果会告诉你,你的性格类型是什么,包括是否为AB型人格、A型人格、B型人格还是其他类型的人格。

(2)做事方式:测试会测试你的工作习惯、思维方式、任务执行效率等方面,以反映你在工作学习等方面的表现。

(3)情感状态:测试会测试你的情绪管理能力、压力抗衡能力等方面,以反映你的情感状态。

3. AB型人格测试的意义

AB型人格测试的意义在于,通过对测试结果的分析,可以更深入地了解一个人的个性特征和行为模式。测试结果可以帮助人们更好地了解自己,提高自我认知水平,从而更好地发掘自己的优势和缺陷,增强自身实力。此外,测试结果还可以为人们的择业、职业发展、学习规划提供借鉴和建议。

4.如何应对AB型人格的缺点?

虽然AB型人格具有A型人格和B型人格的优点,但也会有一些缺点。比如,AB型人格容易着急、冲动,也容易失去耐心和兴致,导致做事不够稳定。因此,要避免AB型人格的缺点,需要有针对性地进行一些自我修炼和自我调节。例如:保持一颗平静的心态,不要过于焦虑和紧张;加强自我控制,避免情绪波动过大;定时休息,避免疲劳和压力过大等。

AB测试介绍与案例分析

AB测试介绍:

概念:AB测试是为web或APP界面、流程等制作两个或多个版本,在同一时间维度,分别让成分相同的访客群随机访问这些版本,收集各群组的用户体验数据和业务数据,最后分析评估出最优版本并正式采用。简而言之,AB测试是通过设计对照实验来对比不同版本的效果。

关键点:

对照实验:需要有两个或多个版本的对照。随机分配:访客群需随机访问不同版本。数据收集与分析:收集用户体验和业务数据,并进行评估分析。

AB测试案例分析:

明确问题:案例中,目标是对web新旧页面的AB测试结果进行分析,判断两者在用户转化情况上是否有显著区别。

数据准备:

导入数据:使用分析包导入数据文件,并查看数据字段及其含义。数据清洗:处理异常值和重复值。

假设检验:

确定假设:设定零假设和备选假设。检验方向:根据备选假设确定检验方向。抽样分布类型:根据数据特点确定抽样分布类型。检验类型和统计量:选择合适的检验类型和计算检验统计量。显著性水平:设定显著性水平,用于判断结果是否显著。

结果分析:

计算统计量:使用公式或Python函数计算检验统计量,并与显著性水平对应的分位数进行比较。判断结果:根据统计量是否落入拒绝域来判断是否拒绝零假设。效应量分析:计算效应量来衡量差异的大小。

结论:

转化率对比:新页面平均转化率略高于旧页面。统计显著性:在显著性水平5%下,新页面转化率高于旧页面的结论是统计显著的。效应量:尽管有统计显著差异,但效应量很小,说明新旧页面转化率差异不大。

详解完整的AB测试流程

本文详细剖析了完整的AB测试流程,包括关键步骤及其作用。

首先,AB测试流程涉及以下几个步骤:

选择实验指标:确定核心指标,如点击转化率,同时设定观测和反向指标以全面评估效果。

构建实验假设:针对核心指标设定零假设(无影响)和备择假设(有提升),明确实验目标。

实验单位选择:用户、设备或行为粒度,其中用户粒度最推荐,以确保数据置信。

设定最小提升预期:考虑成本效益,设定实验成功的基本标准。

计算最小样本量:确保实验功效,避免无效流量投入和错误结论。

流量分割策略:互斥或正交实验设计,合理分配流量。

确定实验时长:考虑样本量、用户活跃度和可能的周期性变化。

数据统计:采用合适的检验方法(T或Z检验),关注diff、p值和置信区间。

得出评估实验结果的显著性,考虑是否推广,以及MDE最小检测效应。

理解这些步骤有助于确保AB测试的有效性和准确性。若遇到不显著结果,可通过调整策略或增加样本量来优化实验。希望这些指导对您的实践有所帮助,欢迎讨论。

关于AA测试和AB测试的一些思考

老规矩,由于对知乎平台的怀疑,我一定多写一份写在我的博客,作为防删备份:

起因

一般的AA/AB测试都怎么做呢?正常来说,取一部分用户,然后把用户分成2组(也可以是多组,本文中我们只讨论最典型的2组的情况),在一段时间的运行以后,比较其结果。

AB测试自不必说,主要测试新的算法在指定的监测指标上又没有达到预期,AA测试则一般用来测试AB测试和用户的稳定性,也可以作为AB测试的一个预演和对AB测试工具的测试。有了AA测试,可以对AB测试的结果更为自信,当然,也有很多的文章讨论AA测试究竟是不是必要的,例如这一篇:A/A Testing: A Waste of Time or Useful Best Practice?

就我的实践而言,AB测试中的确容易出现两组天然存在指标差异的情况,尤其是样本或者用户少的时候更容易发生,比如有的时候你就是不幸多分了几个Heavy User到某一个组去,导致你怎么测试都得不到正确的结果……当然,在实践中,这个问题造成的误差并不大,一般CTR误差都在0.1%这个量级,而且误差可以随着时间收敛,基本算法带来的提升都应该能覆盖这个误差。

AB测试中出现两组天然存在指标差异带来的更大问题是,AA测试通不过,有的时候换个分组的Salt Key结果就不一样了。造成这个问题的原因是,随着采样数据的上升,AA测试中两组的方差都逐渐收敛,这个时候两组之间的天然差异会被“固化”,这个时候AA测试就失败了。

这个问题困扰我们挺久,但是到我们之前的AA测试只有Pass/Fail两个结果,所以我们考虑不妨把AA测试变成标定AB测试的工具,故事就从这里开始了。

改善

假设在一次试验(或者试验的某个片段中)收集到如下数据:

我们假定点击这个事件是服从Bernoulli分布的,也就是每次展示等价于抛一枚正反面概率固定为p的硬币(这里的假设是错误的,爆款新闻,突发事件,甚至只是单纯的周末或者深夜等等特殊时间都会影响点击率)。那我们做了N次这样的试验,所以 [公式],C指的就是点击次数这个随机变量,p是二项分布试验的概率,那么C/N自然就是实际观测到的点击(转换)率CTR了,之后我们用符号x表示这个变量。根据中心极限定理,当n特别大的时候,C是服从正态分布的(注意了,N一定要特别大),表达为 [公式]。我们稍作转换 [公式]。我们用表中的数据代入,我们就可以得到对照组和测试组的点击率分布。记作: [公式]和 [公式]。其中, [公式], [公式]。这里我们遇到第二个有点脏的点:用观测的CTR取代 [公式],好在CTR是 [公式]的无偏估计,N又特别大,忍了。

直观的画出来,大概长这个样子:

我觉得两个随机变量还是太多,由于我们关注的并不是CTR本身,而是CTR的差异。不妨设[公式],我们可以根据正态分布求和公式轻易得到 [公式]。

到此为止,我们所有的理论准备完成。

实战AA测试

AA测试,主要是估计一个提升的下确界,也就是我们最少要提升多少CTR,这个CTR甚至有可能是负数。举个例子,当试验组就是比对照组CTR要小一些的时候,哪怕在之后的测试中两者持平,我也可以判定对照组胜利,这和于老爷子出门没捡着钱就算丢的理论有异曲同工之妙。

在求这个数值之前,我们首先要确定一个单侧的置信度,比如0.05,或者0.01,根据你的容忍程度决定。随后我们可以根据这个数值,计算我们最少应该提升的CTR,如果形象的画个示意图,差不多是这个样子:

简单的写个代码实现一下:

AB测试

我们用AA测试得到了一个最少提升的参数,不妨记这个最小提升为ϵepsilonϵ。

那我们AB测试究竟过了没有(过了的意思是,测试组的算法对于对照组来说有提升),或者说,我们能以怎样的置信度判断AB测试过了。也就是说我们要求: [公式]。由于 [公式],所以也就是判断 [公式]。

根据公式很容易得到:

[公式]

简单的写个代码实现一下:

展望

其实我们不仅仅可以使用正态分布,我们还可以借鉴Thompson Sampling中的思路,利用Beta分布对CTR进行建模,而Bandit本身,其实可以看作一个实时的,特殊的AB Testing。详细可以参见这篇:

但是我还没搞出来,因为还没有得到CTR误差的解析解。而Thompson Sampling是利用一种类似蒙特卡洛的方式来解决这个问题的。

等我下次无聊的时候,或许会尝试去计算一下吧。

写得比较急,要出门了,请各位帮忙纠错了,错别字也行。

感谢@萝卜他姓胡的勘误,norm的第二个参数的输入是标准差不是方差。

AMZ123跨境卖家导航旗下公众号【AMZ123跨境电商】深耕跨境行业,专注热点报道。
扫描右边二维码,关注后回复【加群】,加入优质卖家交流群~
目前30W+卖家关注我们
二维码
最新热门报告作者标签
波兰5月销售趋势:电商订单量增长14.4%,,客单价持续下滑
5月份波兰在线销售额环比增长9.6%,订单量增长14.4%。不过,消费者单次购买金额有所下降,平均购物篮金额下降4.2%,降至197.4兹罗提。
沃尔玛首次向海外用户开放美国商城
沃尔玛首次允许美国以外的消费者直接购买Walmart.com数字商城中的商品,并由沃尔玛负责配送。墨西哥成为这一跨境业务的首个国际市场,消费者将能够购买来自沃尔玛美国线上商城数十万款商品。
《全球电商市场报告——拉美篇》重磅上线!
美客多、亚马逊、Temu三足鼎立!拉美电商格局正经历剧烈洗牌
Visa接入ChatGPT AI代理购物功能
Visa已将其支付网络接入ChatGPT,AI代理不仅能够向用户推荐商品,还能够代表用户完成购买和支付流程。
华凯易佰拟3.2亿元加码银发经济,收购HOMLAND相关资产
华凯易佰拟收购HOMLAND相关资产,交易总额达3.2亿元
Nuvei达成27.5亿美元派安盈收购协议
加拿大金融科技公司Nuvei宣布,已与跨境支付平台Payoneer(派安盈)达成最终收购协议。根据协议条款,Nuvei将以每股7.40美元现金收购Payoneer全部已发行普通股,交易股权价值约为27.5亿美元。
别被“情绪”左右“行动”。
现状存在的意义只有一个:为改变提供支点。
研究院观察|从成都车库到全球第一,它只用了十年!
2014年,一款名为Z3的智能投影仪在京东上线,一个多月内刷新了投影类目销量纪录。它就是极米科技(XGIMI)。
一张山东遮阳网,28天在TikTok美区捞金上百万
跨境卖家在TikTok,靠一张“工地遮阳网”发家了
沃尔玛联手谷歌对打亚马逊;“百亿补贴”非真百亿,5家电商平台被约谈;钉钉换帅,陈宇森接任CEO
一周要闻速览“百亿补贴”非真百亿,5家电商平台被约谈 6月11日,北京市市场监督管理局约谈淘宝(天猫)、京东、拼多多、抖音、小红书5家电商平台,通报平台“内卷式”竞争综合整治发现的第二批典型问题。淘宝(天猫):2026年5月起,在媒体和应用程序端广泛宣传“6·18百亿补贴”活动,但事实上,百亿补贴并非“6·18”期间平台投入百亿资金补贴消费者,实际是一项长期的营销活动,平台多次拒绝提供本次“6·18”活动期间投入的实际补贴金额及平台、商家间的出资比例。平台未在显著位置公示“百亿补贴”相关活动规则,“百亿补贴”频道内部分商品未公示实际销售者资质信息。
上线仅三天遭遇美国管制!Anthropic关停两款顶尖AI新模型
从正式上线到遭遇管制,前后仅间隔三天时间。
MSC警告
明年起新运力集中交付将给市场带来压力MSC看好未来两个季度市场表现,但认为2027年起全球集装箱航运业将面临新船集中交付与红海复航带来的双重运力压力,行业供需格局或再次转向宽松。根据DNB Carnegie发布的纪要,MSC首席执行官索伦·托夫特(Søren Toft)表示,当前由需求增长和库存补库推动的市场利好因素,未来可能会被大量新船交付所带来的压力所取代。MSC认为,未来两个季度集装箱航运市场仍将保持强劲,主要受跨太平洋航线需求增长推动。在与DNB Carnegie的电话会议中,索伦·托夫特指出,目前跨太平洋贸易表现强劲,主要原因在于美国企业持续补充库存,以及市场对新一轮关税政策的担忧再度升温。
又一宠物用品成世界杯顶流!在TikTok单日售出17万
把宠物球衣做成世界杯爆款,TikTok卖家单日喜提17万GMV
罚单来了!每张AI模特图都可能罚$5000,亚马逊卖家速查Listing
FTC新规6月15日正式生效,亚马逊要求所有AI模特图须明确标注,违者每次违规最高罚款5000美元,已有卖家被警告,务必立即排查。
美国关税退还超1484亿元,已有卖家收到!
美国关税政策带来的不确定性,仍在持续作用于全球贸易环境。仅从消费端来看,美国消费者信心指数有所回升,但对经济前景仍相对悲观。美国密歇根大学最新调查显示,6月美国消费者信心指数初值为48.9,较5月的44.8有所改善,但仍明显低于去年同期的60.7,主要系感受到了通胀加剧带来的压力——而这,显然与关税政策脱不开干系。日前,美国财政部发布的月度财政报告,再度提到了与关税相关的一项重要数据。AMZ123获悉,当地时间6月10日,美国财政部发布的报告显示,美国联邦政府在5月支付了219.7亿美元(约合人民币1484.58亿元)的关税退款,高于其同期征收的219.3亿美元关税收入,当月关税净收入为-4200万美元。
运价暴涨!马士基客户抢运潮涌现
马士基客户抢运潮涌现:除非下半年出现灾难性崩盘,否则业绩下调可能性极低受运价大幅上涨、燃油附加费即将生效以及新一轮关税预期等因素影响,全球货主正在加快出货节奏,集装箱运输市场提前进入旺季。分析人士认为,上半年强劲的市场表现已显著改善马士基全年业绩前景,市场预期正从此前的“下调指引”转向“上调预期”。不过,霍尔木兹海峡局势、全球经济走势以及未来运力过剩风险,仍将影响航运市场后续发展。短短几周时间里,市场对马士基2026年业绩的预期发生了明显变化。
《消费电子行业趋势报告》PDF下载
消费电子行业流量稳定增长,近6个月流量同比增长+5%。地区上日韩/北美/欧洲增长较高,从国家来看,日本、韩国、荷兰、加拿大、意大利以及拉美的巴西,可重点关注。
《美客多趋势报告-阿根廷站》PDF下载
在当今的消费环境中,每一次购物都成为消费者身份的体现,反映出消费者的兴趣、欲望和价值观。这些选择受到时代和文化的影响,不仅展现了消费者的偏好,也塑造了消费者与市场的关系。
《东南亚零食电商行业市场洞察》PDF下载
随着全球经济的不断发展和消费市场的日益多元化,零食行业在全球范围内展现出强劲的增长势头。而在东南亚市场,这一趋势尤为显著。
《TikTok Shop 2024-2025东南亚宠物类目报告》PDF下载
泰国站宠物品类细分市场主要为猫粮狗粮、猫砂狗砂、小动物产品等成交GMV合计占整体TOP1 0金额的88%,尤其是猫粮和狗粮单品类的GMV占比接近7成。
《2025中国社交媒体全球化发展报告》PDF下载
全球目前已有52.4 亿个活跃社交媒体用户身份*。全球社交媒体整体渗透率和活跃度持续提升,截至2025年初,全球社交媒体渗透率达63.9%且每月使用社交媒体的互联网用户比例已达94.2%:过去12个月内,全球社交媒体用户增长了4.1%,新增用户约2060万。
《2026东南亚电商运营地图白皮书》PDF下载
字节跳动旗下社交电商平台,主打“短视频+直播”种草转化闭环,东南亚增长最快的电商平台。覆盖印尼、越南、马来西亚、泰国、菲律宾、新加坡六国,年轻用户基数大、粘性高。入驻门槛低,支持0元试运营,提供跨境物流与回款保障,适合快消、时尚、美妆类卖家, 内容变现能力突出。
《美客多趋势报告-哥伦比亚站》PDF下载
通过美客多,各种行业相互链接,塑造着哥伦比亚零售行业的发展脉搏。从时尚和科技到汽车配件和家居用品,美客多让消费者与人们的生活联系得更加紧密
《TikTok Shop 欧美玩具品类行业报告》PDF下载
分析TikTok Shop美国市场、英国市场、西班牙 市场、墨西哥市场等主流市场点短视频及直播电商数据,选取 TikTok与玩具爱好品类相关的内容进行分析报告。
AMZ123会员
「AMZ123会员」为出海者推出的一站式私享服务
跨境数据中心
聚合海量跨境数据,输出跨境研究智慧。
亚马逊全球开店
亚马逊全球开店官方公众号,致力于为中国跨境卖家提供最新,最全亚马逊全球开店资讯,运营干货分享及开店支持。
北美电商资讯
AMZ123旗下北美跨境电商新闻栏目,专注北美跨境电商热点资讯,为广大卖家提供北美跨境电商最新动态、最热新闻。
AMZ123卖家导航
这个人很懒,还没有自我介绍
亿邦动力网
消除一切电商知识鸿沟,每日发布独家重磅新闻。
AMZ123选品观察员
选品推荐及选品技巧分享。
亚马逊公告
AMZ123旗下亚马逊公告发布平台,实时更新亚马逊最新公告,致力打造最及时和有态度的亚马逊公告栏目!
咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部