快速提高广告CTR的几个解决方案
本文目录
广告领域CTR、CVR、ROI介绍
点击率(CTR):广告吸引力的度量
CTR,全称Click-through Rate,是衡量网络广告吸引力的重要指标。它是点击广告的次数与广告展示次数之间的比率,以百分比形式展现。高CTR意味着广告能唤起观众的兴趣,提升广告效益。通过优化广告策略,我们可以提高CTR,从而提升广告系统收益,形成广告投放的良性循环。
转化率(CVR):商业价值的衡量标准
CVR,即Conversion Rate,直指广告目标达成的效率。它是指用户完成预设行为(如购买、注册)的次数与广告展示次数的比例。CVR是评估广告商业价值的关键,高CVR意味着广告更具有说服力,能有效驱动用户行为。通过监控CVR,广告主可以调整广告内容和定向策略,以提升整体投放效果和ROI。
投资回报率(ROI):投资决策的财务指南
ROI,Return on Investment的缩写,是衡量投资效益的黄金标准。它显示的是投资收益与成本之间的比率,以百分比形式呈现。对于广告投放而言,ROI帮助企业判断不同渠道和策略的收益与成本效益,以便优化投资决策,确保广告投放策略的效益最大化。
计算公式与应用
CTR=点击次数/广告展示次数
CVR=完成目标行为的次数/广告展示次数
ROI=(收益-成本)/成本× 100%
通过这些关键指标的分析,广告主能够更精确地评估广告效果,调整策略,以达到更高的广告效果和商业目标。
展现广告点击率ctr预估 冷启动怎么解决
逻辑回归可以用在CTR(Click Through Rate)预估上,即通常所说的点击率预估。点击率预估的意义在于,搜索引擎等广告平台想要赚更多的钱,就要通过某一种机制让赚钱最多的广告排在前面(或有更多的概率被展示)。
一、排序规则
为了获得更多的收益,一般搜索引擎、广告联盟的排序规则是:
其中$bidPrice$是指广告主给出的竞拍价格,$CTR$就是我们预估的该广告的点击率,总体结果越高越容易被展示。
当然,这个最终的分数计算还有其他的规则,这里只是列出具CTR预估在这里的重要作用。
二、逻辑回归
我们依然使用之前在逻辑回归中用到的$sigmoid$函数作为模型:
含义为,我们给出一个查询Q和一个广告,预测其被点击(y=1)的概率。
我们的特征数据包括:广告质量得分、广告创意得分、Query与广告的相关性、相对价格、相对成交量等等,具体这些特征的值如何获得又是另外的课题,这里暂不涉及。
有了特征数据,现在我们有一批数据如下图所示:
0 20 0.294181968932 0.508158622733 0.182334278695 0.629420618229
0 68 0.1867187241 0.606174671096 0.0748709302071 0.806387550943
0 18 0.62087371082 0.497772456954 0.0321750684638 0.629224616618
1 90 0.521405561387 0.476048142961 0.134707792901 0.400062294097
0 75 0.0126899618353 0.507688693623 0.377923880332 0.998697036848
0 8 0.308646073229 0.930652495254 0.755735916926 0.0519441699996
0 64 0.444668888126 0.768001428418 0.501163712702 0.418327345087
0 79 0.842532595853 0.817052919537 0.0709486928253 0.552712019723
1 32 0.410650495262 0.164977576847 0.491438436479 0.886456782492
其中第一列是正样本(被点击)的个数,第二列是负样本(展示但未点击个数)。
三、逻辑回归
关于逻辑回归的原理可以参考我之前的文章,我们会发现这里的数据与之前的不同,每一行不再是一个单独的记录,而是一组记录的统计,这种形式在实践中更容易计算,并且更节省存储空间。
四、R逻辑回归
我们首先把数据读取到内存中,存储于ctr_data变量中:
ctr_data= read.csv('CTR_DATA.txt',header=F,sep="")
看一下里面的数据:
> head(ctr_data)
V1 V2 V3 V4 V5 V6
1 0 20 0.29418197 0.5081586 0.18233428 0.62942062
2 0 68 0.18671872 0.6061747 0.07487093 0.80638755
3 0 18 0.62087371 0.4977725 0.03217507 0.62922462
4 1 90 0.52140556 0.4760481 0.13470779 0.40006229
5 0 75 0.01268996 0.5076887 0.37792388 0.99869704
6 0 8 0.30864607 0.9306525 0.75573592 0.05194417
把该变量添加到环境变量中,这样后面使用其中的字段就可以直接写了:
attach(ctr_data)
最重要的一步,根据数据生成逻辑回归模型:
ctr_logr= glm(cbind(V1,V2)~V3+V4+V5+V6,family=binomial(link="logit"))
其中$y$~$x{1}+x{2}$的意思是根据$x{1}$、$x{2}$来预测y出现的概率。
我们新创建一个数据集,对其出现的概率(即V1所代表的含义)进行预测:
record= data.frame(V3=0.294181968932,V4=0.508158622733,V5=0.182334278695,V6=0.629420618229)
d<- predict(ctr_logr, newdata= record, type="response")
1
0.004845833
可以清楚地看到,该特征向量(即一个广告)被点击的概率是0.00484,也就是说大约展示250次可能会被点击一次。
计算广告CTR预估系列(一)--DeepFM理论
DeepFM理论的核心要点如下:
CTR预估的挑战:
高维度和稀疏性:广告CTR预估涉及大量的类别型特征,这些特征经过onehot编码后会变得非常稀疏,增加了特征组合的复杂性。类别型和连续型数据:数据类型的多样性要求模型能够同时处理这两种类型的数据。DeepFM模型的结构:
FM组件:专注于学习低阶组合特征,通过隐向量的内积实现。虽然理论上可以捕获高阶特征,但实际应用中通常只考虑到二阶交叉特征。Deep组件:利用深度神经网络学习高阶组合特征,提高了模型的表达能力。特征共享策略:
共享feature embedding:FM和Deep组件共享输入和embedding矩阵,加速了训练过程,提高了模型的准确性。优势:
全面的特征学习:覆盖了低阶和高阶组合特征,实现了端到端的训练,避免了人工特征工程的繁琐过程。高效和准确:为广告CTR预估和推荐系统提供了更高效、准确的解决方案。相较于Wide&Deep模型的优势:DeepFM在学习低阶和高阶组合特征上具有优势,同时避免了需要专业领域知识进行特征工程的局限性。总结:DeepFM模型通过结合FM组件和Deep组件,实现了全面的特征学习,成功解决了CTR预估中的组合特征提取难题,为广告CTR预估和推荐系统提供了更高效、准确的解决方案。
广告点击率CTR修正-Wilson CTR
CTR,即点击通过率,是衡量广告推荐系统中算法好坏的重要指标,计算公式为点击数除以曝光数。
原始CTR计算方式只考虑相对值,未考虑绝对值。曝光量少时,计算出的CTR不可靠,只有样本充足,才能反映真实情况。
以三个广告为例,点击数分别为5、50、500,曝光数分别为10、100、1000,CTR都是0.5。但从实际表现和置信角度分析,C> B> A,因C的样本数更多,可信度更高。
为了衡量样本数对CTR置信区间的影响,引入“威尔逊(Wilson)区间”概念,公式为P± Z*√(P*(1-P)/ n)。其中,P是概率,即点击率或CTR;n是样本总数,即曝光数;Z是置信度下限的正态分布分数,如95%置信度下Z值为1.96。
威尔逊区间的含义是在一定置信度下,真实CTR的范围。通过威尔逊CTR修正的源码,可以更准确地估计广告的真实点击率,提高广告推荐系统的效率和精准度。











