河源28生活网   切换城市   |   您好,欢迎来到河源28生活网!
今天是:
 
职场交流
 
 
df
  2级
帖子:4
精华:0
积分:8
注册:2022-04-07

 

广告产品经理要懂的几个算法概念之点击率预估

浏览:41208 次   |   倒序看帖 楼主    1 楼

当今主流的(移动)互联网广告系统都基于机器学习技术,作为广告产品经理,如果不懂基本的算法概念,则在自己的知识体系结构中会缺了重要的一环,影响对产品的全面理解和掌握。作者试图以通俗的方式,把广告系统中几个常用的算法概念、背景和作用讲解清楚,读者不需要有编程基础,也不需要有高数和统计学基础。本文主要讲点击率预估的背景和作用,下一篇将重点介绍转化率预估。本人采用效果广告作为讨论场景(品牌广告相对简单些),下面先引入一下问题。

广告系统解决的根本问题 - 广告主与媒体的博弈问题

为了便于理解,我们先举一个例子:某英语培训机构在云音乐做广告找目标客户。这里涉及了三方:

1. 某英语培训机构 - 广告主;

2. 云音乐 - 媒体方;

3. 目标客户 - 用户方。

广告主最关注的是ROI,希望用最低的成本拿到自己的目标用户,底线是不能长期做亏本生意。媒体方希望广告有高点击率和高单价(假设按点击付费)。用户方则希望广告的内容对自己有用。其中广告主与媒体方是系统的主动方,即他们有选择对方的权利,而用户是被动方(如果有选择,估计大部分用户会选择没有广告)。

可以看出,广告主与媒体方的诉求是矛盾的,一个希望成本低,一个希望流量价值最大化。如何解决这个矛盾呢?现代广告系统的解决办法是引入经济学的拍卖机制,然后用计算机程序来实现自动竞价,把经济学和计算机科学结合起来解决这个博弈问题。

竞价机制

GFP vs GSP

大家应该在电视里面看过拍卖的场景,比如拍卖某个古董时,从低价开始喊,然后不断加价,直到没人再加为止,这时候锤子一敲就成交了,这个模式叫做英式拍卖,这种公开叫价的形式叫明拍。还有一种叫暗拍,情况类似于每个竞买人把自己的价格写好,等全部交上去后按价格的高低排序,价格最高者得。如果是第一价格模式则按第一价格支付,按第二价格模式则出价最高的人按照第二名的价格支付。

GFP(Generalized First Price)广义第一价格模式

早期的互联网产品,比如Yahoo和MSN采用的是GFP,广告主针对某个关键词出价,价高者得且按自己的出价支付。早期百度的竞价排名也是类似的规则。但这种模式最大的问题是系统收入非常不稳定,竞买人需要频繁修改出价以拿到流量或者希望以更低的价格拿到流量。

GSP(Generalized Second Price)

2002年Google在Adwords业务中采用了GSP机制,即出价最高者按照第二名的出价来支付。GSP模式由于看不到其他人的出价,可以鼓励广告主按照自己认为的真实价值来出价,鼓励“讲真话”。并且排序时还引入了质量得分,通常是pCTR(Predict Click-Through Rate),即预估的广告点击率,然后按照Price * pCTR排序,这样除了价格因素之外,还可以考虑广告对于目标用户的质量情况,鼓励质量好匹配度高的广告,惩罚差的。如果用Bid来表示出价,则排序的数值表示为:eCPM = Bid * pCTR * 1000,其中eCPM是千次曝光收入。

这样就遇到了一个新问题,因为计算eCPM需要知道Bid和pCTR,Bid是广告主的出价,但如何知道pCTR(即某个用户点击某个广告的概率)呢,并且预估点击率是将来的事情,在发生之前是没办法统计出来的。

点击率预估(经济学与机器学习结合的桥梁)

机器学习技术为CTR预估找到了一个解决方案:利用机器学习的回归技术来预测点击概率

数学里有线性回归问题,其实点击率预估的基本原理是一样的,利用已知样本数据来拟合出一个函数,然后用这个函数来计算未知的数据。不同的地方是现在的深度学习技术拟合的函数非常复杂,且是非线性函数。

但作为产品经理,可以不用了解其中实现的细节,我们只要知道算法工程师实现了一个函数,当输入用户特征、广告特征和环境特征后,可以输出该用户点击该广告的概率即可。

可用一个公式来表示:

pCTR = f(user features, context features, ad features)

特征数据越丰富、越精确,预测值就越准确。因此大数据和机器学习这两个词会经常一起出现。算法界有一些描述数据重要性的说法,比如:数据质量决定了机器学习的上限,而算法模型只是逼近这个上限。Garbage in, garbage out等,说的都是数据的重要性。

希望了解技术硬核的朋友可以参考我的文章:

广告CTR预估之逻辑回归

五分钟读懂梯度下降算法

深度学习基础之反向传播算法

计算机科学的机器学习技术结合经济学的拍卖原理,构成了现代互联网广告系统的理论基础,而点击率预估是连接两门学科的桥梁。这套体系自动化地完成了广告主、媒体方和用户之间的博弈和约束。这个公式(eCPM = Bid * pCTR)神奇地考虑了各方的诉求:

1. 出价越高曝光越多,但需要考虑广告质量以及与用户的匹配度。

2. 与用户需求的匹配度越高,则用户的点击概率越大,用户需求起到了一个约束条件。

3. 出价越高和点击率越高,并且多个广告竞争,则媒体方的收益越大。

这套设计较完美地解决了三方博弈,但还有一个重要的问题未解决,即系统没有考虑广告主的成本,出价高虽然能获得更多的曝光,但如果价格高到超出了成本,会导致广告主流失。我们下一章将会详细介绍,如何利用(深度)机器学习技术来解决广告主成本可控的问题。


蒋能学

2022年8月21日,星期天

杭州,室外39度


本文转载自:蒋能学的技术笔记 https://mp.weixin.qq.com/s/y478FVQPNr16lAEfxIjdoQ


欢迎大家关注“蒋能学的技术笔记”,一起“持续学习,天天向上”。喜欢的话,可以到文章的末尾点个赞,鼓励一下作者!
 
 
 
|< < >
 
我来回复:
 
您需要登录后才可以回帖 登录注册