从CCTV到Google：聊一聊竞价广告的机制设计

关于竞价广告，很多人有两个极端的看法：

第一观点会认为竞价广告非常简单，不就是央视每年黄金广告位招标么，谁出价高广告位给谁；

第二个极端会认为竞价广告过于复杂，涉及到到博弈论、机制设计、拍卖理论、CTR预估等普通人根本弄不明白高深理论，因此很多人对此望而却步………

告诉你，真相就像《小马过河》的结局一样：河水既不像黄牛说的那么浅，也不像松鼠说的那么深——竞价广告的基本逻辑当然会涉及到很多复杂理论，但看完这篇文章大部分人可以轻松理解其核心原理的来龙去脉。

一、从央视标王到Google的竞价广告系统

关于竞价广告，很多人认为百度是国内推出第一个竞价广告的公司；事实上，从更广泛的意义上，央视的黄金广告竞标更早地向大家普及了“竞价广告”这个概念。

早在1994年，央视就开始了以竞价的方式拍卖广告位，诞生了秦池、爱多VCD等知名标王。

一个典型的拍卖场景是这样的——拍卖师先标明广告位，同时表明底价，然后开始等待竞价者向上竞价，“100万！”、“120万！”、“200万！”，“200万一次，200万两次，成交！”

这样的场景我们在众多影视作品中再熟悉不过。

然而，并非所有的拍卖都是以这种方式进行，这仅仅是众多拍卖机制中的一种，这种不断提升价格的拍卖方式被称之为“英国式拍卖”。

和英国式拍卖类似，还有荷兰式拍卖。

荷兰式拍卖的形式正好相反，拍卖师先出一个非常高的价格，然后不断往下试探，直到有竞拍者愿意接受这个成交价格。

那么问题来了——传统的广告可以通过这种方式竞价，那么在线的广告是不是也可以用同样的方法进行竞价呢？

答案是否定的。

原因在于：在线广告的拍卖与传统广告拍卖有几点重要的区别，而这些区别会对竞价机制的设计产生重要影响——

第一，不管是英国式拍卖还是荷兰式拍卖，每个人的出价都是公开的，而在线广告主可能很多并不愿意公开自己的出价，因此公开竞价就变得不适合。

第二，央视的拍卖是单次行为，而在线广告是多次重复博弈，即这个广告位被抢了，广告主还可以抢下个广告位，广告主可以不断调整自己的出价。

第三，在线广告存在多个标的物（每一次广告请求可能都是多个竞价标的物）、海量实时计算的特征。

那么，在线广告应该采取什么样的竞价机制呢？

其实有很多选择，我们一个个来看：

第一个可能的选项是“密封第一价格”竞价。
这其实也是我们熟悉的一种竞价方式，很多工程招标都采取这种方式。

它的机制是：每个竞价者不公布自己的出价，把它密封在信封里交给卖主，拍卖主让最高出价者赢得竞拍，并且支付最高出价者的出价。

有人说，这种方式看起来很完美啊，符合广告主不公开报价的需求，而且也被很多实践证明过。

然而这种竞价方式广告主的出价策略取决于别人怎么出，反而和自己的真实估值关系不大，而这应用到在线广告拍卖就会存在问题。

在线广告一个特征就是重复博弈，神马意思呢？比如线下的工程招标是一次性的，竞拍者会更加倾向于谨慎对待自己的出价——因为他只有一次机会，然而在线广告是多次的，即广告主有多次机会不断试探别人的出价，从而实现自己的最优策略。

我举一个例子——谷歌的关键词“跑步”下面的广告位，耐克认为一次点击值10块钱，阿迪认为值6块钱，这时候如果他们采取“密封第一价格”拍卖，而谷歌广告系统给出的底价是2块，那么阿迪和耐克都会试探着出价。

阿迪从2块开始出，耐克出2.1，阿迪出2.2，耐克出2.3，双方有一个不断加价的过程，一直加到6块的时候，阿迪停止出价了，因为它认为这个广告为最多值6块，阿迪退出了。

这时候只剩耐克了，耐克也不傻，既然没人和我竞争，那么我为啥要出6块呢，于是赶紧调到2块；这时候阿迪又会进场，周而复始的循环开始了。

细心的你会看到：这种方式有一个明显的缺陷——不稳定，背后的根源在于这种拍卖方式从博弈论的角度不存在纳什均衡（这一点已被经济学家从数学的角度证明），即它永远存在一个你追我赶的状态，原因是这种拍卖方式出价取决于对手的出价。

同时从更深层次上，这种机制在重复博弈的机制下至少有两个缺陷：

第一，不符合帕累托最优，即一个好的拍卖机制应该是把标的物卖给对它估值最高的竞价者，在这个案例中，评价最高的是耐克，然而有一半的几率被阿迪所抢走了。

第二，它也不符合卖方利益的最大化，耐克阿迪评价都远超2块，但出价却从2块开始出。

由此可以看出：这种竞价方式用在在线广告拍卖上不合理，那么有木有一种更好的竞价方式呢。

答案是有！

接下我们就一起来看一看：

二、获得诺贝尔奖的一次改动

经济学家威廉·维克里试图解决这个问题，他在1961年发表的《反投机、拍卖与竞争性密封投标》，这篇经典论文中系统性地论述了“第二密封价格”的拍卖方式。

它对“第一密封价格”做了一个小的改动，具体为——竞价者依然密封出价，依然是出价最高者赢得拍卖，但是胜出者只需要支付第二名出价的钱，即如果耐克出价10块，阿迪出价6块，依然是耐克胜出，但耐克只需要支付第二名阿迪的出价——6块。

这是一个违反直觉的小小改动——第一名居然只需要支付第二名的出价，然而不要小看这个小小的改动，正是因为系统地论述了这个改动，让威廉·维克里获得了1996年的诺贝尔经济学奖，“密封第二价格”拍卖在经济学里也因此被称之为“维克里拍卖”。

那么，这个神奇的小改动到底隐藏着神马秘密呢？

答案是：它正好系统地解决了“第一密封价格”存在的重大缺陷。

有人立马会问：为什么这样改一下就能克服这个缺陷呢？

简单地说，在“密封第二价格”的竞价机制中，每个人都存在一个固定的最优策略——出价等于自己的估值，还是以上的价格策略，耐克估值为10块，阿迪的出价多少不知道，这时候耐克的最优策略是神马？

答案是10块。

为什么？

我们考虑两个种情况：

第一，阿迪出价如果超过10块，那么耐克无论如何也赢不了，因为耐克不可能出价高于自己的估值，高过自己就亏了。

第二，阿迪低于10块，那么耐克应该出到自己能出到的最大价格以增加自己的获胜概率，而这个最大价值就是10块，即耐克没有下调出价的动力，因为它没有最终支付价格的控制力。

神马意思？

假如耐克出8块，这时候如果阿迪出6块，耐克赢得竞拍而且只需要支付6块，和它出10块没有区别，但如果阿迪出9块它就会失去竞价，因此耐克没有动力把出价调到8块这种有可能导致竞价失败的出价，唯一的最优策略就是出价10块。

用博弈论的话说，“密封第二价格”存在一个唯一的纳什均衡，即每个人都出自己对于商品的真实估值是最优策略，因此该机制是一个鼓励竞拍者讲真话的机制，同时具有相当的稳定性，即广告主没有频繁调整自己出价的动力。

在这种机制下，永远是对广告位评价最高的广告主胜出，同时保证了平台的收入，没有广告主出价比自己评价更低的出价。

事实上，谷歌、百度、新浪微博等广告平台都是采取这种竞价方式。

好，有人会说，这种竞价方式就是完美的竞价方式吗？其实不一定，“密封第二竞价”机制至少存在一个缺陷，那就是它的反作弊特性不强，假如存在互相勾结的同谋，在这种竞价机制下，同谋更加容易实现。

神马意思？

依然拿耐克阿迪来打比喻：耐克的心理出价是10块，阿迪是6块，这时候他们勾结，阿迪出1块，耐克出10块，最终耐克只需要花1块钱就能买走这个广告位，受伤的是广告平台。

聪明的人立马会说——难道“第一密封价格”不会出现这种情况吗？比如耐克和阿迪商量好，耐克出1块，阿迪出0.5元，还是耐克以1块钱的价格买走这个广告位啊！

哈哈，这么说也没错，但“第一密封价格”更容易出现背叛同谋的情况：尽管商量好耐克出1块，阿迪出0.5毛，但阿迪是有动力去违反同谋的，只要阿迪出2块，它就能赢得拍卖，这时候耐克就傻眼了。

但在“第二密封价格”的情况下，耐克出10块，阿迪出1块，这个同盟的就非常有力，因为阿迪无论如何背叛，它也不可能赢得拍卖（它的出价不可能超过6块），因此它没有背叛的动力，因此同谋就更容易达成，作弊的概率就会变大。

好，既然有这个缺陷，那么现在在线广告谷歌、百度为什么还要使用它呢？

一个重要的原因是：不同于线下的单一拍卖，在线广告是大规模重复博弈，大规模意味着参与竞价的广告主数量众多，客观上增加了勾结作弊的难度，从某种意义上掩盖了这种机制的缺陷。

三、VCG，一种多广告位的拍卖机制

以上我们讨论了竞价机制的基本原理，所有的例子都是一个广告位的情况，而在现实的广告系统中，一次请求的广告为往往是多个，比如搜索引擎就有多个广告位，我们应该如何设置竞价机制呢？

谷歌、百度就把“密封第二价格”拍卖进行了一个扩展；即如果有多个广告位，第一名按第二名加一个最小竞价单位扣费（如0.01元）、第二名按第三名扣费，第三按第四名扣费，以此类推，这种竞价方式被称作为“广义第二价格拍卖”（Generalized Second Price auction），简称GSP。

这种方式最大限度地保留了“密封第二价格”的优势，即它能形成稳定的均衡。

但它也有一个缺点：它并非全体竞价者福利最大化的竞价方式。

于是，三位经济学家Vickrey、Clarke、Groves分别在三篇论文中提出了一个多物品的拍卖机制，简称“VCG拍卖”。

这种复杂的竞价机制从整个竞价者的整体利益出发，它依然是价高者得，但扣费却是计算价高者参与给其他竞拍者带来的总损失，即先算出没有价高者参与时的总福利，然后算价高者参与之后的其他人的总福利，这个福利之差就是其他参与者的损失。

简而言之：你参与竞价，你因此给其他竞价者造成了损失，你需要为这个系统的整体福利的减小而付出成本，以保证整体福利的最大化。

这个竞价方式计算起来相对复杂，我用一个简单的例子来阐述——假如现在有两个广告位，即搜索“跑步”这个关键词的第一位和第二位，第一位能带来20个点击，第二位能带来10个点击。

有三个广告主来竞价，分别是耐克每点击付6块、阿迪的4块和锐步的2块。
按照价高者得的原则，耐克赢得第一个广告位，阿迪赢得第二个广告位，锐步竞价失败。

这时候问题来了：应该扣耐克多少钱？

按照VCG竞价法则：

先算出没有耐克参与竞价时候阿迪和锐步的收益，即阿迪赢得第一个广告位，锐步赢得第二个广告位，收益为：4*20+10*2=100

然后算出有耐克参与竞价阿迪和锐步的收益，即阿迪赢得第二个广告位，锐步出局，收益为：4*10+2*0=40。

二者福利之差为：100-40=60

那么耐克应该为每个点击付的钱为：60/20=3块。

一方面是因为尽管VCG可以最大化竞价者福利，但它非常难向广告主解释，会面临极大的教育成本；

谷歌首席经济学家Hal Varian曾经就明确表示：谷歌在2002年不愿意从GSP转到VCG其中一个原因就是用户教育成本太高。

另一方面也因为从GSP直接转向VCG会面临收入下滑的风险，经济学家们已经证明VCG的收入不会比GSP高。

这篇文章主要介绍了竞价广告机制设计中的来龙去脉，事实上，竞价机制选择只是竞价广告中的一个小的方面。

什么是神经翻译？谷歌和deepl怎么选

网站优化都有哪些需要注意的细节

分部

QQ

电话（微信）

从CCTV到Google：聊一聊竞价广告的机制设计

Related Posts

什么是神经翻译？谷歌和deepl怎么选

网站优化都有哪些需要注意的细节

分部

QQ

电话（微信）