競價廣告扣費機制的博弈論原理

6 評論 14811 瀏覽 88 收藏 13 分鐘

這段時間在看張維迎的《博弈論與社會》——一本博弈論的科普書,一邊在介紹博弈論原理,一邊借助博弈論來解釋政治、經濟和生活中的現象。在現在常見的競價廣告系統中,博弈論同樣應用廣泛。

在討論之前,我們有2個前提:

  1. 媒體追求利益最大化:這很容易理解,因為媒體想要充分利用自己的流量,讓每次廣告曝光的收益都最大化,不浪費每一個掙錢的機會。
  2. 廣告主追求利益最大化:廣告主也是理性的,它需要從廣告中獲得收益,廣告主的收益=廣告引流產生的價值-廣告成本。

第1個問題:為什么不按照固定的價格扣費?比如每一次點擊按照¥10收費?

這需要媒體需要知道全量且真實的廣告主的出價、成本信息,但這在現實中幾乎不可能。

第2個問題:如果從媒體收益最大化的前提出發,為什么不按出價高者勝出,并且按照最高出價扣費?

我們設想這么一種場景。在搜索引擎廣告場景下,如果廣告主A對“SUV”這個關鍵詞愿意出價¥10,廣告主B愿意對“SUV”關鍵詞出價¥8??紤]到A、B兩個廣告主都是理性人,且贏得廣告曝光的成本是已知的情況下(因為按出價競爭,且扣費按照廣告主的真實出價),都要盡可能地節約廣告成本。

那么A和B都會盡可能地從較低的出價先試探(而不是根據廣告帶來的收益真實地出價),比如B出¥1,A為了贏得競價會出¥1.1,那么B為了贏得出價就會出¥1.2,循環往復,A和B為了贏得廣告競價會先經歷一個價格逐漸攀升的過程,到A出¥8.1的時候,B發現不能再PK了否則要賠本了,就會停止競價,A到這個階段則會逐步試探把出價往下壓,到了¥8這個節點又會出現A、B兩家相互試探的過程,這會造成廣告系統極大的開銷與震蕩。

還要考慮到每個行業愿意忍受的成本不一樣。有些暴利行業愿意出更高的價格去贏得廣告曝光,即使后續轉化低也不要緊,只要贏得一單就賺錢。出價高者贏得廣告,會導致某個行業霸占廣告資源位。

結論是,按照出價高者贏且按最高價扣費的劣勢是:

  1. 暴利行業壟斷廣告資源,忽略消費者體驗;
  2. 廣告主已知交易成本,會造成系統高度震蕩,且廣告主會追求不斷降低報價,對媒體收益造成損失。

我們在電視劇中常見的古董拍賣通常形式是:所有買方在同一個交易場中出價、價高者贏,甲的出價乙能知道,乙能根據自己對古董的報價、甲的報價決定自己的策略。

從博弈論的角度看,這個時候真實出價并不是一個最優策略。假設甲對古董的真實價值為V,如果他最終出價為P,那么他的收益為B=V-P。如果P小于最終拍賣最高價,那么不會贏得拍賣則收益為0;如果P大于V,那么B小于0,同樣不是最優解。

最優出價應該是略微其他人的出價但小于真實價值,即使B最大,同時還得保證能贏。類似的,這種機制下廣告主的真實出價不是最佳策略。

第3個問題:如何鼓勵廣告主真實報價?

VCG被認為是一個很好的鼓勵真實出價的機制。

簡單來說,VCG認為每個廣告主應該支付的廣告費用,等于它自己給其他所有廣告主造成的損失。

按照社會效用最大看,最優策略是甲乙丙3個廣告主分別得到A1、A2、A3廣告位,因為3個廣告主產生的收益是最大的。

VCG機制如下:

  1. 甲、乙、丙3個廣告主對A1廣告位出價;
  2. 假設甲不出現,那么乙得到A1,丙得到A2,那么相對于甲參與競價的情況,乙的收益增加了2*10-2*5=10,丙的收益增加了5*1-2*1=3,整體收益為13,這也是甲的出現導致的乙和丙損失,那么甲應該為A1支付13。

同理,假如甲和丙參與競拍,乙不參與競拍,對于甲無所謂依然拿到A1廣告位,但是對于丙來說,收益提高了5*1-1*2,=3,那么乙應該為A2支付3。

VCG是整個社會效用最大化的機制。網上有很多材料能夠證明最佳出價策略是真實出價,這里證明起來有點煩(我功力不夠,還沒能簡化證明)。

但是看起來美好,工程實現上非常困難,因為一個廣告點擊扣費,需要檢索參與此次廣告競價但是沒有贏得廣告曝光的所有廣告主損失。現在Facebook雖然采用了VCG機制,但是只計算廣告排名之后2名的損失來得到第1名應該支付的錢。

第4個問題:Google采用的GSP機制又是啥?

GSP全稱Generalized Second Price,廣義次高價機制,第1名的實際點擊扣費按照第2名的出價來。首先第1個廣告位給出價最高的廣告主,第2個廣告主贏得第2個廣告位,但是需要支付的點擊價格分別是第2名和第3名的出價。GSP機制是VCG機制在只有1個廣告位的情況的特殊形式。

GSP機制下,廣告主按照真實價值出價不一定是最優策略。

考慮這樣一種情形:

甲如果出3,那么贏得A1廣告位,那么收入是3*10=30,支付的費用為10*2=20,回報是30-20=10;如果出2,贏得A2廣告位,收入是3*6=18,支付的費用是6*1=6,回報是18-6=12,那么顯然第二種出價對于甲而言才是最優策略。也就是說,第一種出價策略并不是納什均衡,可以預見的是甲肯定不會按照第一種策略執行。

第5個問題:對于媒體來說,VCG和GSP機制哪種最賺錢?

考慮有A1、A2兩個廣告位的情況,但是有3個廣告主PK,第一組按照真實價值(3,2,1)出價,第二組按照(2,1,0.5)出價,要注意的是,這兩組出價都能達到均衡,那么按照GSP機制,媒體分別的收益為:

  1. 10*2+5*2=30;
  2. 10*1+5*0.5=12.5;

按照VCG機制,則甲要為A1支付費用10+3=13,乙要為A2支付3,媒體整體收入為16。

GSP機制下媒體收益可能高于VCG,也可能低于VCG,看出價達到什么均衡。

第6個問題:加入廣告質量的因素,會有啥不一樣?

以上的分析,都是基于廣告位置決定點擊率的假設的,也就是說點擊率只跟廣告位置有關。但是真實的廣告并非如此。如果只考慮出價高者贏得曝光,不考慮點擊率,導致的結果是不相關的廣告填充了廣告位,但是卻并不產生任何價值,對于媒體而言是流量的極大浪費,也會造成用戶體驗差,因為信息與自己不相關。

長久來看,廣告主A和B發現導流過來的人群質量比較差、后續留存、轉化都不高,那么也會影響A和B對于媒體的估價,可能A只愿意出¥8,B只愿意出¥4了,勢必會影響媒體的長久收入。

最早Yahoo就因為采用僅基于出價的GSP機制而損失了很多錢。Google最早發展了廣告質量的概念。

我們籠統地把預估點擊率、廣告與落地頁的相關性、落地頁的體驗(如加載速度)稱為廣告質量度Q,廣告主出價為P,那么贏得廣告曝光的排序依據為P*Q,得分高者贏得廣告曝光。

那么這個時候廣告主的花費呢?實際上,我們都知道這個時候的花費=(P2*Q2)/Q1,即第二名的P*Q值除以第一名的廣告質量度。

為什么不直接按Q2來計算第一名的廣告消耗?我們先假設這么一種場景:直接按照次高價扣費,那么這個時候廣告主的最優策略是無限提高廣告出價,這樣能強制性地把P*Q值拉到最大,但是由于采用次高價扣費,因此并不用擔心會提升廣告成本。換句話說,只要廣告主愿意出高價,不管廣告質量怎么樣,都能展現在消費者面前;但是同樣的,由于忽視了廣告質量,不一定會有多少點擊,對于媒體而言也是得不償失。

所以我把 P2*Q2/Q1稱為懲罰定價。該公式可以寫成P2*(Q2/Q1),如果Q2>Q1,也就是第二名的廣告質量好于第一名,那么P2*(Q2/Q1)>P2,換句話說,如果第一名的廣告質量比較差,那么它要付出比第二名出價更多的成本才能維持住現有的位置;同理,如果第一名的質量度高于第二名,那么只需花費比第二名更少的成本就可以維持現有的位置。

以上是競價背后的一些機制,轉化成廣告競價系統的術語,背后原理有兩層:

  1. 某次廣告曝光主要是比較eCPM(expected CPM),eCPM高者贏得展示廣告的機會,eCPM=pCTR(predict CTR)*CPC(廣告主的出價)。
  2. pCTR代表預估的CTR,即通過算法對于該用戶在該廣告位點擊某個廣告的概率進行預估,然后乘上廣告主的出價(廣告創建時就已經確定,是已知的變量)即可得到eCPM。因此,僅僅提高出價是沒有用的,廣告主還必須優化pCTR。pCTR的預估機制,對于廣告主是一個黑箱,只知道跟廣告與用戶之間的匹配度(定向)、素材質量、落地頁質量等有關。

百度云與阿里云都提供pCTR訓練/預測的API。據稱百度使用了一億多個特征訓練pCTR;阿里云官網上列舉了pCTR訓練所需要使用的特征。

但是真實的特征與模型參數必須是黑箱,否則廣告主知道了特征與參數之后,就可以針對性地調整,使pCTR最大,在保證eCPM足夠高贏得廣告的前提下,就可以降低出價,最終導致的結果是降低整體廣告主的出價,使媒體收入變少。

總結來看,一個賣方(媒體)、買方(廣告主)信息越是透明,媒體越是難以獲得收益最大化,且會早成高度的系統震蕩。

 

本文由 @余子申 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自 Pixabay,基于 CC0 協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 我不理解
    【那么A和B都會盡可能地從較低的出價先試探(而不是根據廣告帶來的收益真實地出價),比如B出¥1,A為了贏得競價會出¥1.1,那么B為了贏得出價就會出¥1.2,循環往復,A和B為了贏得廣告競價會先經歷一個價格逐漸攀升的過程,到A出¥8.1的時候,B發現不能再PK了否則要賠本了,就會停止競價,A到這個階段則會逐步試探把出價往下壓,到了¥8這個節點又會出現A、B兩家相互試探的過程,這會造成廣告系統極大的開銷與震蕩。】
    平臺完全可以設計成A出到8.1的時候自然勝出了,不讓A往下調整價格就行了啊。

    來自河南 回復
  2. 你好 想咨詢下 淘寶app那樣的廣告機制是什么樣的?

    回復
  3. 內容質量超好,顯然是行業內的人士

    來自上海 回復
    1. 感謝感謝!

      回復
  4. ecpm(媒體千次展示收益)=廣告主出價*pcvr*pctr*1000。把作者的文章讀完,內容還是很干的,關于第二高階出價原理,對廣告主而言,比較友好

    來自四川 回復
    1. 是否需要乘上pcvr要看媒體的扣費機制,如果是按照轉化結算就需要加上去,如果只是按點擊結算就不需要乘上pcvr

      回復