互聯(lián)網(wǎng)搜索廣告技能升級(jí)版,趕緊get起來(lái)
來(lái)源(廣告買(mǎi)賣(mài)網(wǎng)) 作者() 閱讀() 時(shí)間(2015/7/24 10:03:55)
正排數(shù)據(jù)存儲(chǔ)的是推廣組(ad-group)、推廣計(jì)劃(campaign)和客戶(hù)(cust)的相關(guān)信息,如寶貝狀態(tài),銷(xiāo)量,屬性,類(lèi)目,地域,以及推廣計(jì)劃的id,客戶(hù)的id等。對(duì)候選集合的過(guò)濾就是根據(jù)正排數(shù)據(jù)來(lái)進(jìn)行的。檢索過(guò)程只負(fù)責(zé)檢索出購(gòu)買(mǎi)了這些競(jìng)價(jià)詞的廣告。根據(jù)正排數(shù)據(jù)來(lái)進(jìn)行過(guò)濾的過(guò)程是由單獨(dú)的一個(gè)階段來(lái)完成的。
可以看到在搜索廣告中檢索過(guò)程是十分簡(jiǎn)單的,其實(shí)是一個(gè)精確匹配的結(jié)果,不像網(wǎng)頁(yè)搜索引擎,需要支持多種語(yǔ)義
二、廣告排序(Ranking)
檢索完成后,就需要確定廣告的輸出順序,需要兼顧用戶(hù)體驗(yàn)和搜索平臺(tái)的收益。這個(gè)階段必須綜合考慮競(jìng)價(jià)和相關(guān)性分?jǐn)?shù)(例如ecpm)。目前有兩種主流的方法,以賽馬為例:
反應(yīng)式(Reactive):選定一匹馬,根據(jù)它的歷史成績(jī)來(lái)預(yù)測(cè)未來(lái)的表現(xiàn)
預(yù)估式(Predictive):根據(jù)體重,腿長(zhǎng)等特征為賽馬建模,找到這些特征在預(yù)測(cè)比賽名次終的重要程度,然后基于這些特征來(lái)給見(jiàn)過(guò)、未見(jiàn)過(guò)的賽馬預(yù)測(cè)成績(jī)。
當(dāng)我們擁有對(duì)某賽馬的足夠信息的時(shí)候,就使用這些信息(反應(yīng)性),否則使用模型(預(yù)測(cè)性)。
。ㄒ唬┓謱优判
記得計(jì)算機(jī)界某大牛曾經(jīng)說(shuō)過(guò),任何問(wèn)題都可以通過(guò)增加一層來(lái)解決,在廣告搜索引擎中也是通過(guò)分層的形式解決復(fù)雜問(wèn)題的,大到匹配(Matching)和排序(Ranking),小到廣告集合的處理,無(wú)處不在分層的思想。
在廣告搜索引擎中,由海選、初選和精選三個(gè)階段來(lái)配合完成廣告的排序工作,其中海選和初選都是在做剪枝操作,盡量縮小問(wèn)題的規(guī)模。廣告和自然搜索的差異之一,就在于廣告位相對(duì)自然搜索的位置,是相當(dāng)少的。所以決定了在競(jìng)爭(zhēng)激烈的情況下,排在后面的廣告是沒(méi)有機(jī)會(huì)展現(xiàn)的。因此可以考慮在早期過(guò)程就發(fā)現(xiàn)這些寶貝,然后干掉這些寶貝,此時(shí)每個(gè)寶貝的排序分?jǐn)?shù)不需要非常精確,能達(dá)到一定的篩選效果就可以,這就是全量索引截?cái)、海選和初選的思想。而最精確的打分,是發(fā)生在精選階段的。一般都會(huì)采用單獨(dú)的線(xiàn)上打分服務(wù)來(lái)完成的。
(二)全量索引截?cái)?
全量建索引的時(shí)候,會(huì)對(duì)倒排鏈超過(guò)一定數(shù)量的熱詞進(jìn)行截?cái),根?jù)排序分?jǐn)?shù)來(lái)取這個(gè)倒排鏈下的top N個(gè)寶貝。
海選
廣告搜索是輕檢索,重過(guò)濾的。當(dāng)檢索階段拿到的廣告候選集合后,會(huì)進(jìn)行海選。海選這個(gè)名稱(chēng)非常形象,這不就是歌手大賽的海選階段嗎?只有實(shí)力唱將才能脫穎而出。
初選
為了減少對(duì)線(xiàn)上打分服務(wù)的壓力,海選階段完成后,還需要經(jīng)歷初選階段。