今日頭條開始逐步引入個性化推薦的策略。
他們所采用的,是協(xié)同過濾(Collaborative Filtering)** + 基于內(nèi)容推薦,直到今天依然構(gòu)成今日頭條推薦算法的基礎(chǔ)。
關(guān)于協(xié)同過濾,參考 IBM developerWorks 中文社區(qū)的專業(yè)解釋,“協(xié)同過濾一般是在海量的用戶中發(fā)掘出一小部分和你品位比較類似的,在協(xié)同過濾中,這些用戶成為鄰居,然后根據(jù)他們喜歡的其他東西組織成一個排序的目錄作為推薦給你。”
楊震原在 MindStore 分享,“(協(xié)同過濾)是一個很好的方法,直到今天我們還一直使用。但缺點也很明顯,對于沒有行為(記錄)的文章,沒辦法推薦,所以沒辦法用于文章的冷啟動。所以我們引入了基于內(nèi)容推薦的策略。比如計算文章的分類、文章的關(guān)鍵詞,然后根據(jù)用戶對文章的閱讀、瀏覽等信息,細化用戶的個人資料!@樣子,如果文章是和科技相關(guān)的,而用戶的個人資料也顯示科技相關(guān),那么就算匹配。”
除此之外,今日頭條還通過用戶對內(nèi)容的“正負反饋”來判斷內(nèi)容匹配是否精準。
正反饋,包括用戶點擊了、看了很長時間、分享了、收藏了、評論了,都是正反饋。負反饋反而是比較難獲取的,現(xiàn)在今日頭條在內(nèi)容上設(shè)置了一個小叉,點擊之后,會咨詢用戶不感興趣的理由,這種做法則會獲取比較強的負反饋。但是通過這種方式收集到的數(shù)據(jù)還不多。
通過楊震原的解釋,我們基本知道了今日頭條推薦算法的原理:通過算法,一邊提取內(nèi)容的特征,一邊提取用戶興趣的特征,然后讓內(nèi)容與用戶的興趣匹配。
除了對文本進行分析外,今日頭條如何對用戶進行分析呢?
楊震原說,“新用戶能夠得到的信息(歷史行為)非常有限。我們盡量通過一下其它途徑想辦法獲取信息,比如說,如果通過微博登錄,那么就可以拿到很多信息,解決冷啟動的難題。再比如,手機機型、手機在什么城市等信息,基本也可以知道。當(dāng)用戶積累了一定的行為數(shù)據(jù)之后,就可以算出他們的興趣特征。總之,盡量通過有限的信息,來猜測用戶的興趣!
今日頭條通過機器匹配用戶閱讀興趣,與內(nèi)容本身的特征之后,這對他們的商業(yè)有怎樣的影響?
廣告界有一句名言,“企業(yè)所投放的廣告費總有一半是浪費掉的,但是卻沒有辦法知道被浪費掉的是哪一部分!苯袢疹^條目前的商業(yè)模式也是以廣告為主,因此在產(chǎn)品上所產(chǎn)生的巨大流量,可否與廣告內(nèi)容精確匹配,進而進行更加精準的轉(zhuǎn)化。
根據(jù)今日頭條所提供的案例,此前海爾旗下卡薩帝選擇在今日頭條動態(tài)開屏廣告和信息流廣告,最后開屏廣告的轉(zhuǎn)化率達 11.93%。
上篇:
下篇: