我們會發現很多網站都具備了內容推薦的功能,不僅是像B2C電子商務類的卓越的圖書推薦,也包括興趣類網站像豆瓣的豆瓣猜等。 這類功能無疑在幫助用戶發現需求,促進商品購買和服務應用方面起到了顯著性的效果。 那麼這類的推薦是怎麼得到的呢? 其實跟網站數據分析不無相關,我們可以來簡單看一下它的原理和實現。
關聯推薦在營銷上被分為兩類:
向上營銷(Up Marketing) :根據既有客戶過去的消費喜好,提供更高價值或者其他用以加強其原有功能或者用途的產品或服務。
交叉營銷(Cross Marketing) :從客戶的購買行為中發現客戶的多種需求,向其推銷相關的產品或服務。
向上營銷是基於同類產品線的升級或優化產品的推薦,而交叉營銷是基於相似但不同類的產品的推薦。 舉個簡單的例子,可以看一下蘋果的產品線:
當你購買一個ipod nano3的時候,向你推薦升級產品nano4、nano5或者功能類似的itouch就叫做“向上營銷”;而推薦Iphone、Mac或ipad的時候就是“交叉營銷”了。
而關聯推薦在實現方式上也可以分為兩種: 以產品分析為基礎的關聯推薦和以用戶分析為基礎的關聯推薦。 產品分析的關聯推薦指的是通過分析產品的特徵發現它們之間的共同點,比如《Web Analytics》和《Web Analytics 2.0》的作者都是Avinash Kaushik,而且書名都包含Web Analytics,都是網站分析類的書籍,同時也可能是同一個出版社……那麼基於產品的關聯就可以向購買了《Web Analytics》的用戶推薦《Web Analytics 2.0》。 而基於用戶分析的推薦是通過分析用戶的歷史行為數據,可能會發現購買了《Web Analytics》的很多用戶也買了《The Elements of User Experience》這本書,那麼就可以基於這個發現進行推薦,這種方法就是數據挖掘中的關聯規則( Association Rules)挖掘,其中最經典的案例就是沃爾瑪的啤酒和尿布的故事。
目前很多的關聯推薦還是基於產品層面的,因為實現上更為簡單(對於網站而言,產品數據明顯少於用戶行為數據,而且可能相差好幾個數量級,所以分析工作就會輕很多),基於產品的推薦更多地以上面所述的兩種營銷手段來實現,更偏向於傳統的“推式”營銷(個人對這種營銷方式比較沒有好感,尤其“捆綁銷售”之類)。
基於用戶行為分析的關聯推薦
所以個人更偏向於基於用戶分析的實現方式,這樣更有利於發現用戶的潛在需求,幫助用戶更好的選擇它們需要的產品,並由用戶決定是否購買,也就是所謂的“拉式”營銷。 通過向用戶推薦產品或服務,激髮用戶的潛在需求,促使用戶消費,更加符合“以用戶為中心”的理念。 所以下面主要簡單描述下以用戶行為分析為基礎的關聯推薦,無論你是電子商務網站或是其他任何類型的網站,其實都可以實現這個功能,只要你具備以下前提:
- 能夠有效地識別網站用戶;
- 保留了用戶的歷史行為數據(點擊流數據(clickstream)或運營數據(outcomes));
- 當然還需要一個不錯的網站數據分析師。
這里以電子商務網站為例來說明一下關聯規則的具體實現。 目前大部分電子商務網站都提供用戶註冊的功能,而購物的用戶一般都是基於登錄的條件下完成的,所以這里為用戶識別提供了最為有效的標示符——用戶ID(關於用戶識別的方法,請參考這篇文章—— 網站用戶的識別 );同時網站會把所有用戶的購物數據儲存在自己的運營數據庫裡面,這個為用戶行為分析提供了數據基礎——用戶歷史購物數據。 所以滿足了上述的前兩個條件,我們就可以著手進行分析了。
關聯規則的實現原理是從所有的用戶購物數據中(如果數據量過大,可以選取一定的時間區間,如一年、一個季度等), 尋找當用戶購買了A商品的基礎上,又購買了B商品的人數所佔的比例,當這個比例達到了預設的一個目標水平的時候,我們就認 為這兩個商品是存在一定關聯的 ,所以當用戶購買了A商品但還未購買B商品時,我們就可以向該類用戶推薦B商品。 如下圖:
從上圖可以看到其中牽涉3個集合:所有購買過商品的用戶全集U、購買了A商品的用戶集合A以及在購買了A商品之後又購買了B商品的用戶集合G。 基於這3個集合可以計算關聯規則挖掘中的2個關鍵指標—— 支持度( Support)和置信度( Confidence) :
支持度=購買了A和B商品(集合G)的人數/所有購買過商品(集合U)的人數
置信度=購買了A和B商品(集合G)的人數/購買了A商品(集合A)的人數
得到這兩個指標之後,需要為這兩個指標設立一個最低門檻,即最小支持度和最小置信度 。 因為在用戶的購買行為中,購買A商品的用戶可能不僅購買B商品,還購買了C、D、E……等一系列商品,所以我們需要分別算出所有這些組合的支持度和置信度,只有滿足比如支持度>0.2,置信度>0.6的這些商品組合才可以認為是有關聯的,值得推薦的。
當然,如果你的網站不是電子商務網站,你同樣可以用用戶瀏覽網站的點擊流數據實現關聯推薦的功能。 同樣是基於用戶歷史行為,比如瀏覽了A頁面的用戶也瀏覽的B頁面、觀看了A視頻的用戶也觀看了B視頻、下載了A文件的用戶也下載了B文件……
數據挖掘中的關聯規則挖掘一般採用基於頻繁集的Apriori算法,是一個較為簡單有效的算法,這裡就不具體介紹了,有興趣的朋友可以去查下資料。
在進行關聯規則分析時需要注意的一些問題
- 注意關聯推薦的適用範圍和前提條件,並不是每一類網站都適合或需要進行關聯推薦的;
- 最小支持度和最小執行度的設立需要根據網站運營的特徵設定,不宜偏高或偏低,建議基於實驗或實踐的基礎上不斷優化,尋找一個最佳的權衡點。
- 需要特別注意的是,在關聯規則中A商品與B商品有關聯,並不意味著B商品與A商品的關聯也成立,因為兩者的置信度算法是不同的,關聯方向不可逆。
- 關聯規則分析在算法上其實並不難,但是要將其在網站上真正實現好,在滿足上面3個前提的基礎上還需要持續地優化算法,而更主要的是需要網站各部門的協作實現。
所以,基於用戶行為分析的關聯推薦完全從用戶的角度進行分析,比單純地比較產品間的關聯更為深入和有效,更加符合用戶的行為習慣,有利於發現用戶的潛在需求,不妨嘗試一下。
»本文采用BY-NC-SA協議,轉載請註明來源: 網站數據分析 » 《向上營銷、交叉營銷與關聯推薦》
相關文章:










其實硬性地劃分“從產品出發”和“從用戶出發”的意義不大,本質上都是在分析產品之間的相關性(或者相似性),只是對這種相關性的定義各有側重。 這兩種策略應該可以統一起來。 另外,關聯規則中的提升度也是值得考慮的指標之一。
@ 皮皮米菲兔 :也不是要硬性地劃分“從產品出發”和“從用戶出發”,只是想表達如果能更多地從用戶的角度去了解用戶的行為和習慣,那麼就能更好的滿足用戶的需求。
提升度確實也是一個很好地衡量指標。
原來博主是zju校友學長啊,仰慕仰慕~~~
這裡是否有一個筆誤“購買所有商品(集合U)的人數”,應該是所有購買過商品的用戶數?
@ Franc :嗯,這個表述確實有問題,我改下,多謝提醒!
請問你的製圖工具是什麼? ? ? 人物都有?
@ 愛貝芙 :這個圖是我自己PS的,技術不好,見笑了
從博主的博客中學到了很多東西,一直潛水。 昨天決定從第一篇開始仔細閱讀學習,看到了這篇才知道原來博主也是zju畢業的,於是我決定要留下腳印,來表達我這個ZJUer對學長的仰慕~~
@ leona :呵呵,很高興在這裡都能遇到許多校友。
蘋果這種端到端的成功案例難以再現吶。 。 。 。 。