現(xiàn)在企業(yè)越來越重視運用人工智能技術(shù)洞察數(shù)據(jù)價值,從中發(fā)展增值業(yè)務(wù)。傳統(tǒng)的依賴業(yè)務(wù)規(guī)則篩選目標(biāo)用戶的營銷方式,存在獲取數(shù)據(jù)周期長且營銷接觸率低的問題。本文將介紹當(dāng)下流行的相似人群擴展(Lookalike)技術(shù),能有效支撐業(yè)務(wù)方進(jìn)行精準(zhǔn)營銷。
1、Lookalike技術(shù)是什么
Lookalike技術(shù),即相似人群擴展技術(shù),是一種從小規(guī)模的目標(biāo)用戶群體中,通過算法模型找到更大規(guī)模相似用戶群體的方法。其核心思路是首先根據(jù)一小部分目標(biāo)用戶(種子用戶)的特征,比如人口統(tǒng)計學(xué)數(shù)據(jù)、網(wǎng)絡(luò)行為、消費偏好等,建立這部分目標(biāo)用戶的畫像。然后,在更大范圍的用戶總體中,找到與這些目標(biāo)用戶較為相似的用戶。這些新找到的用戶就是目標(biāo)用戶的“相似”群體。
圖1 什么是Lookalike
需要注意的是,lookalike技術(shù)并不是某一類特定的算法,而是一系列算法方法的統(tǒng)稱。這些算法綜合運用機器學(xué)習(xí)、統(tǒng)計分析、數(shù)據(jù)挖掘等多種技術(shù)手段,通過對用戶特征的評估和建模,達(dá)到從小規(guī)模目標(biāo)用戶擴展到更大相似用戶群的目的。
2、Lookalike技術(shù)怎么用
Lookalike技術(shù)核心價值在于實現(xiàn)小規(guī)模用戶的精準(zhǔn)擴充。具體來說,在實際業(yè)務(wù)中,廣告主會基于自己的規(guī)則和經(jīng)驗先選取出一小部分高質(zhì)量的典型用戶作為種子用戶。這些種子用戶能夠精準(zhǔn)代表目標(biāo)客戶群體,但由于選取規(guī)則設(shè)置嚴(yán)格,導(dǎo)致精準(zhǔn)的目標(biāo)客戶數(shù)量有限。此時,通過Lookalike算法分析種子用戶的特征屬性,再從全量用戶庫中找出與之相似的用戶。新匹配的這些用戶,因為與原種子用戶在某些維度比較相似,所以能滿足業(yè)務(wù)的營銷需求。如此,Lookalike算法就能根據(jù)有限的種子用戶,對用戶群進(jìn)行效果顯著的擴展,以不斷滿足廣告主獲取更多優(yōu)質(zhì)客戶的需求。
舉個汽車銷售的例子,某汽車品牌要在一個新興城市推廣它的新款SUV,目標(biāo)是覆蓋該城市100萬有購車意向的駕駛者。但根據(jù)這一車型的歷史購買數(shù)據(jù),目標(biāo)購車人群只有20萬。為了觸達(dá)更多潛在客戶,該汽車品牌采用了Lookalike技術(shù),先選擇近期詢價或參觀過這一車型的客戶作為種子用戶,然后根據(jù)這些種子用戶的特征,如地區(qū)、收入、生活方式等,在該城市全體駕駛?cè)巳褐衅ヅ涑?0萬與之類似的用戶。這樣一來,這次推廣就可以觸達(dá)更多符合品牌價值觀和購車偏好的目標(biāo)人群。
再舉個教育培訓(xùn)的例子,某在線教育平臺準(zhǔn)備推出一個Python編程課程,目標(biāo)是向5000名學(xué)生推送該課程信息。但根據(jù)平臺的注冊用戶數(shù)據(jù),可能只有1000名對Python感興趣。為了擴大課程的影響力,平臺決定運用Lookalike技術(shù),先選擇最近1年內(nèi)報名學(xué)習(xí)過編程課程的注冊用戶作為種子群體,他們代表了有需求的用戶屬性。然后,平臺可以根據(jù)這部分種子用戶的特征,例如學(xué)歷背景、職業(yè)方向、學(xué)習(xí)偏好等,從全部注冊用戶中匹配出4000名與種子用戶類似的潛在感興趣用戶。這樣,新課程就可以觸達(dá)到更多對編程有需求的目標(biāo)學(xué)生。
3、Lookalike技術(shù)怎么實現(xiàn)
圖2 如何實現(xiàn)Lookalike
Lookalike相似人群拓展方法主要有以下幾種方法:
(1)基于用戶屬性的顯式Lookalike
此類方法依據(jù)用戶的屬性特征來發(fā)現(xiàn)相似用戶,具體可以使用人口統(tǒng)計學(xué)特征如年齡、收入、教育程度、地區(qū)等。使用時,可以先定義好要匹配的核心屬性,然后在用戶群中提取具有相近屬性值的用戶。這種方法實現(xiàn)簡單,但僅限于預(yù)先定義的幾個屬性,可能會遺漏描述用戶的其他隱性特征。
(2)基于用戶行為的隱式Lookalike
此類方法會全面分析各類用戶行為數(shù)據(jù),例如頁面瀏覽時間、點擊頻率、搜索詞、消費金額、興趣等,將種子用戶作為正樣本,將隨機用戶進(jìn)行降采樣后作為負(fù)樣本,運用機器學(xué)習(xí)算法建模用戶的興趣和消費偏好,然后匹配具有類似偏好和行為的用戶。優(yōu)點是可以充分利用豐富的用戶行為數(shù)據(jù),缺點是需要收集大量行為數(shù)據(jù)進(jìn)行建模。
(3)基于圖數(shù)據(jù)庫進(jìn)行隱式Lookalike
此類方法在圖數(shù)據(jù)庫中構(gòu)建用戶節(jié)點和用戶關(guān)系邊的網(wǎng)絡(luò)結(jié)構(gòu),識別種子用戶后,依托節(jié)點之間的邊關(guān)系進(jìn)行特征與標(biāo)簽向相鄰節(jié)點的傳播擴散,通過遞歸迭代不斷在網(wǎng)絡(luò)圖中發(fā)現(xiàn)新的相似用戶,重復(fù)該過程直到發(fā)現(xiàn)足夠數(shù)量的人群,從而實現(xiàn)對目標(biāo)用戶的高效擴充。這種技術(shù)充分利用圖數(shù)據(jù)庫對網(wǎng)絡(luò)數(shù)據(jù)的建模與計算優(yōu)勢,能有效發(fā)掘更多不易觀察的相似用戶,但需要處理大規(guī)模關(guān)系圖的存儲和計算問題。
本文介紹了Lookalike技術(shù)的相關(guān)概念和應(yīng)用方法,但在實際業(yè)務(wù)應(yīng)用中,如何科學(xué)選擇特征來描述用戶,以保證后續(xù)算法的效果,以及如何收集營銷反饋來持續(xù)優(yōu)化機器學(xué)習(xí)模型,形成閉環(huán),都是需要解決的關(guān)鍵問題??傊?,任何算法并不是孤立存在的,必須結(jié)合數(shù)據(jù)及業(yè)務(wù)場景進(jìn)行合理的應(yīng)用才能發(fā)揮最大的價值。
參考資料
【1】煉丹筆記.搜推廣遇上用戶畫像:Lookalike相似人群拓展算法| CSDN, 2021
作者:張豪
單位:中國移動智慧家庭運營中心