一般情況下,數(shù)據(jù)部門會(huì)有專業(yè)的技術(shù)團(tuán)隊(duì)進(jìn)行用戶畫像建模,但在實(shí)際應(yīng)用中,用戶畫像的建立方法和流程完全可以簡(jiǎn)化,以縮短建模周期,為用戶運(yùn)營指明方向。本文將從用戶的數(shù)據(jù)源類型和用戶數(shù)據(jù)建模兩方面詳細(xì)介紹用戶畫像的建立方法。今天的文章,我們將從用戶的數(shù)據(jù)源類型和用戶數(shù)據(jù)建模兩方面詳細(xì)介紹用戶畫像的建立方法。
用戶畫像(Personas)這一概念最初是由交互設(shè)計(jì)之父Alan Cooper提出的,如圖1所示。互聯(lián)網(wǎng)中的用戶畫像是通過多個(gè)角度,從用戶行為數(shù)據(jù)中提取某個(gè)產(chǎn)品的使用者的共同特征,通過比對(duì)和抽取特征來描繪該產(chǎn)品使用者的畫像的工具。

▲圖1 用戶畫像的概念
在大數(shù)據(jù)技術(shù)已經(jīng)廣泛應(yīng)用于各個(gè)產(chǎn)業(yè)的今天,通過大量的數(shù)據(jù)塑造,篩選用戶,建立產(chǎn)品的專屬用戶畫像供產(chǎn)品經(jīng)理和運(yùn)營人員優(yōu)化產(chǎn)品和服務(wù),已經(jīng)成為業(yè)界非常推崇和認(rèn)可的應(yīng)用方式。
那么,我們?cè)撊绾谓⒂脩舢嬒衲兀?/p>
01
用戶數(shù)據(jù)源類型
1)用戶畫像的數(shù)據(jù)源
用戶畫像的數(shù)據(jù)源主要分為兩種:一種是用戶屬性,另一種是用戶行為。用戶屬性主要有兩個(gè)來源:設(shè)備自有的客觀被動(dòng)信息(如設(shè)備型號(hào)、應(yīng)用版本、地理位置等),以及用戶主動(dòng)登記的信息(如產(chǎn)品交互中提示用戶選擇的個(gè)人登記信息)。而用戶行為類數(shù)據(jù)多為用戶運(yùn)營提需求,研發(fā)人員埋點(diǎn)(標(biāo)記用戶交互行為),在用戶發(fā)生交互行為后統(tǒng)計(jì)點(diǎn)擊或其他交互數(shù)據(jù)得到的。
了解了收集方式,下面來看數(shù)據(jù)源的具體類型(見圖2)。

▲圖2 用戶畫像的數(shù)據(jù)源
從前面舉的例子中可以看到,在大數(shù)據(jù)技術(shù)出現(xiàn)之前,無論是小區(qū)保安還是朝陽群眾,其信息庫的建立基本依靠口口相傳或者人工記錄。不過,即便是通過這種原始的數(shù)據(jù)記錄方式所得到的有限數(shù)據(jù)源都能有一套自己的模型,可見對(duì)數(shù)據(jù)源的整理和關(guān)聯(lián)具有非常重要的作用。
和原始的數(shù)據(jù)記錄方式相比,如今的互聯(lián)網(wǎng)產(chǎn)品收集數(shù)據(jù)要容易得多,產(chǎn)品經(jīng)理和運(yùn)營人員都不會(huì)太擔(dān)心數(shù)據(jù)的來源問題。用戶使用一款產(chǎn)品,從注冊(cè)到登錄再到點(diǎn)擊,我們就已經(jīng)能夠收集到非常多的用戶數(shù)據(jù)了。哪怕產(chǎn)品依托于其他的大平臺(tái),平臺(tái)也會(huì)提供已有的海量數(shù)據(jù),在此基礎(chǔ)上,我們還可以依據(jù)自身產(chǎn)品的特點(diǎn)進(jìn)一步進(jìn)行用戶數(shù)據(jù)的收集。以常用的平臺(tái)產(chǎn)品微信公眾號(hào)為例,它的后臺(tái)提供了多維度的用戶數(shù)據(jù)和簡(jiǎn)單的分析(見圖3)。

▲圖3 微信公眾號(hào)后臺(tái)用戶分析模塊
2)用戶屬性
數(shù)據(jù)源有客觀數(shù)據(jù)和主觀數(shù)據(jù)之分,其中用戶屬性屬于客觀數(shù)據(jù)。自然屬性、商業(yè)屬性、垂直屬性、標(biāo)簽屬性這些都屬于客觀數(shù)據(jù),而用戶行為和行為關(guān)聯(lián)則屬于主觀數(shù)據(jù)。將用戶屬性和用戶行為這些零散的數(shù)據(jù)輸出為可用、可視的數(shù)據(jù)模型,用戶畫像就建立了。
- 自然屬性
我們常說的80后、90后、00后是根據(jù)年齡劃分的部分人群,在這些稱謂的后面一般會(huì)緊跟這些人群的一些特征。這就屬于依據(jù)自然屬性來對(duì)人群進(jìn)行劃分的分類方式。
一般來講,自然屬性指的是一個(gè)自然人的基本屬性。圖4列出了依據(jù)自然屬性劃分時(shí)常用的參數(shù)。性別屬性是使用較為廣泛的標(biāo)簽,不同性別的人群對(duì)于不同內(nèi)容的喜好會(huì)有明顯不同。而通過年齡、地域、學(xué)歷、職業(yè)、婚姻狀況、子女狀況等自然屬性標(biāo)簽,比較容易分析出一個(gè)產(chǎn)品用戶群體的基本占比情況。不同產(chǎn)品所關(guān)注的點(diǎn)在這些自然屬性里基本都有跡可循。比如目標(biāo)用戶是針對(duì)年輕人群體的,可以通過年齡屬性看到自己產(chǎn)品目前的年齡層占比情況;而目標(biāo)用戶是媽媽群體的,可以通過婚姻狀況和子女狀況來判斷這部分用戶的占比情況是否符合預(yù)期。

▲圖4 依據(jù)自然屬性劃分的基本參數(shù)
- 商業(yè)屬性
商業(yè)屬性也是一個(gè)比較重要的屬性類別,依據(jù)商業(yè)屬性劃分的基本參數(shù)如圖5所示。

▲圖5 依據(jù)商業(yè)屬性劃分的基本參數(shù)
自然屬性可以幫助我們確定是什么樣的人在用產(chǎn)品,而商業(yè)屬性則能幫助我們判斷有多少用戶可能在產(chǎn)品上消費(fèi),以及他們的消費(fèi)意向、消費(fèi)周期、消費(fèi)頻次。產(chǎn)品良性的商業(yè)化是其長線發(fā)展中不可或缺的因素,因此單獨(dú)分析產(chǎn)品用戶的商業(yè)屬性是用戶畫像中十分重要的組成部分。
- 垂直屬性
自然屬性、商業(yè)屬性都是比較通用的屬性,無論何種類型的產(chǎn)品都有分析這類用戶屬性的需求。而不同類型的產(chǎn)品還有一類專屬于產(chǎn)品自身的垂直屬性。在相對(duì)垂直的產(chǎn)品里,除了通用的用戶屬性,還有哪些值得關(guān)注的用戶垂直屬性?圖6以旅游產(chǎn)品為例,列出了依據(jù)垂直屬性劃分的示例參數(shù)。

▲圖6 依據(jù)垂直屬性劃分的示例參數(shù)
旅游類產(chǎn)品的最終目的是向用戶推薦更多的旅游類內(nèi)容或服務(wù),促使用戶消費(fèi),而知道用戶在旅游方面有哪些屬性有助于用戶運(yùn)營采用針對(duì)性的運(yùn)營手段。其中的屬性數(shù)據(jù)可以通過用戶的航班信息、不同類型的行程等信息得到。
- 標(biāo)簽屬性
除了用戶固有的客觀屬性,還有一種屬性是運(yùn)營本身賦予用戶的屬性——標(biāo)簽屬性(見圖7)。當(dāng)一個(gè)用戶開始使用產(chǎn)品、產(chǎn)生第一條數(shù)據(jù)的時(shí)候,用戶運(yùn)營就可以賦予其第一個(gè)標(biāo)簽——新人。之后隨著產(chǎn)品用戶的累積,逐漸可以分出低頻用戶、活躍用戶、高頻用戶。如果是有增值服務(wù)的產(chǎn)品,還可以根據(jù)用戶購買增值服務(wù)的情況分出VIP用戶。

▲圖7 標(biāo)簽屬性示例參數(shù)
用戶屬性是在產(chǎn)品初期用戶行為數(shù)據(jù)還不夠豐富時(shí)分析用戶的關(guān)鍵數(shù)據(jù)。需要針對(duì)不同的用戶類型給出不同的運(yùn)營策略。從以上4種用戶屬性可以看出,它們并不是單一維度的數(shù)據(jù),而是由多種屬性整合得到的用戶數(shù)據(jù)集合。這個(gè)數(shù)據(jù)集合產(chǎn)生關(guān)于用戶屬性的畫像,指導(dǎo)著產(chǎn)品經(jīng)理和用戶運(yùn)營。
3)用戶行為
相比用戶屬性,用戶行為的數(shù)據(jù)更為個(gè)性化。用戶行為的參數(shù)主要分為兩種:一種是行為類型,另一種是行為來源。圖8中分別列舉了與用戶行為類型和用戶行為來源相關(guān)的參數(shù)。

▲圖8 用戶行為參數(shù)
- 行為類型
行為類型可以幫助我們定位產(chǎn)品中最受用戶關(guān)注的內(nèi)容和服務(wù)。我們?cè)谑褂靡豢町a(chǎn)品時(shí)會(huì)自然地做出一些行為,比如瀏覽、搜索、點(diǎn)擊、收藏,在使用體驗(yàn)較好時(shí),還會(huì)進(jìn)一步做出互動(dòng)行為,比如點(diǎn)贊、評(píng)論和分享等。在建立用戶畫像模型的時(shí)候,可以為以上行為設(shè)置不一樣的權(quán)重值。將這些權(quán)重值匯總起來就可以定義一個(gè)群體的用戶特征。
舉個(gè)例子,在上述行為中,瀏覽、搜索、點(diǎn)擊都屬于基礎(chǔ)用戶行為,可將每一個(gè)行為的權(quán)重值設(shè)置為1;點(diǎn)贊、收藏則屬于較深層次的用戶行為,可將每一個(gè)行為的權(quán)重值設(shè)置為2;評(píng)論、分享屬于交互較深的行為,可將每一個(gè)行為的權(quán)重值設(shè)置為3。那么,結(jié)合用戶屬性我們可以看出,屬性A(淺度用戶)的用戶在用戶行為上權(quán)重值是B(輕行為),而屬性C(深度用戶)的用戶行為權(quán)重值是D(重行為),由此可以組成一套模型,來針對(duì)不同屬性的用戶進(jìn)行個(gè)性化運(yùn)營,目標(biāo)是將更多A類用戶轉(zhuǎn)化成C類用戶。
- 行為來源
行為來源可以幫助用戶運(yùn)營分析從不同渠道來的用戶是否有共同特征或特殊偏好。一個(gè)產(chǎn)品往往有多種用戶渠道,那么用戶是從哪里過來的?是產(chǎn)品首頁、活動(dòng)頁、公眾號(hào)、推薦、邀請(qǐng)鏈接還是廣告轉(zhuǎn)化?行為來源提供了重要信息,對(duì)每一個(gè)行為來源做好標(biāo)注,在拿到來源數(shù)據(jù)后進(jìn)行進(jìn)一步的行為關(guān)聯(lián),就可以得到一個(gè)完整的用戶畫像。
- 行為關(guān)聯(lián)
用戶屬性與用戶行為的關(guān)聯(lián)是建立模型的基礎(chǔ)。以用戶ID為核心,從來源到屬性再到行為進(jìn)行關(guān)聯(lián),并根據(jù)自身產(chǎn)品的情況設(shè)定不同的權(quán)重(見圖9)。通常將用戶在產(chǎn)品中最核心的交互點(diǎn)的權(quán)重值設(shè)置得最高,通過篩選可以迅速找到最活躍的核心用戶群體,并將次活躍的群體向活躍群體轉(zhuǎn)化。

▲圖9 用戶行為關(guān)聯(lián)
02
用戶數(shù)據(jù)建模
1)數(shù)據(jù)清洗
與數(shù)據(jù)相關(guān)的工作聽起來是偏技術(shù)的工作。確實(shí),對(duì)于海量數(shù)據(jù),人工整理效率很低。然而前面提到,運(yùn)營人員要進(jìn)行高頻的用戶分析,但通用的建模時(shí)間長,流程長,比較難個(gè)性化。可以從數(shù)據(jù)平臺(tái)中進(jìn)行抽樣,在特定時(shí)期抽取隨機(jī)樣本,再根據(jù)隨機(jī)樣本估算出用戶畫像的大概分布。這樣做雖然會(huì)有一定的偏差,但具有實(shí)際指導(dǎo)意義。
所謂數(shù)據(jù)清洗,主要指的是將冗余、無效的信息剔除。當(dāng)渠道來源比較雜的時(shí)候,部分用戶在留下數(shù)據(jù)時(shí)想要隱藏真實(shí)信息,這就可能會(huì)出現(xiàn)0歲或99歲這樣的極端值。我們應(yīng)當(dāng)將這種極端值從樣本中移除,并據(jù)此做一些修正,用修正后的數(shù)據(jù)建庫。
2)建庫與映射
將清洗過的數(shù)據(jù)梳理成不同維度的隊(duì)列,輸出成標(biāo)簽,再將標(biāo)簽與用戶ID進(jìn)行映射。其中用戶ID有唯一的標(biāo)識(shí)碼。基于這個(gè)標(biāo)識(shí)碼,將用戶的所有屬性和行為抽象為不同的標(biāo)簽,再根據(jù)標(biāo)簽與用戶ID的映射將用戶進(jìn)行聚類,進(jìn)行模型輸出。
通過數(shù)據(jù)清洗、建庫與映射、模型輸出,我們可以得到滿足分析需求的用戶畫像。對(duì)于產(chǎn)品經(jīng)理和運(yùn)營人員,最終呈現(xiàn)出來的可視化畫像一般如圖10右圖所示。大數(shù)據(jù)層面的畫像維度更多,可信度也會(huì)更高。
分析圖10所示的用戶畫像,我們能得出什么結(jié)論呢?在性別上,男性用戶占比56%,女性用戶占比44%,可知這款產(chǎn)品的男性用戶占比高于女性用戶;在教育程度上,使用這款產(chǎn)品的用戶中本科及以上人群占比為42%,可知這款產(chǎn)品面向的人群學(xué)歷相對(duì)較高(相比全網(wǎng)網(wǎng)民教育程度);在年齡上,18~35歲人群占據(jù)了60%,可知年輕用戶是這款產(chǎn)品的主要消費(fèi)群體。

▲圖10 用戶畫像模型示例
3)標(biāo)簽化模型輸出
大致判斷出用戶屬性特征后,再看一下用戶的轉(zhuǎn)化消費(fèi)來源。在消費(fèi)來源中,轉(zhuǎn)化占比最高的是分享鏈接,次高的是搜索,與之接近的是某個(gè)促銷頁,最低的是信息流。這就給出了這款產(chǎn)品的畫像——以教育程度較高的男性為主的年輕群體,且該用戶群體喜歡通過分享拉新的產(chǎn)品。
聲明:本文由網(wǎng)站用戶竹子發(fā)表,超夢(mèng)電商平臺(tái)僅提供信息存儲(chǔ)服務(wù),版權(quán)歸原作者所有。若發(fā)現(xiàn)本站文章存在版權(quán)問題,如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,請(qǐng)聯(lián)系我們刪除。