久久一区二区精品,亚洲综合久久久久久中文字幕,国产综合精品一区二区,日韩欧美久久一区二区,综合欧美国产视频二区,亚洲国产欧美日韩精品一区二区三区,亚洲一区二区综合

大數據如何給企業(yè)用戶(hù)畫(huà)像
趙宏田,資深大數據技術(shù)專(zhuān)家 2020-05-12 10:00:00
摘要: 幫助企業(yè)盤(pán)活大數據,針對用戶(hù)進(jìn)行個(gè)性化推薦、精準營(yíng)銷(xiāo)、個(gè)性化服務(wù)等多樣化服務(wù),必須先構建出畫(huà)像系統。

在互聯(lián)網(wǎng)步入大數據時(shí)代后,用戶(hù)行為給企業(yè)的產(chǎn)品和服務(wù)帶來(lái)了一系列的改變和重塑,其中最大的變化在于,用戶(hù)的一切行為在企業(yè)面前是可“追溯”“分析”的。企業(yè)內保存了大量的原始數據和各種業(yè)務(wù)數據,這是企業(yè)經(jīng)營(yíng)活動(dòng)的真實(shí)記錄。如何更加有效地利用這些數據進(jìn)行分析和評估,成為企業(yè)基于更大數據量背景的問(wèn)題所在。

隨著(zhù)大數據技術(shù)的深入研究與應用,企業(yè)的關(guān)注點(diǎn)日益聚焦在如何利用大數據來(lái)為精細化運營(yíng)和精準營(yíng)銷(xiāo)服務(wù)上,但要做精細化運營(yíng),首先要建立本企業(yè)的用戶(hù)畫(huà)像。

大數據如何給用戶(hù)畫(huà)像?

要實(shí)現給用戶(hù)畫(huà)像,首先得知道用戶(hù)畫(huà)像是什么?

用戶(hù)畫(huà)像實(shí)際上就是把用戶(hù)信息標簽化,通過(guò)收集用戶(hù)的社會(huì )屬性、消費習慣、偏好特征等各個(gè)維度的數據,進(jìn)而對用戶(hù)或者產(chǎn)品特征屬性進(jìn)行刻畫(huà),并對這些特征進(jìn)行分析、統計,挖掘潛在價(jià)值信息,從而抽象出用戶(hù)的信息全貌。

大數據已經(jīng)興起多年,其對于互聯(lián)網(wǎng)公司的應用來(lái)說(shuō)已經(jīng)如水、電、空氣;對于人們的生活來(lái)說(shuō),也成為不可或缺的重要組成部分。從基礎設施建設到應用層面,主要有數據平臺搭建及運維管理、數據倉庫開(kāi)發(fā)、上層應用的統計分析、報表生成及可視化、用戶(hù)畫(huà)像建模、個(gè)性化推薦與精準營(yíng)銷(xiāo)等應用方向。

很多公司在大數據基礎建設上投入很多,也做了不少報表,但業(yè)務(wù)部門(mén)覺(jué)得大數據和傳統報表沒(méi)什么區別,也沒(méi)能體會(huì )到大數據對業(yè)務(wù)有什么幫助和價(jià)值。究其原因,其實(shí)是“數據靜止在數據倉庫,是死的”。

而用戶(hù)畫(huà)像正好可以幫助大數據“走出”數據倉庫,針對用戶(hù)進(jìn)行個(gè)性化推薦、精準營(yíng)銷(xiāo)、個(gè)性化服務(wù)等多樣化服務(wù),為數據驅動(dòng)運營(yíng)奠定了基礎。

其次我們需要給用戶(hù)畫(huà)像建模,其實(shí)就是給用戶(hù)“打標簽”。結合數據應用體系的層級劃分(如圖1),以及給用戶(hù)打標簽的方式來(lái)看,用戶(hù)畫(huà)像一般有3種標簽類(lèi)型:統計類(lèi)標簽、規則類(lèi)標簽、機器學(xué)習挖掘類(lèi)標簽。

1. 統計類(lèi)標簽

這類(lèi)標簽是最基礎、常見(jiàn)的標簽類(lèi)型。例如,對于某個(gè)用戶(hù)來(lái)說(shuō),其性別、年齡、城市、星座、近7日活躍時(shí)長(cháng)、近7日活躍天數、近7日活躍次數等字段,可以從用戶(hù)注冊數據、用戶(hù)訪(fǎng)問(wèn)、消費數據中統計得出。

2. 規則類(lèi)標簽

這類(lèi)標簽基于用戶(hù)行為及確定的規則產(chǎn)生。例如,對平臺上“消費活躍”用戶(hù)可以定義為“近30天交易次數≥2”。在實(shí)際開(kāi)發(fā)畫(huà)像的過(guò)程中,由于運營(yíng)人員對業(yè)務(wù)更為熟悉,而數據人員對數據的結構、分布、特征更為熟悉,因此規則類(lèi)標簽的規則一般由運營(yíng)人員和數據人員共同協(xié)商確定。

3. 機器學(xué)習挖掘類(lèi)標簽

這類(lèi)標簽是通過(guò)機器學(xué)習挖掘產(chǎn)生,用于對用戶(hù)的某些屬性或某些行為進(jìn)行預測判斷。例如,根據一個(gè)用戶(hù)的行為習慣,判斷該用戶(hù)是男性還是女性;根據一個(gè)用戶(hù)的消費習慣,判斷其對某商品的偏好程度。該類(lèi)標簽需要通過(guò)算法挖掘產(chǎn)生。

在項目工程實(shí)踐中,一般統計類(lèi)和規則類(lèi)的標簽就可以滿(mǎn)足應用需求,在開(kāi)發(fā)中占有較大比例。機器學(xué)習挖掘類(lèi)標簽多用于預測場(chǎng)景,如判斷用戶(hù)性別、用戶(hù)購買(mǎi)商品偏好、用戶(hù)流失意向等。一般情況下,機器學(xué)習標簽開(kāi)發(fā)周期較長(cháng),開(kāi)發(fā)成本較高,因此其開(kāi)發(fā)所占比例也比較小。

用戶(hù)畫(huà)像有哪些模塊?

借助用戶(hù)畫(huà)像,我們可以對商品的銷(xiāo)量進(jìn)行分析。比如說(shuō)可以快速定位到爆款品類(lèi),進(jìn)一步分析購買(mǎi)爆款品類(lèi)的用戶(hù)在各個(gè)維度上的特征。

比如,運營(yíng)人員在分析用戶(hù)購買(mǎi)記錄時(shí),可以直觀(guān)地看出產(chǎn)品品類(lèi)的銷(xiāo)量情況。如果運營(yíng)人員想進(jìn)一步了解用戶(hù)的其他特征,我們可以搭建一套完整的用戶(hù)畫(huà)像系統,以便進(jìn)行精準營(yíng)銷(xiāo)。

一般來(lái)說(shuō),一套用戶(hù)畫(huà)像方案需要考慮8個(gè)模塊的建設(如圖2)。

用戶(hù)畫(huà)像基礎:需要了解、明確用戶(hù)畫(huà)像是什么,包含哪些模塊,數據倉庫架構是什么樣子,開(kāi)發(fā)流程,表結構設計,ETL設計等。這些都是框架,大方向的規劃,只有明確了方向,后續才能做好項目的排期和人員投入預算。這對于評估每個(gè)開(kāi)發(fā)階段重要指標和關(guān)鍵產(chǎn)出都非常重要。

數據指標體系:根據業(yè)務(wù)線(xiàn)梳理,包括用戶(hù)屬性、用戶(hù)行為、用戶(hù)消費、風(fēng)險控制等維度的指標體系。

標簽數據存儲:標簽相關(guān)數據可存儲在Hive、MySQL、HBase、Elasticsearch等數據庫中,不同存儲方式適用于不同的應用場(chǎng)景。

標簽數據開(kāi)發(fā):這是用戶(hù)畫(huà)像工程化的重點(diǎn)模塊,包含統計類(lèi)、規則類(lèi)、挖掘類(lèi)、流式計算類(lèi)標簽的開(kāi)發(fā),以及人群計算功能的開(kāi)發(fā),可有效打通畫(huà)像數據和各業(yè)務(wù)系統之間的通路,提供接口服務(wù)等開(kāi)發(fā)內容。

開(kāi)發(fā)性能調優(yōu):標簽加工、人群計算等腳本上線(xiàn)調度后,為了縮短調度時(shí)間、保障數據的穩定性等,需要對開(kāi)發(fā)的腳本進(jìn)行迭代重構、調優(yōu)。

作業(yè)流程調度:標簽加工、人群計算、同步數據到業(yè)務(wù)系統、數據監控預警等腳本開(kāi)發(fā)完成后,需要調度工具把整套流程調度起來(lái)。

用戶(hù)畫(huà)像產(chǎn)品化:為了能讓用戶(hù)數據更好地服務(wù)于業(yè)務(wù)方,需要以產(chǎn)品化的形態(tài)應用在業(yè)務(wù)上。產(chǎn)品化的模塊主要包括標簽視圖、用戶(hù)標簽查詢(xún)、用戶(hù)分群、透視分析等。

用戶(hù)畫(huà)像應用:畫(huà)像的應用場(chǎng)景包括用戶(hù)特征分析、短信、郵件、站內信、Push消息的精準推送、客服針對用戶(hù)的不同話(huà)術(shù)、針對高價(jià)值用戶(hù)的極速退貨退款等VIP服務(wù)應用。

這些模塊可以有利于幫助我們更清楚地了解用戶(hù)畫(huà)像是如何從0到1搭建起來(lái)的,并以此作為提供服務(wù)、驅動(dòng)用戶(hù)、將用戶(hù)畫(huà)像產(chǎn)品化的基礎。

怎樣做一款用戶(hù)畫(huà)像產(chǎn)品?

我們開(kāi)發(fā)出畫(huà)像的標簽數據、搭建起畫(huà)像的整體模塊之后,如果只是“躺在”數據倉庫中,并不能發(fā)揮更大的業(yè)務(wù)價(jià)值。只有將畫(huà)像數據產(chǎn)品化才能更方便業(yè)務(wù)方使用,比如用戶(hù)畫(huà)像產(chǎn)品主要可能涵蓋到的功能模塊,以及這些功能模塊的應用場(chǎng)景。

畫(huà)像產(chǎn)品按常見(jiàn)的功能來(lái)看,主要包括標簽視圖與即時(shí)查詢(xún),用戶(hù)分群,用戶(hù)人群透視分析,對用戶(hù)從事件、留存、漏斗、分布等多維度展開(kāi)的深入交互式分析等模塊。下面我們詳細介紹一下畫(huà)像的產(chǎn)品形態(tài)。

1. 標簽視圖與查詢(xún)

標簽視圖與查詢(xún)功能主要面向業(yè)務(wù)人員使用,如圖3所示。

在平臺標簽視圖板塊中,層級化地展示了目前已經(jīng)上線(xiàn)使用的全部用戶(hù)標簽。用戶(hù)可以層級化地通過(guò)點(diǎn)擊標簽,查看每個(gè)標簽的詳細介紹。

當點(diǎn)擊圖中“用戶(hù)屬性”這個(gè)一級類(lèi)目,可進(jìn)入到“自然性別”“購物性別”“用戶(hù)價(jià)值”等二級類(lèi)目;點(diǎn)擊“自然性別”二級類(lèi)目,可看到展開(kāi)的“男性”“女性”三級標簽;進(jìn)一步點(diǎn)擊三級標簽“男性”或是“女性”,可以進(jìn)入查看該標簽的詳細介紹,如圖4所示。

在該標簽詳情頁(yè)中,可以查看人口屬性這一個(gè)類(lèi)目下面的各個(gè)標簽覆蓋用戶(hù)量情況。

每天通過(guò)對標簽的覆蓋用戶(hù)量進(jìn)行監控,可以作為預警使用。例如:某天某個(gè)標簽的覆蓋用戶(hù)量與前一天相比出現了很大比例的波動(dòng),這時(shí)就需要排查該標簽當日ETL作業(yè)是否出現異常,或是否因業(yè)務(wù)上的操作導致標簽量級的波動(dòng)。

在標簽查詢(xún)模塊中,通過(guò)輸入用戶(hù)對應的userid或CookieID,可以查看該用戶(hù)的屬性信息、行為信息、風(fēng)控屬性等多維度的信息,從多方位了解一個(gè)用戶(hù)的特征。

2. 用戶(hù)分群功能

用戶(hù)分群功能主要面向業(yè)務(wù)人員使用。產(chǎn)品經(jīng)理、運營(yíng)、客服等業(yè)務(wù)人員在應用標簽時(shí),可能不僅僅只查看某一個(gè)標簽對應的人群情況,更多地需要組合多個(gè)標簽來(lái)滿(mǎn)足其在業(yè)務(wù)上對人群的定義。

例如,組合“近30日購買(mǎi)次數”大于3次和“高活躍”“女性”用戶(hù)這3個(gè)標簽進(jìn)行定義目標人群,查看該類(lèi)人群覆蓋的用戶(hù)量,以及該部分人群的各維度特征。在“用戶(hù)分群”板塊下,點(diǎn)擊“新建人群”或編輯之前已添加的分組(如圖5),進(jìn)入詳情頁(yè)可自定義涵蓋某些標簽的人群。

在自定義編輯用戶(hù)分群時(shí),對于有統計值類(lèi)型的標簽,可以自定義篩選該標簽的取值范圍,如“近30日購買(mǎi)次數”的標簽,業(yè)務(wù)人員可篩選該標簽的數值。對于分類(lèi)型標簽,(如圖4)中“活躍度”標簽,業(yè)務(wù)人員選中該標簽即可圈出包含該標簽的用戶(hù)。“人群名稱(chēng)”和“人群描述”表單用于業(yè)務(wù)人員描述該人群在業(yè)務(wù)上的定義,方便后續繼續查看、應用該人群。

3. 人群分析功能

人群分析功能主要是面向業(yè)務(wù)人員、數據分析師、產(chǎn)品經(jīng)理等人群使用。

人群分析是一個(gè)根據現有用戶(hù)標簽圈定用戶(hù)群的功能,方便業(yè)務(wù)方從多個(gè)維度(如地域、性別、年齡、消費水平等)進(jìn)一步分析該批用戶(hù)群的特征,從而為精細化運營(yíng)提供支持。和用戶(hù)人群功能相似,人群分析功能首先也需要組合標簽圈定用戶(hù)群體。不同之處在于多維透視分析功能支持從多個(gè)維度去分析圈定用戶(hù)群體的特征,而用戶(hù)分群功能側重的是將篩選出來(lái)的用戶(hù)群推送到各業(yè)務(wù)系統中,提供服務(wù)支持。

和用戶(hù)分群功能一樣,人群分析功能也需要組合標簽篩選出目標用戶(hù)群體,創(chuàng )建起需要分析的人群。然后,在“對比維度”選擇菜單中選擇需要分析該批用戶(hù)的維度,如下單次數、活躍度。“對比維度”列表中的可選標簽也是用戶(hù)屬性、用戶(hù)行為欄目中已經(jīng)構建的標簽。這樣我們就可以看到剛才篩選出來(lái)的用戶(hù)群在活躍度和下單次數上的表現了。

除了能透視分析單個(gè)人群在多個(gè)維度上的特征,還可以支持同時(shí)分析多個(gè)人群在不同維度上的表現。業(yè)務(wù)人員可以根據不同業(yè)務(wù)規則同時(shí)創(chuàng )建兩個(gè)人群,然后篩選對比維度,從多個(gè)維度上對比分析這兩個(gè)人群的特征。

用戶(hù)畫(huà)像產(chǎn)品化只是把數據應用到業(yè)務(wù)服務(wù)中的一個(gè)重要出口,方便業(yè)務(wù)人員分析用戶(hù)群特征,將分析后的用戶(hù)群推送到對應業(yè)務(wù)系統中,更方便、快捷地將數據賦能到業(yè)務(wù)場(chǎng)景中去。企業(yè)想要在營(yíng)銷(xiāo)和業(yè)務(wù)增量上有更大的突破,還需要在用戶(hù)畫(huà)像的基礎上,做更多產(chǎn)品策略性的思考。

9
歡迎關(guān)注商界網(wǎng)公眾號(微信號:shangjiexinmeiti)
標簽大數據  

評論

登錄后參與評論

全部評論(1705)

廣告
廣告
廣告
商界APP
  • 最新最熱
    行業(yè)資訊

  • 訂閱欄目
    效率閱讀

  • 音頻新聞
    通勤最?lèi)?ài)

廣告