廣西臻實(shí)項(xiàng)目數(shù)據(jù)分析師事務(wù)所特約分析師 陳虹堅(jiān)/文
一、業(yè)務(wù)背景
交叉銷售是企業(yè)結(jié)合客戶需求,提高現(xiàn)有客戶客單價(jià)的一種營銷方式。實(shí)現(xiàn)交叉銷售對于企業(yè)而言意義非凡:一是使銷售行為更容易成功,將產(chǎn)品或服務(wù)推銷給一個(gè)現(xiàn)有客戶比推銷給新客戶更容易成功;二是使客戶忠誠度增加,經(jīng)濟(jì)學(xué)上的經(jīng)驗(yàn)表明,持有兩項(xiàng)產(chǎn)品的客戶流失率為55%,而持有四種產(chǎn)品以上的客戶流失率幾乎為零;三是提升企業(yè)盈利能力,交叉銷售實(shí)現(xiàn)在提升銷售的同時(shí)降低新客戶獲取的成本,提高單個(gè)客戶的貢獻(xiàn)度,從而實(shí)現(xiàn)更高的盈利。
對于企業(yè)而言,實(shí)現(xiàn)交叉銷售,首先需要通過數(shù)據(jù)分析,發(fā)現(xiàn)哪些產(chǎn)品經(jīng)常被一起購買,進(jìn)而可以對用戶進(jìn)行推薦,更多時(shí)候,需要從海量的購買記錄中尋找交叉銷售的機(jī)會(huì)。Apriori算法作為最具影響力的挖掘關(guān)聯(lián)規(guī)則的算法,已經(jīng)被廣泛應(yīng)用在零售、電信及網(wǎng)絡(luò)監(jiān)測等眾多領(lǐng)域,成為最經(jīng)典和常用的分析方法之一。
二、Apriori算法
Apriori算法是一種挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法,使用候選項(xiàng)集通過設(shè)定一些指標(biāo)找出頻繁項(xiàng)集。項(xiàng)集是產(chǎn)品的任意組合,頻繁項(xiàng)集就是經(jīng)常被一起購買的產(chǎn)品組合,反映了大部分人的購買習(xí)慣。簡而言之,Apriori算法是要發(fā)現(xiàn)大部分客戶一起購買的產(chǎn)品A、B,建立A→B或B→A的關(guān)系式。
布爾運(yùn)算(Boolean)通過對兩個(gè)以上的物體進(jìn)行并集、差集、交集的運(yùn)算,從而得到新的物體形態(tài)。算法的基本思想如下:
1.如果一個(gè)項(xiàng)集不是頻繁項(xiàng)集,那么任何包含它的項(xiàng)集也一定不是頻繁項(xiàng)集。也就是說,同時(shí)購買產(chǎn)品A和B的人很少,那么同時(shí)購買A、B和C的人就更少了。
2.如果一個(gè)項(xiàng)集是頻繁項(xiàng)集,那么它的任何子集也是頻繁項(xiàng)集,也就是說,購買A、B和C的人多,那么購買A和B的人就更多了。
三、Apriori算法的主要指標(biāo)
Apriori算法有5個(gè)關(guān)鍵指標(biāo):項(xiàng)集/頻繁項(xiàng)集、支持度、置信度、提升度、強(qiáng)關(guān)聯(lián)規(guī)則。
指標(biāo)1、項(xiàng)集/頻繁項(xiàng)集
項(xiàng)集是所有產(chǎn)品及其任意組合,一個(gè)項(xiàng)即為一個(gè)產(chǎn)品或者組合,在多數(shù)客戶的訂單中頻繁出現(xiàn)的那些項(xiàng)就是頻繁項(xiàng)集。
指標(biāo)2、支持度
根據(jù)項(xiàng)在全部客戶記錄中出現(xiàn)的頻率,可稱為支持度。支持度體現(xiàn)了關(guān)聯(lián)規(guī)則的普遍性。
指標(biāo)3、置信度
對于那些經(jīng)常被一起購買的產(chǎn)品,他們之間存在較強(qiáng)的關(guān)聯(lián)性,怎么定義關(guān)系的強(qiáng)弱,就涉及到置信度指標(biāo)。
置信度是指客戶在持有一個(gè)產(chǎn)品(或者一組產(chǎn)品)的前提下,還持有其他產(chǎn)品的概率,置信度體現(xiàn)關(guān)聯(lián)規(guī)則的可靠性。
指標(biāo)4、提升度
滿足條件的事件,相比不滿足條件的事件,發(fā)生增加的可能性。計(jì)算公式:Lift(A→B)=CONF(A→B)/SUPP(B)
指標(biāo)5、強(qiáng)關(guān)聯(lián)規(guī)則
諸如A→B,購買A的情況下又購買B的事件,稱為關(guān)聯(lián)規(guī)則。其中,滿足最小支持度閥值和最小置信度閥值的關(guān)聯(lián)規(guī)則稱為強(qiáng)關(guān)聯(lián)規(guī)則,規(guī)則即普遍又可靠。
四、Apriori算法的基本步驟
Apriori算法主要包括以下幾個(gè)步驟:
1.數(shù)據(jù)輸入:按照格式要求準(zhǔn)備數(shù)據(jù),一般包含用戶ID和產(chǎn)品名稱兩個(gè)字段??赏瑫r(shí)設(shè)定支持度閥值、置信度閥值。
2.生成項(xiàng)值:根據(jù)出現(xiàn)的全部產(chǎn)品,生成全體項(xiàng)集。
3.計(jì)算項(xiàng)集的支持度:針對每個(gè)項(xiàng),分別計(jì)算支持度,同時(shí)去除小于支持度閥值的項(xiàng),得到頻繁項(xiàng)集。
4.計(jì)算關(guān)聯(lián)規(guī)則的置信度:針對頻繁項(xiàng)集,建立諸如A→B的全部關(guān)聯(lián)規(guī)則,計(jì)算置信度,同時(shí)去除小于最小置信度閥值的規(guī)則。
5.將強(qiáng)關(guān)聯(lián)規(guī)則直觀展示出來。
6.規(guī)則分析:從業(yè)務(wù)角度出發(fā),分析規(guī)則的實(shí)際意義,提取具有現(xiàn)實(shí)指導(dǎo)意義的關(guān)聯(lián)規(guī)則。
五、SAS實(shí)現(xiàn)
SAS EM有專門的關(guān)聯(lián)規(guī)則挖掘模塊,可以交互式操作。一般包括三段代碼:
STEP1:為建模創(chuàng)建事物數(shù)據(jù)庫,即為分析準(zhǔn)備一個(gè)虛擬環(huán)境,不產(chǎn)生分析結(jié)果。
STEP2:用于生成項(xiàng)集并根據(jù)支持度閥值得到頻繁項(xiàng)集,當(dāng)產(chǎn)品項(xiàng)很多時(shí),運(yùn)算量會(huì)較大。頻繁項(xiàng)集輸出到列表ASC_RESULT中。
STEP3:利用頻繁項(xiàng)集構(gòu)造滿足最小置信度閥值的強(qiáng)關(guān)聯(lián)規(guī)則,并直觀展示出來,輸出到列表RLA_RULES中。
部分代碼清單如下:
PROC DMDB
DATA=Asso_Datsrc
OUT=_null_
DMDBCAT=Tmp2;
ID Csr_Id;
CLASS Prod;
TARGET Prod;
RUN;
PROC ASSOC
DMDBCAT=TMP2
DATA=Assoc_Datsrc
OUT=Asc_Result
PCTSUP=10
ITEMS=4;
CUSTOMER Car_Id;
TARGET Prod;
QUIT;
PROC RULEGEN
IN=Asc_Result
OUT=Rla_Rules
MINCONF=60;
QUIT;
備注:
1.廣西臻實(shí)項(xiàng)目數(shù)據(jù)分析師事務(wù)所業(yè)務(wù)范圍:
●投資項(xiàng)目評估、經(jīng)濟(jì)效益評價(jià)、項(xiàng)目數(shù)據(jù)處理、項(xiàng)目融資、投資項(xiàng)目策劃、社會(huì)經(jīng)濟(jì)咨詢等。
●專業(yè)項(xiàng)目數(shù)據(jù)分析評估:為眾多投資人提供專業(yè)項(xiàng)目分析服務(wù),減少投資風(fēng)險(xiǎn);
●撰寫項(xiàng)目數(shù)據(jù)分析報(bào)告:為項(xiàng)目方編寫項(xiàng)目數(shù)據(jù)分析報(bào)告;
●提供融資服務(wù):項(xiàng)目融資與項(xiàng)目分析工作緊密相連,是項(xiàng)目分析工作價(jià)值的體現(xiàn);
●項(xiàng)目理財(cái)策劃:項(xiàng)目運(yùn)營的關(guān)健是現(xiàn)金流,是數(shù)據(jù)真實(shí)的體現(xiàn), CPDA重要的工作是對未來運(yùn)營情況的判…
2.廣西數(shù)據(jù)分析師探討交流QQ群:117268053
3.業(yè)務(wù)咨詢電話:0771-5862703/18978862530 韋勛峰經(jīng)理
(聲明:文章來源于網(wǎng)絡(luò),不代表本站觀點(diǎn)及立場,版權(quán)歸原作者所有,若有侵權(quán)或異議請聯(lián)系更正或刪除)