數(shù)據(jù)挖掘中涉及的關(guān)聯(lián)規(guī)則在實(shí)際生活中的應(yīng)用有哪些?
一、數(shù)據(jù)挖掘中涉及的關(guān)聯(lián)規(guī)則在實(shí)際生活中的應(yīng)用
關(guān)于關(guān)聯(lián)規(guī)則分析,這篇文章可以認(rèn)真學(xué)習(xí)一下,講的比較全面,關(guān)聯(lián)規(guī)則分析還在零售、快消、電商、金融、搜索引擎、智能推薦等領(lǐng)域大有所為,如超市捆綁營(yíng)銷(xiāo)、銀行客戶(hù)交叉銷(xiāo)售分析、搜索詞推薦或者識(shí)別異常、基于興趣的實(shí)時(shí)新聞推薦等。
關(guān)聯(lián)規(guī)則是反映一個(gè)事物與其他事物之間的相互依存性和關(guān)聯(lián)性,常用于實(shí)體商店或在線電商的推薦系統(tǒng):通過(guò)對(duì)顧客的購(gòu)買(mǎi)記錄數(shù)據(jù)庫(kù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘,最終目的是發(fā)現(xiàn)顧客群體的購(gòu)買(mǎi)習(xí)慣的內(nèi)在共性,例如購(gòu)買(mǎi)產(chǎn)品A的同時(shí)也連帶購(gòu)買(mǎi)產(chǎn)品B的概率,根據(jù)挖掘結(jié)果,調(diào)整貨架的布局陳列、設(shè)計(jì)促銷(xiāo)組合方案,實(shí)現(xiàn)銷(xiāo)量的提升,最經(jīng)典的應(yīng)用案例莫過(guò)于<啤酒和尿布>。
關(guān)聯(lián)規(guī)則分析中的關(guān)鍵概念包括:支持度(Support)、置信度(Confidence)與提升度(Lift)。首先,我們簡(jiǎn)單溫故下這3個(gè)關(guān)鍵指標(biāo)。
1、支持度 (Support):支持度是兩件商品(A∩B)在總銷(xiāo)售筆數(shù)(N)中出現(xiàn)的概率,即A與B同時(shí)被購(gòu)買(mǎi)的概率。類(lèi)似于中學(xué)學(xué)的交集,需要原始同時(shí)滿足條件。
例子說(shuō)明:
比如某超市2016年有100w筆銷(xiāo)售,顧客購(gòu)買(mǎi)可樂(lè)又購(gòu)買(mǎi)薯片有20w筆,顧客購(gòu)買(mǎi)可樂(lè)又購(gòu)買(mǎi)面包有10w筆,那可樂(lè)和薯片的關(guān)聯(lián)規(guī)則的支持度是20%,可樂(lè)和面包的支持度是10%。
2、置信度 (Confidence):置信度是購(gòu)買(mǎi)A后再購(gòu)買(mǎi)B的條件概率。簡(jiǎn)單來(lái)說(shuō)就是交集部分C在A中比例,如果比例大說(shuō)明購(gòu)買(mǎi)A的客戶(hù)很大期望會(huì)購(gòu)買(mǎi)B商品。
例子說(shuō)明:
某超市2016年可樂(lè)購(gòu)買(mǎi)次數(shù)40w筆,購(gòu)買(mǎi)可樂(lè)又購(gòu)買(mǎi)了薯片是30w筆,顧客購(gòu)買(mǎi)可樂(lè)又購(gòu)買(mǎi)面包有10w筆,則購(gòu)買(mǎi)可樂(lè)又會(huì)購(gòu)買(mǎi)薯片的置信度是75%,購(gòu)買(mǎi)可樂(lè)又購(gòu)買(mǎi)面包的置信度是25%,這說(shuō)明買(mǎi)可樂(lè)也會(huì)買(mǎi)薯片的關(guān)聯(lián)性比面包強(qiáng),營(yíng)銷(xiāo)上可以做一些組合策略銷(xiāo)售。
3、提升度 (Lift):提升度表示先購(gòu)買(mǎi)A對(duì)購(gòu)買(mǎi)B的概率的提升作用,用來(lái)判斷規(guī)則是否有實(shí)際價(jià)值,即使用規(guī)則后商品在購(gòu)物車(chē)中出現(xiàn)的次數(shù)是否高于商品單獨(dú)出現(xiàn)在購(gòu)物車(chē)中的頻率。如果大于1說(shuō)明規(guī)則有效,小于1則無(wú)效。
例子說(shuō)明:
可樂(lè)和薯片的關(guān)聯(lián)規(guī)則的支持度是20%,購(gòu)買(mǎi)可樂(lè)的支持度是3%,購(gòu)買(mǎi)薯片的支持度是5%,則提升度是1.33>1, A-B規(guī)則對(duì)于商品B有提升效果。 理論很簡(jiǎn)單,真正實(shí)踐起來(lái)卻會(huì)遇到種種困難,印證了那句”數(shù)據(jù)分析師的50%~80%的時(shí)間都花在了處理數(shù)據(jù)上”。
要計(jì)算支持度(Support)、置信度(Confidence)與提升度(Lift),首先需要知道Freq(A∩B)、Freq(A)、Freq(B)和總筆數(shù)數(shù)值,那么需要對(duì)商品進(jìn)行排列組合。
若一個(gè)收銀小票(銷(xiāo)售ID)有30種商品,則組合數(shù)達(dá)到435種。而且可視化層級(jí)上還需要展現(xiàn)集團(tuán)下每個(gè)分公司、每個(gè)城市、每個(gè)門(mén)店、月度、季度或者年度時(shí)間的關(guān)聯(lián)規(guī)則分析,如果用傳統(tǒng)的工具來(lái)實(shí)現(xiàn)上述分析無(wú)異于大海撈針。在BDP中,不僅可以便捷地實(shí)現(xiàn)多維數(shù)據(jù)分析,還可以通過(guò)靈活強(qiáng)大的功能組合來(lái)進(jìn)行更深層面的數(shù)據(jù)分析探索。
延伸閱讀:
二、BI是什么
BI即商業(yè)智能,泛指用于業(yè)務(wù)分析的技術(shù)和工具,通過(guò)獲取、處理原始數(shù)據(jù),將其轉(zhuǎn)化為有價(jià)值的信息指導(dǎo)商業(yè)行動(dòng)。Gartner把BI定義為一個(gè)概括性的術(shù)語(yǔ)(umbrella term),其中包括應(yīng)用程序、基礎(chǔ)設(shè)施和工具,通過(guò)獲取數(shù)據(jù)、分析信息以改進(jìn)并優(yōu)化決策和績(jī)效,形成一套優(yōu)異的商業(yè)實(shí)踐。

猜你喜歡LIKE
相關(guān)推薦HOT
更多>>
mysql怎么查看連接池是否已滿?
一、mysql怎么查看連接池是否已滿1.查看連接數(shù)配置(MySQL服務(wù)器允許的最大連接數(shù)16384)show variables like ‘%max_connections%’2.查看當(dāng)前...詳情>>
2023-10-17 21:20:19
什么是職場(chǎng)情商,如何提高?
什么是情商?情商是一個(gè) 20 世紀(jì) 90 年代作為學(xué)術(shù)話題出現(xiàn)的概念,并迅速成為商業(yè)心理學(xué)和職場(chǎng)動(dòng)態(tài)研究的重要組成部分。它通常被稱(chēng)為 EQ(情商...詳情>>
2023-10-17 20:16:30
vector, list, map等容器使用場(chǎng)合是什么?
一、vector, list, map等容器使用場(chǎng)合vector適用于對(duì)象簡(jiǎn)單,變化較小,并且頻繁隨機(jī)訪問(wèn)的場(chǎng)景。list適用經(jīng)常進(jìn)行插入和刪除并且不經(jīng)常隨機(jī)訪...詳情>>
2023-10-17 19:45:03
數(shù)據(jù)挖掘中涉及的關(guān)聯(lián)規(guī)則在實(shí)際生活中的應(yīng)用有哪些?
一、數(shù)據(jù)挖掘中涉及的關(guān)聯(lián)規(guī)則在實(shí)際生活中的應(yīng)用關(guān)于關(guān)聯(lián)規(guī)則分析,這篇文章可以認(rèn)真學(xué)習(xí)一下,講的比較全面,關(guān)聯(lián)規(guī)則分析還在零售、快消、電...詳情>>
2023-10-17 18:40:06熱門(mén)推薦
sql server2012r2所在服務(wù)器做端口限制,需要開(kāi)放什么端口才能繼續(xù)訪問(wèn)數(shù)據(jù)庫(kù)?
沸Oracle有什么優(yōu)勢(shì)和劣勢(shì)?
熱數(shù)據(jù)庫(kù)聚集索引非聚集索引實(shí)現(xiàn)上有哪些區(qū)別?
熱數(shù)據(jù)庫(kù)(如oracle、mysql)及編程語(yǔ)言(php、python、perl、lisp)的區(qū)別?
新CSS 隱藏頁(yè)面元素有哪些方法?
除了cx_Oracle,python還可以通過(guò)什么方式訪問(wèn)Oracle數(shù)據(jù)庫(kù)?
SQL開(kāi)啟事務(wù)處理的語(yǔ)句 START TRANSACTION 和BEGIN TRAN的區(qū)別?
Android適配你需要學(xué)習(xí)哪些?
開(kāi)發(fā)web應(yīng)用,好的開(kāi)發(fā)流程是怎么樣的?
為什么說(shuō)Gradle是Android進(jìn)階繞不去的坎?
mysql怎么查看連接池是否已滿?
WHERE中有很多IN判斷怎么提速?
軟件開(kāi)發(fā)要遵循哪些事項(xiàng)?
有了innodb buffer pool為什么要有redis?
技術(shù)干貨







快速通道 更多>>
-
課程介紹
點(diǎn)擊獲取大綱 -
就業(yè)前景
查看就業(yè)薪資 -
學(xué)習(xí)費(fèi)用
了解課程價(jià)格 -
優(yōu)惠活動(dòng)
領(lǐng)取優(yōu)惠券 -
學(xué)習(xí)資源
領(lǐng)3000G教程 -
師資團(tuán)隊(duì)
了解師資團(tuán)隊(duì) -
實(shí)戰(zhàn)項(xiàng)目
獲取項(xiàng)目源碼 -
開(kāi)班地區(qū)
查看來(lái)校路線