數據挖掘中涉及的關聯規則在實際生活中的應用有哪些?
一、數據挖掘中涉及的關聯規則在實際生活中的應用
關于關聯規則分析,這篇文章可以認真學習一下,講的比較全面,關聯規則分析還在零售、快消、電商、金融、搜索引擎、智能推薦等領域大有所為,如超市捆綁營銷、銀行客戶交叉銷售分析、搜索詞推薦或者識別異常、基于興趣的實時新聞推薦等。
關聯規則是反映一個事物與其他事物之間的相互依存性和關聯性,常用于實體商店或在線電商的推薦系統:通過對顧客的購買記錄數據庫進行關聯規則挖掘,最終目的是發現顧客群體的購買習慣的內在共性,例如購買產品A的同時也連帶購買產品B的概率,根據挖掘結果,調整貨架的布局陳列、設計促銷組合方案,實現銷量的提升,最經典的應用案例莫過于<啤酒和尿布>。
關聯規則分析中的關鍵概念包括:支持度(Support)、置信度(Confidence)與提升度(Lift)。首先,我們簡單溫故下這3個關鍵指標。
1、支持度 (Support):支持度是兩件商品(A∩B)在總銷售筆數(N)中出現的概率,即A與B同時被購買的概率。類似于中學學的交集,需要原始同時滿足條件。
例子說明:
比如某超市2016年有100w筆銷售,顧客購買可樂又購買薯片有20w筆,顧客購買可樂又購買面包有10w筆,那可樂和薯片的關聯規則的支持度是20%,可樂和面包的支持度是10%。
2、置信度 (Confidence):置信度是購買A后再購買B的條件概率。簡單來說就是交集部分C在A中比例,如果比例大說明購買A的客戶很大期望會購買B商品。
例子說明:
某超市2016年可樂購買次數40w筆,購買可樂又購買了薯片是30w筆,顧客購買可樂又購買面包有10w筆,則購買可樂又會購買薯片的置信度是75%,購買可樂又購買面包的置信度是25%,這說明買可樂也會買薯片的關聯性比面包強,營銷上可以做一些組合策略銷售。
3、提升度 (Lift):提升度表示先購買A對購買B的概率的提升作用,用來判斷規則是否有實際價值,即使用規則后商品在購物車中出現的次數是否高于商品單獨出現在購物車中的頻率。如果大于1說明規則有效,小于1則無效。
例子說明:
可樂和薯片的關聯規則的支持度是20%,購買可樂的支持度是3%,購買薯片的支持度是5%,則提升度是1.33>1, A-B規則對于商品B有提升效果。 理論很簡單,真正實踐起來卻會遇到種種困難,印證了那句”數據分析師的50%~80%的時間都花在了處理數據上”。
要計算支持度(Support)、置信度(Confidence)與提升度(Lift),首先需要知道Freq(A∩B)、Freq(A)、Freq(B)和總筆數數值,那么需要對商品進行排列組合。
若一個收銀小票(銷售ID)有30種商品,則組合數達到435種。而且可視化層級上還需要展現集團下每個分公司、每個城市、每個門店、月度、季度或者年度時間的關聯規則分析,如果用傳統的工具來實現上述分析無異于大海撈針。在BDP中,不僅可以便捷地實現多維數據分析,還可以通過靈活強大的功能組合來進行更深層面的數據分析探索。
延伸閱讀:
二、BI是什么
BI即商業智能,泛指用于業務分析的技術和工具,通過獲取、處理原始數據,將其轉化為有價值的信息指導商業行動。Gartner把BI定義為一個概括性的術語(umbrella term),其中包括應用程序、基礎設施和工具,通過獲取數據、分析信息以改進并優化決策和績效,形成一套優異的商業實踐。

猜你喜歡LIKE
相關推薦HOT
更多>>
mysql怎么查看連接池是否已滿?
一、mysql怎么查看連接池是否已滿1.查看連接數配置(MySQL服務器允許的最大連接數16384)show variables like ‘%max_connections%’2.查看當前...詳情>>
2023-10-17 21:20:19
什么是職場情商,如何提高?
什么是情商?情商是一個 20 世紀 90 年代作為學術話題出現的概念,并迅速成為商業心理學和職場動態研究的重要組成部分。它通常被稱為 EQ(情商...詳情>>
2023-10-17 20:16:30
vector, list, map等容器使用場合是什么?
一、vector, list, map等容器使用場合vector適用于對象簡單,變化較小,并且頻繁隨機訪問的場景。list適用經常進行插入和刪除并且不經常隨機訪...詳情>>
2023-10-17 19:45:03
數據挖掘中涉及的關聯規則在實際生活中的應用有哪些?
一、數據挖掘中涉及的關聯規則在實際生活中的應用關于關聯規則分析,這篇文章可以認真學習一下,講的比較全面,關聯規則分析還在零售、快消、電...詳情>>
2023-10-17 18:40:06熱門推薦
sql server2012r2所在服務器做端口限制,需要開放什么端口才能繼續訪問數據庫?
沸Oracle有什么優勢和劣勢?
熱數據庫聚集索引非聚集索引實現上有哪些區別?
熱數據庫(如oracle、mysql)及編程語言(php、python、perl、lisp)的區別?
新CSS 隱藏頁面元素有哪些方法?
除了cx_Oracle,python還可以通過什么方式訪問Oracle數據庫?
SQL開啟事務處理的語句 START TRANSACTION 和BEGIN TRAN的區別?
Android適配你需要學習哪些?
開發web應用,好的開發流程是怎么樣的?
為什么說Gradle是Android進階繞不去的坎?
mysql怎么查看連接池是否已滿?
WHERE中有很多IN判斷怎么提速?
軟件開發要遵循哪些事項?
有了innodb buffer pool為什么要有redis?
技術干貨






