关联规则笔记——Apriori算法
关联规则概述关联规则也是一种 无监督 学习方法。是一种 描述性 算法而非预测性。所揭示的关系可以被表示为 关联规则(asocciation rules)或 频繁项集(frequent itemset)。通常用于购物篮中商品购买关联的分析、点击流分析、推荐系统等。
关联规则可以表示为:X → Y (概率)即,当X被购买(观察到)时,Y也会被购买(观察到)的概率。X为LHS,Y为RHS。
关联规则可以回答以下问题:
哪些产品可能会被一起购买?
与某客户相似的客户倾向于买什么产品?
对于已经购买某产品的客户,还可能查看或者购买什么其他类似的产品?
Apriori算法 是用于生产关联规则的最早的、最基本的算法。
Apriori算法几个概念
项集:包含某种关系的一系列项目。可以是一次交易中一起购买的一系列商品,也可以是用户在单个会话中的点击流。
k项集:包含k个项目的项集。通常用 \({\lbrace item_1, item_2, …, item_k \rbrace}\) 表示。
支持度(support):给定一个项集L,L的支持度是所有交易中包含L的交易的比例。(\(\frac{包含
...