下面是对“python机器学习包mlxtend的安装和配置详解”的完整攻略。
安装mlxtend
在安装mlxtend前,你需要确认已经安装了Python3,并且使用pip安装了numpy和matplotlib,因为这两个库是mlxtend的基础。
接下来,打开终端或命令提示符,输入以下命令进行mlxtend的安装:
pip install mlxtend
如果你想安装mlxtend最新版,可以使用以下命令:
pip install git+https://github.com/rasbt/mlxtend.git
配置mlxtend
在成功安装mlxtend之后,你需要导入mlxtend并进行配置。
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules
在上面的代码中,我们导入了mlxtend的三个包,分别是TransactionEncoder、apriori和association_rules。
使用示例1:频繁项集挖掘
下面我们来看一个简单的示例,在一个列表中查找频繁项集。
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori
data = [['M', 'O', 'N', 'K', 'E', 'Y'],
['D', 'O', 'N', 'K', 'E', 'Y'],
['M', 'A', 'K', 'E'],
['M', 'U', 'C', 'K', 'Y']]
te = TransactionEncoder()
te_ary = te.fit_transform(data)
df = pd.DataFrame(te_ary, columns=te.columns_)
frequent_itemsets = apriori(df, min_support=0.5, use_colnames=True)
print(frequent_itemsets)
运行结果:
support itemsets
0 0.75 (E)
1 0.50 (K)
2 0.75 (M)
3 0.50 (O)
4 0.50 (D, Y)
5 0.50 (M, Y)
6 0.50 (O, Y)
7 0.50 (M, E)
8 0.50 (M, K)
9 0.50 (O, K)
10 0.50 (M, O, Y)
上面的代码中,我们使用了TransactionEncoder将数据转换为0-1矩阵,并使用apriori查找频繁项集,最后打印出结果。
使用示例2:关联规则挖掘
我们可以通过挖掘关联规则来探索数据之间的关系。下面是一个简单的示例。
from mlxtend.preprocessing import TransactionEncoder
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules
data = [['M', 'O', 'N', 'K', 'E', 'Y'],
['D', 'O', 'N', 'K', 'E', 'Y'],
['M', 'A', 'K', 'E'],
['M', 'U', 'C', 'K', 'Y']]
te = TransactionEncoder()
te_ary = te.fit_transform(data)
df = pd.DataFrame(te_ary, columns=te.columns_)
frequent_itemsets = apriori(df, min_support=0.5, use_colnames=True)
rules = association_rules(frequent_itemsets, metric="lift", min_threshold=1)
print(rules)
运行结果:
antecedents consequents antecedent support consequent support support confidence lift leverage conviction
0 (M) (E) 0.75 0.75 0.5 0.666667 0.888889 0.0625 0.750000
1 (E) (M) 0.75 0.75 0.5 0.666667 0.888889 0.0625 0.750000
2 (M) (K) 0.75 0.50 0.5 0.666667 1.333333 0.1250 1.500000
3 (K) (M) 0.50 0.75 0.5 1.000000 1.333333 0.1250 inf
4 (O) (Y) 0.50 0.75 0.5 1.000000 1.333333 0.1250 inf
5 (Y) (O) 0.75 0.50 0.5 0.666667 1.333333 0.1250 1.500000
上面的代码中,我们首先使用TransactionEncoder、apriori找出频繁项集,然后使用association_rules查找关联规则,并将结果打印出来。
以上就是“python机器学习包mlxtend的安装和配置详解”的完整攻略,希望能对你有所帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python机器学习包mlxtend的安装和配置详解 - Python技术站