# -*- coding: utf-8 -*-
# --------------------------------------
# @Time : 2019/10/25 16:28
# @Author : hxf
# @Email : 1870212598@qq.com
# @File : lesson.py
# Description :使用Apriori算法实现课程关联分析
# ----------------------------------
'''
使用Apriori算法实现课程关联分析
'''
#计算学院购买课程的关联性
from apriori import *
import pandas as pd
# 导入数据
filename="data/lesson_buy.xls"
dataframe=pd.read_excel(filename,header=None)
# print(dataframe)
# 转化一下数据
dataframe=pd.read_excel(filename,header=None)
#转化一下数据
change=lambda x:pd.Series(1,index=x[pd.notnull(x)])
mapok=map(change,dataframe.values)
data=pd.DataFrame(list(mapok)).fillna(0)
print(data)
#临界支持度、置信度设置
spt=0.2
cfd=0.5
#使用apriori算法计算关联结果
find_rule(data,spt,cfd,"-->")
'''
D:\software\Anaconda3\python.exe F:/Projects/Python/Python3_Data_Analysis/lesson.py
Python爬虫 机器学习 数据分析 PHP Spark Java
0 1.0 1.0 1.0 1.0 1.0 1.0
1 0.0 1.0 0.0 1.0 1.0 1.0
2 1.0 0.0 0.0 0.0 0.0 0.0
3 1.0 0.0 1.0 0.0 0.0 0.0
4 1.0 1.0 1.0 0.0 0.0 0.0
5 0.0 0.0 1.0 0.0 0.0 0.0
6 1.0 1.0 0.0 0.0 0.0 0.0
7 1.0 0.0 0.0 0.0 1.0 1.0
8 0.0 0.0 1.0 1.0 0.0 1.0
9 1.0 1.0 0.0 0.0 0.0 0.0
正在进行第1次搜索...
数目:15...
正在进行第2次搜索...
数目:2...
结果为:
support confidence
PHP-->Java 0.3 1.000000
Spark-->Java 0.3 1.000000
机器学习-->Python爬虫 0.4 0.800000
Java-->PHP 0.3 0.750000
Java-->Spark 0.3 0.750000
数据分析-->Python爬虫 0.3 0.600000
Python爬虫-->机器学习 0.4 0.571429
Process finished with exit code 0
'''