#针对以下布尔数据集(已用一个“test12.xlsx”表格来存取,直接读取即可,字段名称为A、B、C,“#”号非表格数据):
# A B C
# 1 1 0
# 0 1 1
# 1 0 0
# 1 1 1
# 1 1 1
# 1 0 0
# 1 1 1
# 0 1 1
# 1 0 0
# 1 1 1
# 1 1 0
# 1 1 1
# 1 1 0
##请编程计算规则“A->B”和“A,B->C”的支持度和置信度,分别用sp1和co1,sp2和co2来表示
def return_values():
import pandas as pd
data = pd.read_excel('test12.xlsx') # 读取 Excel 文件
# 计算规则 A->B 的支持度和置信度
# 支持度:A 和 B 同时为 1 的行数 / 总行数
sp1 = len(data[(data['A'] == 1) & (data['B'] == 1)]) / len(data)
# 置信度:A 和 B 同时为 1 的行数 / A 为 1 的行数
co1 = len(data[(data['A'] == 1) & (data['B'] == 1)]) / len(data[data['A'] == 1])
sp2 = len(data[(data['A'] == 1) & (data['B'] == 1) & (data['C'] == 1)]) / len(data)
# 置信度:A、B 和 C 同时为 1 的行数 / A 和 B 同时为 1 的行数
co2 = len(data[(data['A'] == 1) & (data['B'] == 1) & (data['C'] == 1)]) / len(data[(data['A'] == 1) & (data['B'] == 1)])
return (sp1,co1,sp2,co2)