基于布尔数据集的一对一和多对一关联规则挖掘

最新推荐文章于 2025-12-02 19:01:55 发布

原创最新推荐文章于 2025-12-02 19:01:55 发布 · 152 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#python

机器学习与实现专栏收录该内容

11 篇文章

订阅专栏

#针对以下布尔数据集(已用一个“test12.xlsx”表格来存取，直接读取即可，字段名称为A、B、C，“#”号非表格数据):

# A B C

# 1 1 0

# 0 1 1

# 1 0 0

# 1 1 1

# 1 0 0

# 1 1 1

# 0 1 1

# 1 0 0

# 1 1 1

# 1 1 0

# 1 1 1

# 1 1 0

##请编程计算规则“A->B”和“A,B->C”的支持度和置信度，分别用sp1和co1,sp2和co2来表示

def return_values():

import pandas as pd

data = pd.read_excel('test12.xlsx') # 读取 Excel 文件

# 计算规则 A->B 的支持度和置信度

# 支持度：A 和 B 同时为 1 的行数 / 总行数

sp1 = len(data[(data['A'] == 1) & (data['B'] == 1)]) / len(data)

# 置信度：A 和 B 同时为 1 的行数 / A 为 1 的行数

co1 = len(data[(data['A'] == 1) & (data['B'] == 1)]) / len(data[data['A'] == 1])

sp2 = len(data[(data['A'] == 1) & (data['B'] == 1) & (data['C'] == 1)]) / len(data)

# 置信度：A、B 和 C 同时为 1 的行数 / A 和 B 同时为 1 的行数

co2 = len(data[(data['A'] == 1) & (data['B'] == 1) & (data['C'] == 1)]) / len(data[(data['A'] == 1) & (data['B'] == 1)])

return (sp1,co1,sp2,co2)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qwerthoykd

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

数据处理和分析之关联规则学习：Apriori：频繁项集挖掘

2401_87715305的博客

10-05

1325

频繁项集是指在数据集中支持度大于或等于预设阈值的项集。频繁项集的挖掘是关联规则学习的基础，通过频繁项集可以进一步生成关联规则。例如，如果预设的支持度阈值为0.3，那么在上面的例子中，{A, B}是一个频繁项集，因为它的支持度为0.3。为了解决Apriori算法的效率问题，FP-growth算法被提出。FP-growth算法通过构建一个FP树（频繁模式树）来避免多次数据库扫描，从而显著提高了频繁项集的挖掘效率。FP树是一种压缩的、内存高效的树形数据结构，它能够存储整个交易数据集的频繁项集信息。

数据处理和分析之关联规则学习：Eclat：频繁项集挖掘

2401_87715305的博客

10-07

1290

Eclat（Equivalence Class Clustering and bottom-up Lattice Traversal）算法是一种用于频繁项集挖掘的高效算法。与Apriori算法相比，Eclat算法采用了一种更简单的垂直数据格式，并通过深度优先搜索策略来遍历项集的格子结构，从而避免了生成候选集的过程，大大提高了算法的效率。Eclat算法，全称为，是一种用于频繁项集挖掘的算法，特别适用于市场篮子分析等场景。

参与评论您还未登录，请先登录后发表或查看评论

一对一关联规则挖掘及Python实现

qq_68609752的博客

06-17

1762

关联规则挖掘及Python实现

大数据分析与应用之数据挖掘中的关联规则

2401_84239988的博客

11-06

1202

Apriori算法的基本思想是：首先找到所有的频集，这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则，这些规则必须满足最小支持度和最小置信度。然后使用前一步找到的频集产生期望的规则，产生只包含集合的项的所有规则，一旦这些规则被生成，那么只有那些大于用户给定的最小置信度的规则才被留下来。为了生成所有频集，使用了递推的方法。可能产生大量的候选集，以及可能需要重复扫描数据库，是Apriori算法的两大缺点。

数据挖掘Apriori算法-Apriori算法挖掘频繁项集和关联规则

m0_57528651的博客

11-27

507

它的主要目的是在事务数据库中发现频繁项集，并基于这些频繁项集生成有意义的关联规则。- 在频繁项集的基础上生成关联规则，要求计算每条规则的支持度、置信度和提升度（Lift）。- 仅保留置信度大于66%的规则，并对结果进行排序，按照提升度从高到低排列。- 在频繁项集挖掘时，将项集长度限制为最多3项（即最多包含3个商品的组合）。- 对包含商品A的频繁项集，设最小支持度为30%。- 使用Apriori算法在数据集中挖掘频繁项集。- 对其他频繁项集，设最小支持度为20%。Apriori算法是数据挖掘中用于。

数据挖掘|关联分析与Apriori算法详解

皖山文武

04-03

4736

关联规则分析（Association-rules Analysis）是数据挖掘领域的一个重要方法，它是以某种方式分析数据源，从数据样本集中发现一些潜在有用的信息和不同数据样本之间关系的过程。关联是指在两个或多个变量之间存在某种规律性，但关联并不一定意味着因果关系。 关联规则是寻找在同一事件中出现的不同项目的相关性，关联分析是挖掘关联规则的过程。比如在一次购买活动中所买不同商品的相关性。

数据挖掘实战（5）——关联规则（美国国会投票数据集）

m0_46275020的博客

08-15

3604

Support（支持度）：表示某个项集出现的频率，也就是包含该项集的交易数与总交易数的比例。例如P(A)表示项集A的比例，P(A\cap B)P(A∩B)表示项集A和项集B同时出现的比例。 Confidence（置信度）：表示当A项出现时B项同时出现的频率，记作{A→B}。换言之，置信度指同时包含A项和B项的交易数与包含A项的交易数之比。公式表达：{A→B}的置信度=P(A|B)=P(A\cap B) / P(BP(A∣B)=P(A∩B)/P(B Lift（提升度）：指A项和B项一同出现的频率，但同时要考

【数据挖掘】关联规则挖掘

qq_45957458的博客

11-21

3323

关联规则挖掘，FP树，Apriori算法，支持度，置信度和提升度

MATLAB数据挖掘实验笔记：Apriori关联规则挖掘算法实现及应用

qq_33994286的博客

04-17

3256

关联分析用于发现海量数据中项集之间有趣的关联关系或相关关系。假设下图是某超市统计的顾客最常同时购买的商品集合那么其中的关联关系用关联规则表示：[牛奶->面包]通过以上实验我们可以得知置信度的增大只对生产的强关联规则有影响，不影响最大频繁项集。而支持度的增大则会对两者都产生影响。这一现象是由于Apriori算法运行的原理：以最小支持度来筛选频繁项集，再根据最小置信度从频繁项集中选择出强关联规则。因此，当变动仅限于最小置信度时，并不会影响频繁项集的选择；

数据挖掘之关联规则：Apriori, FP-growth

sylviiiiiia的博客

03-21

1195

“啤酒和尿布的荣誉”

Python Pandas多列合并成一长列(扁平化)

视觉算法小趴菜的博客

11-29

408

本文介绍了Pandas中三种数据扁平化方法：melt()按变量名和值两列重组数据，concat()垂直拼接多列，stack()将多列转为单列。测试数据显示melt()保留原列名信息，concat()和stack()仅保留数值。三种方法各有特点，适用于不同的数据扁平化需求。

人工智能领域博客

11-28

1845

摘要：本文详细解释了Spark Driver端与Worker端在OSS认证上的核心区别。Driver端通过Spark配置自动认证，而Worker端（独立Python进程）需显式提供认证信息。认证来源优先级为：1)Driver传递参数，2)环境变量，3)IAM角色。文章分析了架构差异导致的不同认证方式，并推荐从Driver传递认证信息的解决方案。当前实现已采用该方案，通过Spark配置或环境变量获取认证后传递给Worker进程，确保PyArrow能正确访问OSS数据。

【Android逆向工程】第8章：Frida 高级应用：函数追踪与 RPC 调用

w987333120的博客

12-01

307

本文介绍了Frida框架的核心功能与应用技巧，包括函数调用栈追踪、RPC机制、批量Hook、内存操作和脚本模块化等关键技术。重点讲解了Thread.backtrace()和DebugSymbol.fromAddress()的用法，提供Java和Native函数的调用栈追踪示例，并展示了调用栈过滤与分析方法。最后通过实战案例演示登录流程追踪和RPC调用，同时给出常见问题解决方案。这些技术可有效提升逆向分析效率，适用于移动应用安全测试场景。

python中快速更新ini文件之方法~

最新发布

英布之剑的优快云 Blog

12-02

Python标准库中的configparser模块可方便读写INI格式配置文件。通过ConfigParser()创建对象，使用read()读取文件，set()修改键值，write()保存更改。示例代码展示了更新INI文件的完整流程：创建解析器、读取文件、修改指定分组下的键值、保存修改并清理对象。使用前需导入configparser模块。该方法简单高效，适用于处理标准INI格式的配置文件。

遗留Python包中的漏洞代码可通过域名劫持攻击Python包索引

FreeBuf_的博客

11-28

454

遗留Python包漏洞可致供应链攻击，域名劫持风险威胁PyPI生态。

Python抓取ZLibrary元数据实战指南

yiruo250的博客

11-29

539

本文介绍使用Python抓取ZLibrary电子书元数据的技术方案。首先说明准备工作，包括Python环境配置、网页结构分析和反爬策略。详细讲解两种抓取方法：静态页面使用requests+BeautifulSoup解析，动态内容通过Selenium模拟浏览器操作。提供数据存储示例（CSV/JSON格式）和清洗技巧，并介绍异步抓取、Scrapy框架等高级优化方案。特别强调法律合规性，包括遵守robots.txt、控制请求频率及版权注意事项。附完整代码示例链接，为电子书数据分析提供技术参考。

Java学习之旅第三季-27：模块系统（一）

摸鱼的老谭

11-29

935

Java模块系统自Java 9引入，通过module-info.java文件定义模块名称、依赖关系和导出包，实现依赖管理、JRE精简和访问控制。模块分为标准模块和非标准模块，前者由JCP管理，后者为JDK特有。创建模块化项目时，需在src/main/java下添加module-info.java文件，使用requires声明依赖、exports控制包可见性。模块命名建议采用反向域名格式，与包名保持一致但无强制要求。模块系统提升了代码组织性、安全性和开发效率。

python轮子：适配requests.request的aiohttp异步请求

云霄IT的博客

12-01

153

【代码】python轮子：适配requests.request的aiohttp异步请求。

检查cuda是否安装成功

easyboot的专栏

11-28

127

cuda安装完成后输入nvcc --version查看cuda是否安装成功。在cmd命令窗口中输入nvidia-smi查看需要安装的CUDA版本。