关联

本文介绍了Apriori算法,这是一种用于发现频繁项集的开创性算法。它利用了频繁项集属性的先验知识,通过逐层搜索的方式,从1项集开始逐步构建更高阶的频繁项集。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Apriori算法是R.Agrawal和R.Srikant于1994年提出的为布尔关联规则挖掘频繁项集的原创性质算法。正如我们将看到的,算法的名字基于这样的事实:算法使用频繁项集性质的先验性质。Apriori使用一种称作逐层搜索的迭代方法,k项集用于探索(k+1)项集。首先,通过扫描数据库,累积每个项的计数,并收集满足最小支持度的项,找出频繁1项集的集合。该集合记作L1。然后L1用于找频繁2项集的集合L2,L2用于找L3,如此下去,知道不能在找到频繁项集k项集。找每个Lk需要一次数据库全扫描。

图1







代码

#include "stdafx.h"
#include<iostream>
#include<fstream>
#include<vector>
#include<string>
#include<map>
using namespace std;
typedef struct Item//只有一个词的频繁项
{
	string sItem;
	int iSupport;
}ITEM;
typedef vector<string> VEC_STR;
typedef vector<VEC_STR> VEC_VEC_STR;

typedef struct MultiItem//高层的频繁项
{
	VEC_STR vsItem;
	int iSupport;
}MULTIITEM;

typedef vector<ITEM> VEC_ITEM;//只有一个词的频繁项集合
typedef vector<MULTIITEM> VEC_MULTIITEM;//高层的频繁项集合
typedef map<string, int> MAP_STR_INT;//存储词语及其出现频率

void readFile(ifstream &, const string &, VEC_STR &);
void countWord(VEC_STR *, MAP_STR_INT &, const char separator='\\');
void generateLevel1Set(MAP_STR_INT *, VEC_ITEM &);
void generateLevel2(VEC_ITEM *, VEC_MULTIITEM &);
void cycGenerator(VEC_MULTIITEM *, VEC_STR &, ofstream &);
void generateHighLevelSet(VEC_MULTIITEM *, VEC_MULTIITEM &, VEC_STR &);
void generateInitialHigh(VEC_MULTIITEM *, VEC_VEC_STR &);
void pruning(VEC_VEC_STR *, VEC_MULTIITEM *, VEC_MULTIITEM &);
bool find(VEC_MULTIITEM *, VEC_STR *);
void countSupport(VEC_STR *, VEC_MULTIITEM &);
void generateFrequentSet(VEC_MULTIITEM *, VEC_MULTIITEM &);
void printFrequentSet(VEC_ITEM *, ostream &os=cout);
void printFrequentSet(VEC_MULTIITEM *, ostream &os=cout);

const int MINSUPPORT = 2;//最小支持度
int main()
{
	//从源文件读取数据
	ifstream infile;
	VEC_STR vs_word;
	readFile(infile,"input.txt",vs_word);
	infile.close();
	
	//计算所有词语的出现频率
	MAP_STR_INT word_count;
	countWord(&vs_word, word_count);
	
	//生成单个词语的频繁项集合
	VEC_ITEM level1Set;
	generateLevel1Set(&word_count, level1Set);
	
	//生成具有两个词语的频繁项集合
	VEC_MULTIITEM level2, level2Set;
	generateLevel2(&level1Set, level2);
	countSupport(&vs_word, level2);
	generateFrequentSet(&level2, level2Set);

	//生成具有三个词语的频繁项集合
	VEC_MULTIITEM level3Set;
	generateHighLevelSet(&level2Set, level3Set, vs_word);
	
	//输出单个词的频繁项到文件
	ofstream outfile;
	outfile.open("out.txt");
	if(!outfile)
		cout<<"不能打开文件!"<<endl;
	printFrequentSet(&level1Set, outfile);
	
	//循环产生高层的频繁项集合并输出到文件
	cycGenerator(&level2Set, vs_word, outfile);

	cout<<"OK!"<<endl;
	return 0;
}

/**从源文件读取词语
*每一行作为一个字符串存入向量中
*/
void readFile(ifstream &infile, const string &filename, VEC_STR &vs_word)
{
	infile.close();
	infile.clear();
	
	infile.open(filename.c_str()); 
	if(!infile)
		cout<<"Unable to open this file!"<<endl;

	string word;
	while(getline(infile, word))
		vs_word.push_back(word);		
}

/**计算每个词语的支持度
*从字符串中提取出所有词语,与其支持度一道存入map中
*/
void countWord(VEC_STR *vs_word, MAP_STR_INT &word_count, const char separator)
{
	string sentence,word;
	for(unsigned int i=0; i<vs_word->size(); ++i)
	{
		sentence = (*vs_word)[i];
		while(sentence.find(separator)!=-1)
		{
			word = sentence.substr(0,sentence.find(separator));
			++word_count[word];
			sentence = sentence.substr(sentence.find(separator)+1, sentence.size()-1);
		}
		++word_count[sentence];
	}
}

/**找出频繁1项集的集合
*/
void generateLevel1Set(MAP_STR_INT *pWord_Count, VEC_ITEM &level1Set)
{
	ITEM item;
	MAP_STR_INT::const_iterator map_it = pWord_Count->begin();
	while(map_it != pWord_Count->end())
	{
		if(map_it->second >= MINSUPPORT)
		{
			item.sItem = map_it->first;
			item.iSupport = map_it->second;
			level1Set.push_back(item);
		}
		++map_it;
	}
}

/**由频繁1项集生成初始2项集
*/
void generateLevel2(VEC_ITEM *pLevel1Set, VEC_MULTIITEM &initialLevel2)
{
	VEC_STR vsTemp;
	MULTIITEM multiTemp;
	unsigned int level1SetSize = pLevel1Set->size();
	for(unsigned int i=0; i<level1SetSize-1; ++i)
	{
		vsTemp.push_back((*pLevel1Set)[i].sItem);
		for(unsigned int j=i+1; j<level1SetSize; ++j)
		{
			vsTemp.push_back((*pLevel1Set)[j].sItem);
			multiTemp.vsItem = vsTemp;
			multiTemp.iSupport = 0;
			initialLevel2.push_back(multiTemp);

			vsTemp.pop_back();
		}
		vsTemp.clear();
	}
}

/**循环产生频繁项集合并输出
*/
void cycGenerator(VEC_MULTIITEM *pLowLevelSet, VEC_STR &vs_word, ofstream &os)
{
	VEC_MULTIITEM highLevelSet, setTemp;
	printFrequentSet(pLowLevelSet, os);
	while(pLowLevelSet->size() != 0)
	{
		setTemp.clear();
		generateHighLevelSet(pLowLevelSet, setTemp, vs_word);
		highLevelSet = setTemp;
		printFrequentSet(&highLevelSet, os);
		pLowLevelSet = &highLevelSet;
	}
}


/**由低层的频繁项集生成高层的频繁项集合
*/
void generateHighLevelSet(VEC_MULTIITEM *pLowLevelSet, VEC_MULTIITEM &highLevelSet, VEC_STR &vs_word)
{
	VEC_VEC_STR vvsTemp;
	VEC_MULTIITEM vmiTemp;

	generateInitialHigh(pLowLevelSet, vvsTemp);
	pruning(&vvsTemp, pLowLevelSet, vmiTemp);
	countSupport(&vs_word, vmiTemp);
	generateFrequentSet(&vmiTemp, highLevelSet);

}

/**从低层的频繁项集生成初始的高层项集合
*/
void generateInitialHigh(VEC_MULTIITEM *pLowLevelSet, VEC_VEC_STR &highLevelSet)
{
	VEC_STR vsTemp;

	unsigned int level1SetSize = pLowLevelSet->size();
	for(unsigned int i=0; i<level1SetSize-1; ++i)
		for(unsigned int j=i+1; j<level1SetSize; ++j)
		{
			unsigned int k = 0;
			for(; k<(*pLowLevelSet)[i].vsItem.size()-1; ++k)
			{
				if((*pLowLevelSet)[i].vsItem[k] == (*pLowLevelSet)[j].vsItem[k])
					vsTemp.push_back((*pLowLevelSet)[i].vsItem[k]);
				else
					break;
			}
			if(k == (*pLowLevelSet)[i].vsItem.size()-1)
			{
				vsTemp.push_back((*pLowLevelSet)[i].vsItem[k]);
				vsTemp.push_back((*pLowLevelSet)[j].vsItem[k]);
				highLevelSet.push_back(vsTemp);
			}
			vsTemp.clear();

		}

}

/**剪枝步
*/
void pruning(VEC_VEC_STR *pInitialSet, VEC_MULTIITEM *pLowLevelSet, VEC_MULTIITEM &prunedSet)
{
	VEC_STR vsTemp;
	MULTIITEM miTemp;
	for(unsigned int i=0; i<pInitialSet->size(); ++i)
	{
		unsigned int j = 0;
		unsigned int sizeI = (*pInitialSet)[i].size();
		for(; j<sizeI; ++j)
		{
			for(unsigned int k=0; k<sizeI; ++k)
				if(k!=j)
					vsTemp.push_back((*pInitialSet)[i][k]);

			if(!find(pLowLevelSet, &vsTemp))
				break;
		}
		if(j==sizeI)
		{
			miTemp.vsItem = (*pInitialSet)[i];
			miTemp.iSupport = 0;
			prunedSet.push_back(miTemp);
		}
		vsTemp.clear();
	}

}

/**在低层的频繁项集中查询高层的初始频繁项的所有子集的函数
*/
bool find(VEC_MULTIITEM *pLowSet, VEC_STR *pSubSet)
{
	for(unsigned int i=0; i<pLowSet->size(); ++i)
	{
		unsigned int j = 0;
		unsigned int sizeI = (*pLowSet)[i].vsItem.size();
		for(; j<sizeI; ++j)
			if((*pLowSet)[i].vsItem[j] != (*pSubSet)[j])
				break;
		if(j==sizeI)
			return true;
	}
	return false;
}

/**计算生成的初始频繁项集中各项的支持度
*/
void countSupport(VEC_STR *pVs_Word, VEC_MULTIITEM &initialSet)
{
	int flag;
	for(unsigned int i=0; i<pVs_Word->size(); ++i)
		for(unsigned int j=0; j<initialSet.size(); ++j)
		{
			flag =1;
			for(unsigned int k=0; k<initialSet[j].vsItem.size(); ++k)
			{
				if((*pVs_Word)[i].find(initialSet[j].vsItem[k], 0) == -1)
				{
					flag = 0;
					break;
				}
			}
			if(flag ==1)
				++initialSet[j].iSupport;
		}
}

/**从初始项集合中提取出频繁项集合
*/
void generateFrequentSet(VEC_MULTIITEM *pInitialSet, VEC_MULTIITEM &frequentSet)
{
	for(unsigned int i=0; i<pInitialSet->size(); ++i)
	{
		if((*pInitialSet)[i].iSupport >= MINSUPPORT)
		{
			frequentSet.push_back((*pInitialSet)[i]);
		}
	}
}

/**打印一项频繁集合
*/
void printFrequentSet(VEC_ITEM *pLevel1Set, ostream &os)
{
	//os<<"频繁项";
	//os<<"支持度\n"<<endl;
	for(unsigned int i=0; i<pLevel1Set->size(); ++i)
	{
		os<<(*pLevel1Set)[i].sItem<<":\t"<<(*pLevel1Set)[i].iSupport<<endl;
	}
	os<<endl;

}

/**打印高层频繁项集合
*/
void printFrequentSet(VEC_MULTIITEM *pFrequentSet, ostream &os)
{
	for(unsigned int i=0; i<pFrequentSet->size(); ++i)
	{
		unsigned int j=0;
		for(; j<(*pFrequentSet)[i].vsItem.size()-1; ++j)
			os<<(*pFrequentSet)[i].vsItem[j]<<"&";
		
		os<<(*pFrequentSet)[i].vsItem[j]<<":\t"<<(*pFrequentSet)[i].iSupport<<endl;
	}
	os<<endl;
}


Apriori算法

【基于QT的调色板】是一个使用Qt框架开发的色彩选择工具,类似于Windows操作系统中常见的颜色选取器。Qt是一个跨平台的应用程序开发框架,广泛应用于桌面、移动和嵌入式设备,支持C++和QML语言。这个调色板功能提供了横竖两种渐变模式,用户可以方便地选取所需的颜色值。 在Qt中,调色板(QPalette)是一个关键的类,用于管理应用程序的视觉样式。QPalette包含了一系列的颜色角色,如背景色、前景色、文本色、高亮色等,这些颜色可以根据用户的系统设置或应用程序的需求进行定制。通过自定义QPalette,开发者可以创建具有独特视觉风格的应用程序。 该调色板功能可能使用了QColorDialog,这是一个标准的Qt对话框,允许用户选择颜色。QColorDialog提供了一种简单的方式来获取用户的颜色选择,通常包括一个调色板界面,用户可以通过滑动或点击来选择RGB、HSV或其他色彩模型中的颜色。 横渐变取色可能通过QGradient实现,QGradient允许开发者创建线性或径向的色彩渐变。线性渐变(QLinearGradient)沿直线从一个点到另一个点过渡颜色,而径向渐变(QRadialGradient)则以圆心为中心向外扩散颜色。在调色板中,用户可能可以通过滑动条或鼠标拖动来改变渐变的位置,从而选取不同位置的颜色。 竖渐变取色则可能是通过调整QGradient的方向来实现的,将原本水平的渐变方向改为垂直。这种设计可以提供另一种方式来探索颜色空间,使得选取颜色更为直观和便捷。 在【colorpanelhsb】这个文件名中,我们可以推测这是与HSB(色相、饱和度、亮度)色彩模型相关的代码或资源。HSB模型是另一种常见且直观的颜色表示方式,与RGB或CMYK模型不同,它以人的感知为基础,更容易理解。在这个调色板中,用户可能可以通过调整H、S、B三个参数来选取所需的颜色。 基于QT的调色板是一个利用Qt框架和其提供的色彩管理工具,如QPalette、QColorDialog、QGradient等,构建的交互式颜色选择组件。它不仅提供了横竖渐变的色彩选取方式,还可能支持HSB色彩模型,使得用户在开发图形用户界面时能更加灵活和精准地控制色彩。
标题基于Spring Boot的二手物品交易网站系统研究AI更换标题第1章引言阐述基于Spring Boot开发二手物品交易网站的研究背景、意义、现状及本文方法与创新点。1.1研究背景与意义介绍二手物品交易的市场需求和Spring Boot技术的适用性。1.2国内外研究现状概述当前二手物品交易网站的发展现状和趋势。1.3论文方法与创新点说明本文采用的研究方法和在系统设计中的创新之处。第2章相关理论与技术介绍开发二手物品交易网站所涉及的相关理论和关键技术。2.1Spring Boot框架解释Spring Boot的核心概念和主要特性。2.2数据库技术讨论适用的数据库技术及其在系统中的角色。2.3前端技术阐述与后端配合的前端技术及其在系统中的应用。第3章系统需求分析详细分析二手物品交易网站系统的功能需求和性能需求。3.1功能需求列举系统应实现的主要功能模块。3.2性能需求明确系统应满足的性能指标和安全性要求。第4章系统设计与实现具体描述基于Spring Boot的二手物品交易网站系统的设计和实现过程。4.1系统架构设计给出系统的整体架构设计和各模块间的交互方式。4.2数据库设计详细阐述数据库的结构设计和数据操作流程。4.3界面设计与实现介绍系统的界面设计和用户交互的实现细节。第5章系统测试与优化说明对系统进行测试的方法和性能优化的措施。5.1测试方法与步骤测试环境的搭建、测试数据的准备及测试流程。5.2测试结果分析对测试结果进行详细分析,验证系统是否满足需求。5.3性能优化措施提出针对系统性能瓶颈的优化建议和实施方案。第6章结论与展望总结研究成果,并展望未来可能的研究方向和改进空间。6.1研究结论概括本文基于Spring Boot开发二手物品交易网站的主要发现和成果。6.2展望与改进讨论未来可能的系统改进方向和新的功能拓展。
1. 用户与权限管理模块 角色管理: 学生:查看个人住宿信息、提交报修申请、查看卫生检查结果、请假外出登记 宿管人员:分配宿舍床位、处理报修申请、记录卫生检查结果、登记晚归情况 管理员:维护楼栋与房间信息、管理用户账号、统计住宿数据、发布宿舍通知 用户操作: 登录认证:对接学校统一身份认证(模拟实现,用学号 / 工号作为账号),支持密码重置 信息管理:学生完善个人信息(院系、专业、联系电话),管理员维护所有用户信息 权限控制:不同角色仅可见对应功能(如学生无法修改床位分配信息) 2. 宿舍信息管理模块 楼栋与房间管理: 楼栋信息:名称(如 "1 号宿舍楼")、层数、性别限制(男 / 女 / 混合)、管理员(宿管) 房间信息:房间号(如 "101")、户型(4 人间 / 6 人间)、床位数量、已住人数、可用状态 设施信息:记录房间内设施(如空调、热水器、桌椅)的配置与完好状态 床位管理: 床位编号:为每个床位设置唯一编号(如 "101-1" 表示 101 房间 1 号床) 状态标记:标记床位为 "空闲 / 已分配 / 维修中",支持批量查询空闲床位 历史记录:保存床位的分配变更记录(如从学生 A 调换到学生 B 的时间与原因) 3. 住宿分配与调整模块 住宿分配: 新生分配:管理员导入新生名单后,宿管可按专业集中、性别匹配等规则批量分配床位 手动分配:针对转专业、复学学生,宿管手动指定空闲床位并记录分配时间 分配结果公示:学生登录后可查看自己的宿舍信息(楼栋、房间号、床位号、室友列表) 调整管理: 调宿申请:学生提交调宿原因(如室友矛盾、身体原因),选择意向宿舍(需有空位) 审批流程:宿管审核申请,通过后执行床位调换,更新双方住宿信息 换宿记录:保存调宿历史(申请人、原床位、新床位、审批人、时间) 4. 报修与安全管理模块 报修管理: 报修提交:学生选择宿舍、设施类型(如 "
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值