- 博客(8)
- 资源 (2)
- 收藏
- 关注

原创 AMS算法 大数据实验4
AMS算法实验要求:使用自己所擅长的程序语言编写AMS算法(估计数据流元素的二阶矩)。假设所有元素为1-n,mi表示元素i的出现次数(在整个文件中的出现次数),则二阶矩等于(m1)2+(m2)2+(m3)2+…+(mn)2。实验步骤:1:以stream_for_ams.txt文件为自己所写程序的输入,读取文件中数据(数值范围是1-105);2:请编写一个精确算法A,来计算整个文件stream_for_ams.txt中所有数据的二阶矩的真实值(179866);3:假设文件中的数据为e1,e2,e3
2021-05-30 20:32:25
1734
6
原创 shardingSphereJDBC+dynamic+mysql+sqlserver+mybatis-plus按月分库分表的最强解决方案
本文主要介绍了在进行SQL server进行分库分表的时候遇到的问题
2024-01-11 16:38:01
2597
2
原创 解决因为盗版idea软件卸载不彻底,下载正版软件后双击打不开的问题。
出现报错: “result” with message agent load/premain call failed at ./src/java.instrument/share/native/libinstrument/JPLISAgent.c line: 4221.找到idea.bat这个文件找到idea安装根目录bin下,选中idea.bat右键编辑,或者使用txt打开2.在idea.bat最后一行添加 pause 打印报错信息3.建议用everythingfind的工具找到:vmopt
2022-03-05 18:47:28
2786
3
原创 bloom布隆过滤器 大数据算法 实验五
实验要求:使用自己所擅长的程序语言编写布隆过滤算法(近似判断一个查询数据是否属于集合S)。实验步骤:1:以stream_for_bm.txt文件的内容做为集合S的元素(元素为1-107)(共104个元素),构建一个比特数组将S的元素存储下来2:读取stream_for_query.txt文件中的内容,对于每个数据判断其是否属于集合S;3:精确算法,使用一个数组记录下S中的内容,然后对于每一个查询元素(stream_for_query.txt中的内容),判断其是否属于S;4:设计并实现书上107页
2021-05-31 19:41:38
400
1
原创 loglog算法 大数据实验三
建议和fm算法做对比算法步骤1:将M [1],M [2],…M [m]初始化为0;2:对于从文件“ stream_for_fm.txt”中读取的每个元素x,请执行以下3-6:3:令H(X)表示的元素X的散列值(二进制形式)h(x)的哈希参数是随机的,设p(y)为第一1比特的从右侧的秩y中(例如,如果y = 1100则p( y)= 3,如果y = 1111,则p(y)= 1);4:设置j = h(x)%m +1; // *将h(x)处理为整数,然后获取存储区ID * //5:设置w = floor
2021-05-30 21:14:20
477
2
原创 FM算法 大数据实验三
实验三 fm算法1:以stream_for_fm.txt文件为自己所写程序的输入,读取文件中数据(数值范围是1-225);2:请编写一个精确算法,来计算整个文件stream_for_fm.txt中有多少个不同的元素(number of unique elements);[可以通过有序链表来实现,共有106862个不同元素];3:使用哈希函数:h(x) = a*x + b, 其中a,b为从整数1–225+1中随机选取的两个整数,x为stream_for_fm.txt文件中的一个数,则此时对于元素x来说
2021-05-30 21:09:56
426
原创 水库采样算法 大数据实验二
水库采样算法1:以stream.txt文件为自己所写程序的输入,读取文件中数据,设为e1,e2,…,en,……(假设每秒到达一个数据);2:设定样本集合大小为s(该参数为程序输入参数),要求在任意t大于等于s的时刻维持一个采样集合S,要求对于已经看到过的元素e1,e2,…,et中的每个元素都以相同的概率被选进集合S。3:计算采样集合在所有数据读取完毕后的均值,计算过程如下:假设S={f1,f2,…,fs},那么均值等于(f1+f2+…fs)/s;4:精确计算整个数据流中元素的均值,计算过程为如下:
2021-05-30 21:08:23
796
原创 DGIM 算法 大数据实验一
DGIM algorithm1:以01stream.txt文件为自己所写程序的输入,读取中文件中的01数据流;2:设定窗口大小1000,以不超过50%的相对误差回答任意时刻,当前窗口中有多少个1-bit;3:设定窗口大小2000,以不超过10%的相对误差回答任意时刻,当前窗口中有多少个1-bit;4:编写一个精确计算当前窗口中1-bit个数的精确程序,比较精确程序在运行时间和空间和DGIM算法的差异。import timebucket_n = [] # 桶的列表#计算实际比特数 和 运行
2021-05-30 21:06:49
491
yunjilianjdbc.zip
2020-07-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人