- 博客(70)
- 收藏
- 关注
原创 《数据仓库与数据挖掘》自测
1. 数据仓库的主要特征不包括以下哪一项?A. 数据量大B. 异构数据整合C. 事务处理D. 支持决策分析2. OLAP的核心功能是:A. 事务处理B. 多维数据分析C. 数据清洗D. 数据转换3. 以下哪个不是元数据的分类?A. 数据源元数据B. 数据模型元数据C. 数据仓库映射元数据D. 数据备份元数据4. 数据挖掘中的KDD指的是:A. 数据清洗B. 知识发现C. 知识库设计D. 知识库查询5. 决策树算法中,用于评估属性分割优劣的指标是:A. 基尼不纯度。
2024-07-01 14:40:42
1167
1
原创 《计算机英语》 Unit 7 The Internet of Things 物联网(仅生词)
《计算机英语》 Unit 7 The Internet of Things 物联网(仅生词)
2024-06-22 21:33:31
627
原创 《计算机英语》 Unit 4 Information Management 信息管理
《计算机英语》 Unit 4 Information Management 信息管理
2024-06-22 18:32:58
1299
原创 《计算机英语》 Unit 3 Software Engineering 软件工程
《计算机英语》 Unit 3 Software Engineering 软件工程
2024-06-22 16:46:57
1746
2
原创 《计算机英语》Unit 2 Operating System and Computer Architecture 操作系统和计算机构造
《计算机英语》Unit2 Operating System and Computer Architecture 操作系统和计算机构造
2024-06-22 11:56:28
1226
原创 Hadoop+Spark大数据技术(自命题试卷测试)
1. Hadoop 核心组件包括:A. HDFS 和 HiveB. HDFS 和 MapReduceC. HBase 和 SparkD. YARN 和 ZooKeeper2. HDFS 数据块存储方式的优势不包括:A. 文件大小不受单一磁盘大小限制B. 简化存储过程C. 提高数据访问速度D. 提高数据容错能力3. NameNode 的主要功能是:A. 存储数据块B. 处理数据读写请求C. 管理文件系统命名空间和元数据D. 备份 NameNode 的元数据。
2024-06-18 21:36:33
2303
2
原创 第六章 图论与网络分析 (重点,熟练掌握三算法) 树图和图的最小部分树 最短路问题 网络的最大流
2.考虑所有指向标号点 i 的弧 (h ,i ) (即反向弧) ,如果有 fhi=0,对 h 不标号, 若 fhi>0,则对 h 点标号,记为(i , ε( h )),其中ε( h ) = min{ε( i ) , fhi)}.3. 从已标号的点出发,找出与这些点相邻的所有未标号点 p ,若有 Lsp =min { Lss+ dsp , Lsr+ drp },则对 p 点标号,并将 Lsp 的值标注在 p 点旁的小方框内;所有指向为 s→t 的弧(称前向弧,记作μ+),存在f < c (非饱和);
2024-06-12 17:54:46
1254
原创 第四章整数规划与分配问题 分配问题与匈牙利法(熟练)
第一步:找出效率矩阵每行的最小元素,并分别从每行中减去。第二步:找出矩阵每列的最小元素,分别从各列中减去。第三步:确定能否找出 m 个位于不同行不同列的零元素的集合 (m:行列数)圈0划行列 (先行后列)看行,有0打上( )并划去该列看列,有0打上( )并划去该行若该行没有零元素或者有两个以上零元素 (已划去的不算在内) 则转下一行,依次进行到最后一行第四步:若打括号的零元素少于 m ,这时转入第四步。进行如下变换1. 从矩阵未被直线覆盖的数字中找出一个最小的k;
2024-06-12 17:46:50
817
原创 第三章 运输问题 产销平衡 表上作业法 应用
考虑次小运费,这就有差额,差额越大,说明不能按最小运费调运时,运费增加得越多。3、若有检验数为负,从该负值出发找闭回路调整运量 (若有多个负值检验数,从绝对值最大的出发)如果所有代表非基变量的空格的检验数都大于等于0,则已求得最优解;否则继续改进找出最优解。若在划去时出现产销相等 在划去行列的同时任选行列中的数据格添0 (保证m+n-1)2、调整调运量:+-+-形成闭回路的顶点的原数字得原空格处检验数。产量-销量得新产销量,将找到的最小元素改为尽可能大的值。其相对应的调运量的值即为基变量的值。
2024-06-12 17:31:57
1051
原创 第二章 线性规划的对偶理论对偶问题
由原问题的约束条件符号得到对偶问题的变量符号(符号不一致) 由原问题的变量符号得到对偶问题的约束条件符号(符号一致)变量值:变量值b变为目标函数系数值C的转置 b变CT。系数值c变为约束中变量值b的转置 CX变为bTY。变量:x变y(转置a有几行就有几个y),均为≥0。变量系数:a变为转置a(一列变一行) a变aT。目标函数 max Z变min W。约束条件看变量符号(相同)变量符号看约束条件(取反)约束 AX变为ATY。无约束和=总是互换的。
2024-06-12 17:23:31
852
原创 第一章 线性规划及单纯形法 图解法 单纯形法 大m法 看案例(综合题)
描述:实际问题中有些模型并不含有单位矩阵,为了得到一组基向量和初基可行解,在约束条件的等式左端加一组虚拟变量,得到一组基变量。基:在矩阵(A)中选择(m)个列((m)是方程的数量),使得这(m)个列构成的矩阵是满秩的,即这些列向量线性无关。基解:对于给定的一个基,将非基变量设为零,解出基变量的值,得到的解称为基解。M为无限大的正数,这是一个惩罚项,倘若人工变量不为零,则目标函数就永远达不到最优,所以必须将人工变量逐步从基变量中替换出去。检验数:不用算可能换出基变量的检验数,均为0,不用写在表中。
2024-06-12 17:15:54
1158
原创 数据仓库与数据挖掘实验练习题
1. 使用超级英雄列表来填充一个新的 Series 对象。2. 使用力量元组来填充一个新的 Series 对象。3. 创建一个 Series,将超级英雄作为索引标签,力量等级作为值。将这个 Series 赋值给 heroes 变量。4. 提取 heroes Series 的前两行。5. 提取 heroes Series 的最后四行。6. 确定 heroes Series 中唯一值的个数。7. 计算 heroes 中超级英雄的平均力量。8. 计算 heroes 中的最大和最小力量。
2024-06-12 10:13:06
1312
原创 数据仓库与数据挖掘总复习练习2-3(实验六 2024.6.5)
cities中index:数值,data:地名。(index中值最好不要重复,避免计算错误)一列作为index,一列作为数据。
2024-06-05 10:39:26
406
原创 Hadoop+Spark大数据技术 实验8 Spark SQL结构化
示例: gradedf.selectExpr("name", "name as names" ,"upper(Name)","Scala * 10").show(3)- 示例: gradedf.select("Name", "Class","Scala").show(3,false)修改名称:gradedf.select(gradedf("Name").as("name")).show()orderBy() 和 sort() 方法都可以用于对 DataFrame 进行排序,它们的功能相同。
2024-05-21 10:00:24
1389
1
原创 数据仓库与数据挖掘实验练习4-5(实验三2024.5.15)
axis=1axis=01.sort_values()函数:用于根据DataFrame的一列或多列的值进行排序。2.sort_index()函数:用于根据DataFrame的索引标签进行排序。3.set_index()函数:用于将DataFrame的某一列设置为索引。4.pd.read_csv()函数:用于读取CSV文件,并将其转换为DataFrame。
2024-05-15 11:59:16
977
原创 Hadoop+Spark大数据技术 第6次作业 Spark简介与RDD编程
Hadoop+Spark大数据技术(微课版)曾国荪、曹洁版 第六章 第6次作业 Spark简介与RDD编程
2024-05-11 21:29:24
1144
3
原创 Hadoop+Spark大数据技术 第七章 Spark RDD编程2(实验)
Hadoop+Spark大数据技术(微课版)曾国荪、曹洁版 第六章 Spark RDD编程及相关实验
2024-05-07 10:13:33
772
原创 Hadoop+Spark大数据技术 第七章 Spark RDD编程1(实验)
注意:需要先在hadoop分布式文件系统中创建文件1.先在本地文件系统创建data.txt文件2.启动hadoop分布式文件系统3.上传本地文件data.txt到hadoop分布式文件系统查看分布式文件系统中是否存在data.txt。
2024-04-30 10:06:34
700
3
原创 Hadoop+Spark大数据技术 第五次作业 第五章 Scala基础与编程
1. 面向对象:Scala是一种完全面向对象的语言。其每一种数据类型都是一个对象,这使得它具有非常统一的模型。2. 函数式编程:Scala同时支持函数式编程,它拥有高阶函数、闭包、不可变数据结构、递归等函数式编程的关键特性。3. 扩展性:Scala的语法非常灵活,允许开发者自定义运算符和语法糖。也支持模式匹配、类型推断和匿名函数等高级特性,这些都为编写简洁、高效的代码提供了可能。此外,Scala的语法允许在单个文件中定义类、对象、函数等,使得代码组织更加灵活。
2024-04-28 18:44:27
2966
3
原创 Hadoop+Spark大数据技术 第五章 Scala基础与编程
Hadoop+Spark大数据技术(微课版)曾国荪、曹洁版思维导图第五章 Scala基础与编程(未完待续。。。)
2024-04-16 22:27:43
1163
原创 Hadoop+Spark大数据技术 第四次作业 第四章 HBase分布式DB
Hadoop+Spark大数据技术(微课版)曾国荪、曹洁版思维导图第四次作业 (第4章 HBase分布式DB)
2024-04-14 21:36:06
1126
1
原创 Hadoop+Spark大数据技术 第四章 HBase分布式数据库
Hadoop+Spark大数据技术(微课版)曾国荪、曹洁版思维导图第四章 HBase分布式数据库
2024-04-10 12:47:35
1528
1
思维导图第三章 MapReduce分布式计算框架 (核心思想:“分而治之”)
2024-03-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人