- 博客(25)
- 问答 (9)
- 收藏
- 关注
原创 第8章 综合案例—构建DVD租赁商店数据仓库
案例背景结束:对于在线DVD租赁商店的决策者来说,他们需要从多个不同的商业角度观察数据,例如时间、电影、演员、用户等角度观察数据,并进行相关的分析得出决策,但是数据库中的数据不适合从多个角度进行分析,无法得出战略决策。然而,数据仓库支持复杂的分析操作,侧重于决策支持,并且还提供直观易懂的查询结果,因此我们需要基于数据库sakila创建一个DVD租赁商店数据仓库,并将sakila数据库中的数据加载到数据仓库中,便于在线DVD租赁商店的决策者对数据进行分析得出商业决策。数据下载:我们可以从MySQL的官网下
2022-11-29 18:36:41
584
原创 pyqt5 做个简易的汇率转化器
选用Line Edit 、Label和PushButton 为控件,在Edit选择水平布局。然后右键,选择External Tools中的QtDesigner。然后对保存的文件选择pyUIC,会自动生成python控件代码。在主函数中写入以下代码,通过此来调用窗口中。首先创建一个python工程demo。
2022-11-22 23:45:00
635
原创 python 等差素数列
2,3,5,7,11,13,…类似:7,37,67,97,127,1577,37,67,97,127,157 这样完全由素数组成的等差数列,叫等差素数数列。20042004 年,格林与华人陶哲轩合作证明了:存在任意长度的素数等差数列。这是数论领域一项惊人的成果!长度为 1010 的等差素数列,其公差最小值是多少?上边的数列公差为 3030,长度为 66。
2022-11-11 01:00:00
373
原创 python【蓝桥杯】跑步锻炼
小蓝跑步已经坚持了很长时间,从 20002000 年 11 月 11 日周六(含)到 20202020 年 1010 月 11 日周四(含)。请问这段时间小蓝总共跑步多少千米?正常情况下,小蓝每天跑 11 千米。如果某天是周一或者月初(11 日),为了激励自己,小蓝要跑 22 千米。如果同时是周一或月初,小蓝也是跑 22 千米。(好像蓝桥杯不允许使用外部库,所以我没用pandas中的date_range来创建日期序列)小蓝每天都锻炼身体。
2022-11-10 17:06:54
463
原创 python 蛇形填数【蓝桥杯】
容易看出矩阵第二行第二列中的数是 55。请你计算矩阵中第 2020 行第 2020 列的数是多少?如下图所示,小明用从 11 开始的正整数“蛇形”填充无限大的矩阵。第二中比较抽象(我想到的,但是花的时间比较长了)建议先做题前先把行号表上,第一种比较好想。第一种比较简单(但是我没想到)
2022-11-09 23:48:35
814
1
原创 python 蓝桥杯排序
请帮助小蓝找一个只包含小写英文字母且没有字母重复出现的字符串,对 该串的字符排序,正好需要 100100 次交换。如果可能找到多个,请告诉小蓝最短的那个。如果最短的仍然有多个,请告诉小蓝字典序最小的那个。小蓝找到了很多字符串试图排序,他恰巧碰到一个字符串,需要 100100 次交 换,可是他忘了吧这个字符串记下来,现在找不到了。例如,对于字符串 lanlan 排序,只需要 11 次交换。对于字符串 qiaoqiao 排序,总共需要 44 次交换。
2022-11-09 22:59:50
711
原创 7.2数据的批量加载
假设,现有一个CSV格式的微博用户信息文件weibo_user.csv,其中包含了用户id、用户名称、用户性别、用户简介等字段。使用Kettle工具,创建一个转换batch_load,并添加执行CSV文件输入控件、表输出控件以及Hop跳连接线。通过Kettle工具将文件weibo_user.csv中的数据批量加载到数据表weibo_user中。在目标表处写出想要输出的表名,然后点击获取字段,然后点击SQL。
2022-11-08 17:28:42
125
原创 7.1 数据的加载机制(全量加载+增量加载)
从技术角度来说,全量加载比增量加载的操作要简单很多,即只需要在数据加载之前,将目标数据表进行清空,再将源数据表中的数据全部加载到目标表中。通过Kettle工具将数据表full_source中的数据全量加载到数据表full_target中。
2022-11-08 16:25:47
707
原创 6.4 数据的商务规则计算
通过Kettle工具对数据表company_new中的数据进行商务规则的计算,即对数据表company_new中的数据进行相关处理和计算,从而得出手机在各省份的日销售额,并存储于数据表regional_sales中。使用Kettle工具,创建一个转换total,并添加表输入控件、字段选择控件、计算器控件、排序记录控件、分组控件、唯一行控件、表输出控件以及Hop跳连接线,具体如图所示。我们可以通过对数据表company_new中的数据处理和计算,得出总公司需要的各省份的手机日销售额。
2022-11-08 15:48:18
268
原创 6.2 不一致的数据转化
通过Kettle工具将对数据表company进行不一致数据的转换操作,即通过与供货商提供的标准价格表进行比较,得出不一致数据,从而进行修改,最终输出到数据表company中。4. 在字段选择处,选择获取字段,并将unitPrice改名成unitPrice1,然后移除id字段。3. 表输入2中需要在从步骤中插入数据处选择表输入,然后选择执行每一行。使用sql文件建立company和suppliers表格。会发现把那个品牌的价格统一了。
2022-11-08 15:22:15
150
原创 6.1 多数据源合并
假设,某公司旗下有两个子公司,分别为A公司和B公司,且这两个子公司均在销售手机,其中A公司的手机日销售情况存储在CSV文件中,即文件company_a.csv;通过Kettle工具将A公司和B公司的手机日销售数据合并到一个数据源(数据表company)中,也就是对文件company_a.csv和数据表company_b中的数据进行合并操作,并输出到数据表company中。需要事先在mysql中使用company_b.sql进行创建表,然后在表输入创建数据连接,然后获取SQL查询语句。
2022-11-08 15:21:34
404
原创 5.4数据检验
通过Kettle工具,使用弱一致性对数据表Personnel_Information中的数据进行一致性处理,即利用数据表Personnel_Information中的字段GENDER中的值训练出一个健康值预测模型,用于将原始数据中的字符串特征转化为模型可识别的数字特征。使用Kettle工具,创建一个转换data_validation,并添加“自定义常量数据”控件、“计算器”控件、“数据检验”控件、“空操作”控件以及Hop跳连接线。通过Kettle工具,对数据进行检验操作。
2022-11-06 22:32:18
211
原创 5.2去除重复数据 和5.3异常值处理
通过使用Kettle工具,创建一个转换fill_missing_value,并添加“文本文件输入”控件、“过滤记录”控件、“空操作(什么也不做)”控件、“替换NULL值”控件、“合并记录”控件、“字段选择”控件以及Hop跳连接线。1、通过使用Kettle工具,创建一个转换delete_missing_value,并添加“文本文件输入”控件、“字段选择”控件、“过滤记录”控件、“Excel输出”控件、“空操作(什么也不做)”控件以及Hop跳连接线。其实感觉并不需要去过滤记录可以直接替换啊很奇怪。
2022-11-06 22:05:48
888
原创 单词分析 python练习
输出两行,第一行包含一个英文字母,表示单词中出现得最多的字母是哪 个。如果有多个字母出现的次数相等,输出字典序最小的那个。现在,请你帮助小蓝,给了一个单词后,帮助他找到出现最多的字母和这 个字母出现的次数。第二行包含一个整数,表示出现得最多的那个字母在单词中出现的次数。对于所有的评测用例,输入的单词长度不超过 1000。输入一行包含一个单词,单词只由小写英文字母组成。最大运行内存: 256M。
2022-11-06 20:25:31
845
原创 5.1 数据去重
在唯一行处点击获取,可以把需要用来做比较的字段,一旦三个字段都相同就需要只保留其中之一。在csv文件输入界面将所需文件导入并点击获取字段,通过预览来确定是否将文件获取成功。通过Kettle工具,将文件people.txt中不完全重复的数据进行去重处理。通过Kettle工具,消除CSV文件merge.csv中完全重复的数据。分隔符将分号删掉,点击旁边的InsertTab,将头部去掉。在文本文件输入界面中将文件增添到选中的文件中。
2022-11-05 17:25:33
224
原创 4.2抽取Web数据
通过使用Kettle工具,创建一个转换转换xml_extract,并添加“Get data from XML”控件、“表输出”控件以及Hop跳连接线,具体如图所示。4.在Java代码界面双击“Code Snippits”→ “Common use”→ “Main”,添加Java脚本代码的主方法,即程序入口。单击“Java代码”控件中的“字段”选项卡,用于添加新生成的字段;单击“参数”选项卡,用于传入参数。在“Java代码”控件中的代码框编写抽取HTML网页数据的Java脚本代码。
2022-11-04 20:29:27
240
原创 试题 基础练习 字母图形 python
内存限制:256.0MB C/C++时间限制:1.0s Java时间限制:3.0s Python时间限制:5.0s。这是一个5行7列的图形,请找出这个图形的规律,并输出一个n行m列的图形。输入一行,包含两个整数n和m,分别表示你要输出的图形的行数的列数。输出n行,每个m个字符,为你的图形。
2022-11-03 22:33:16
100
原创 记录用SpringMVC框架编写一个简单的加减乘除计算器
这里问题不大,要注意的就是RequestMapping要有斜杠。这里配置欢迎页的时候出了问题,我希望他是在我设好的文件夹下的。但是配的时候找不准服务器是从什么路径开始搜索默认页。这里没什么问题就是配置了视图解析器、还有控制器罢了。用SpringMVC框架写一个计算器。配置SpringMVC.xml。经过试错之后发现是从。
2022-11-03 21:30:25
2319
1
原创 序列求和 直接print(sum(range(n+1)))最后会有一两个例子超时,可以选用等差求和
内存限制:256.0MB C/C++时间限制:1.0s Java时间限制:3.0s Python时间限制:5.0s。直接用sum或者用for来求和会超时,所以求和时记得观察是否是等差序列,是的话记得等差求和,养成习惯。输出一行,包括一个整数,表示1+2+3+…输入包括一个整数n。
2022-11-01 21:21:40
182
原创 杨辉三角 python
输出杨辉三角形的前n行。每一行从这一行的第一个数开始依次输出,中间使用一个空格分隔。请不要在前面输出多余的空格。杨辉三角形又称Pascal三角形,它的第i+1行是(a+b)i的展开式的系数。它的一个重要性质是:三角形中的每个数字等于它两肩上的数字相加。给出n,输出它的前n行。
2022-11-01 19:25:20
154
原创 特殊回文数 python
输入一个正整数n, 编程求所有这样的五位和六位十进制数,满足各位数字之和等于n。123321是一个非常特殊的数,它从左边读和从右边读是一样的。按从小到大的顺序输出满足条件的整数,每个整数占一行。输入一行,包含一个正整数n。
2022-11-01 14:44:58
388
原创 4.1 ETL将文本文件输出到数据库表中
通过Kettle工具抽取TSV文件tsv_extract.tsv中的数据保存至数据库extract中的数据表tsv中。在表输出处新建连接,然后再目标表中填入想创建的目标表名点击SQL然后执行,记得把指定数据库字段,然后获取字段。内容把分隔符改掉,这里是改成TAB,然后把头部去掉。首先还是把组件都弄好然后打开文本文件输入。字段选择获取字段,然后改个名。文本文件浏览之后记得点增加。
2022-10-31 22:07:25
519
原创 3 用kettle对数据库中的表进行字段拼接
通过Kettle工具的转换来实现将一张数据表中的两个字段进行拼接,然后插入到另一张数据表中。即将数据表personal_a中的字段surname和name进行拼接,然后插入到数据表personal_b。用于查询的字段一般用id(可以选择的)然后点击编辑映射,将想要输入表中的数据字段添加进来。点开JavaScript代码,输入代码,然后点击下方的获取变量(可以改名也可以不改)在表输入的界面中选择获取SQL查询语句,找到所需要输入的数据然后确定就好了。第一步现在步骤的输入框中输入组件名字,将所有组件连接起来。
2022-10-31 21:04:33
2934
空空如也
在python使用wntr时不能导入inp文件。
2022-02-14
尝试用java解决迷宫问题。但是失败了,希望能找出原因
2022-01-24
排序重构问题 用C/C++实现
2021-12-28
五个式子,4个未知数,求解
2021-12-13
请问用二叉链表创建二叉树,并先序遍历时为何输出不了答案呢?
2021-11-15
合并两个有序链表后,冒泡逆序排序,不知道为何没逆序
2021-09-29
约翰夫环用数组解决,为什么n是m的倍数时就不能完成循环啊
2021-09-21
C语言 头结点链表输出不了
2021-09-18
C语言链表输出的结果前多了一串数字
2021-09-16
TA创建的收藏夹 TA关注的收藏夹
TA关注的人