- 博客(47)
- 收藏
- 关注
原创 python匿名函数有感
2、匿名函数可以取名可以不取名,如:d = lambda p:p*2,d可以接受一个实参,在map中使用时可以不取名:name=['alex','wupeiqi','yuanhao','nezha']1、匿名函数会和两个函数经常放在一起使用,map和filter,map(匿名函数,可迭代量)
2024-04-11 11:04:05
110
原创 python解题错题本
2、.join() 函数,这个函数展开来写应该是str.join(item),join函数是一个字符串操作函数,str表示字符串(字符),item表示一个成员,注意括号里必须只能有一个成员,比如','.join('a','b')这种写法是行不通的。3、sorted函数,内部可以放可迭代对象,返回排序后的样子,例如a = "cdax" b = sorted(a) return b可以得到["a","c","d","x"],结果是一个列表,内部是每个元素的排序,会以单个字符串呈现。,则执行循环体中的代码。
2024-03-13 17:37:32
376
原创 hivesql注意点
2、粘贴长数字到wps或者Excel时要提前设置单元格格式为文本,粘贴时选择选择性粘贴选择无格式文本,这样数字尾部才不会全是0。3、多段sql同时放入任务时要注意每段须以;1、中文别名要用反单引号``
2024-01-30 11:07:52
97
原创 matplotlib.pyplot学习笔记
>> plot(x, y, 'bo') # 创建 y 中数据与 x 中对应值的二维线图,使用蓝色实心圈绘制。>>> plot(x, y) # 创建 y 中数据与 x 中对应值的二维线图,使用默认样式。>>> plot(y) # x 的值为 0..N-1。>>> plot(y, 'r+') # 使用红色 + 号。
2023-11-05 22:40:28
465
原创 线代学习笔记-向量
numpy中的array函数生成向量,()是函数标配,()下必有一个[]表示向量元素集合,第一层[]下的后每一个[]代表一行,没有这个[],表示这是没有方向的向量,是1D向量,有行列的叫2D向量。numpy广播机制,自动增加维数。
2023-11-01 21:22:10
106
原创 MySQL学习-获取排名,按行更新
需求:获取分类平均值的名次?比如10个班级的平均分,按照班级名称排序,后面跟着名次。记录表:student;字段:banji 班级;AvgS 平均分;pm 排名;
2023-10-31 10:38:45
226
原创 机器学习-关联分析之Apriori算法
an important data mining model◼ Assume all data are categorical.◼ No good algorithm for numeric data.◼ Initially used for Market Basket Analysis to find how items purchased by customers are related.
2023-10-30 13:40:49
67
原创 python学习-Logistic回归与Softmax回归
梯度下降过程中,需要在每个点上计算损失函数的梯度,然后继续朝负梯度值的 方向移动。指把所有的类放在一起算,即所 有类的TP加和,再除以所有类的 TP和FP的加和。logistic回归在多分类问题上的扩展,判别函数的数量是C个 预测输入属于每个类别的取值 通过softmax函数将输出值转换为条件概率。对于线性判别函数f(实数空间),选择怎样的决策函数g,能让决策空间缩 小到[0,1]上,同时保证损失函数的连续性?对于二分类问题,根据每一个样本的真实标签𝒚 和预测标签𝒚 ෝ的差异,可以 得到一个2*2的矩阵。
2023-10-29 21:18:24
100
原创 机器学习-基本知识
(4)数据分箱(Binning) 通常,原始数据中某些特征值或频率的分布往往是倾斜的,如果直接使用具有多个数量级范围的 原始数字特征,在相似性度量、聚类距离、回归系数等指标可能会受到不利影响。(1)二值化 (Binarization) 原始数据包含的指示特定属性的计数数据(如总计数、频率等数据),在一些 特定的应用中(构造推荐系统引擎),可进行二值化处理。数据分箱:用于将连续数值转换为离散数值,离散数值被分组到箱,每个箱代表一个特定的等级,并 且有一个特定的取值范围,连续型数值依次归入到各个分箱。
2023-10-29 14:01:37
409
1
原创 python学习-Pandas快速绘图
描述两个一维数据序列之间的关系 • 将两组数据分别作为点的横坐标和纵坐标 DataFrame.plot(kind=’scatter’,x,y,title, grid,xlim,ylim,label,...)• 表达数据的分位数分布,观察异常值 • 将样本居中的50%值域用一个长方形表示 • 较小和较大的四分之一值域各用一根线表示 • 异常值用“o”表示。• 调用Series.plot()或DataFrame.plot()函数完成绘图。• 绘图:利用pyplot的绘图函数plot() 或pandas绘图。
2023-10-27 17:06:05
665
原创 python学习-pandas通用函数与运算
按照成绩排序 stu_grade = stu.sort_values(by='成绩', ascending=False) ex = (stu_grade['成绩']>=90 ).sum() #计算优秀人数 fail = (stu_grade['成绩']>> stu[['身高','体重','成绩']].describe() #对身高体重和成绩3列数据描述统计。
2023-10-27 16:36:59
202
原创 python学习-pandas基础
>> student = pd.read_csv('data\student2.txt', sep='\t', index_col=0, header=None, names= colNames )#指明: 1)文件中不包括列索引 2)列索引名由指定列表给出。>>> stu['成绩排名'] = stu['成绩'].rank(method='min', ascending=False)#增加“成绩排名”列。>>> colNames = ['性别','年龄','身高','体重','省份','成绩']
2023-10-27 14:19:24
166
原创 python学习-numpy基础
>> scores[names == '肖良英', subjects == 'English'] + 5。>>> scores[names == '肖良英', subjects == 'English']>>> names[ (names == '王微') | (names== '钱易铭')]>>> names[ mask ] array(['王微' '钱易铭'], dtype='>>> mask = (names == '王微') | (names== '钱易铭')
2023-10-27 13:34:10
88
原创 MySQL学习-取最值
如何分组后取数据最多对应的其他的字段值,用好rank()或者 order by count(*) desc 然后limit 1。
2023-10-21 19:52:35
57
原创 MySQL学习-with as
3.如果定义了with子句,而在查询中不使用,那么会报ora-32035 错误:未引用在with子句中定义的查询名。(至少一个with查询的name未被引用,解决方法是移除未被引用的with查询),注意:只要后面有引用的就可以,不一定非要在主查询中引用,比如后面的with查询也引用了,也是可以的。1.使用with子句可以让子查询重用相同的with查询块,通过select调用(with子句只能被select查询块引用),一般在with查询用到多次情况下。但同一with子句内部不能嵌套with子句。
2023-10-21 17:45:40
319
原创 MySQL学习-在聚合函数中使用等于语句或者case语句
在聚合函数中使用等于语句或者case语句能够帮助我们高效率的解决一些复杂的问题,首先使用等于语句可以跳过不等于的行,使用case语句可以通过行值的不同返回不同的值协助 计算。
2023-10-20 14:56:14
75
原创 MySQL学习-在聚合函数中使用等于语句或者case语句
在聚合函数中使用等于语句或者case语句能够帮助我们高效率的解决一些复杂的问题,首先使用等于语句可以跳过不等于的行,使用case语句可以通过行值的不同返回不同的值协助 计算。
2023-10-20 14:55:20
54
原创 MySQL学习-自连接查询问题
自连接时,可以不指定字段名,需要修改表名,这样查询结果时,第二个表字段名会显示为新表名.字段名,原表会显示为旧表名.字段名。
2023-10-18 22:47:22
62
原创 MySQL学习-如何利用好笛卡尔积
或select * from 表1 cross join 表2;查询出双表所有的笛卡尔积使用select * from 双表名。
2023-10-18 22:09:47
55
原创 MySQL学习-常用函数和关键字总结
#如果条件为 TRUE,IF() 函数返回一个值,如果条件为 FALSE,则返回另一个值。3、round函数,用于四舍五入,ROUND(分组函数,常用于结果显示或分组计算。2、if函数,结构IF(
2023-10-18 15:48:05
119
原创 MySQL学习-group by 函数
group by是开发中经常用到的SQL语句,从字面意思来看就是根据哪个字段或者哪几个字段对查询到的数据进行分组统计,既然是分组统计那如何分组呢?select 聚合函数(字段1),字段2 from 表名 where 条件 group by 字段2,字段3 having 过滤条件。select 聚合函数(字段1),字段2 from 表名 where 条件 group by 字段2,字段3。使用了group by 后,要求select出的结果字段都是可汇总的,否则就会出错。
2023-10-16 23:49:15
575
原创 MySQL学习-判断数据未null表述
若为空,原数据用null表示,要用is判断,eg:where referee_id。判断一个字段是否是数字使用正则表达式 eg : 不等于!
2023-10-14 21:28:35
55
1
原创 MySQL学习-慢查询日志
重新启动MySQL服务器进行测试,查看慢日志文件中记录的信息 /var/lib/mysql/localhost-slow.log。慢查询日志记录了所有执行时间超过指定参数(long_query_time,单位:秒,默认10秒)的所有 SQL语句的日志。# 设置慢日志的时间为2秒,SQL语句执行时间超过2秒,就会视为慢查询,记录慢查询日志 long_query_time=2。开关已经打开了,接下来,我们所执行的SQL语句,都会被MySQL记录,并记录执行时间消耗到哪儿去 了。配置完毕之后,通过以下指令。
2023-10-14 10:46:20
71
1
原创 MySQL学习-sql性能分析
SQL执行频率 MySQL 客户端连接成功后,通过 show [session|global] status 命令可以提供服务器状态信 息。通过上述指令,我们可以查看到当前数据库到底是以查询为主,还是以增删改为主,从而为数据 库优化提供参考依据。如果是以增删改为主,我们可以考虑不对其进行索引的优化。如果是以 查询为主,那么就要考虑对数据库的索引进行优化了。#-- session 是查看当前会话;-- global 是查询全局数据;
2023-10-08 21:41:48
52
1
原创 python学习-递归总结
递归要先抓住在减小或者增大的序号n,然后寻找关于序号n下的数的关系,写出一个F(n)与F(n-1)间的函数关系,并不要求n直接参与运算,而是n底下代表的数。
2023-10-08 15:40:57
74
1
原创 MySQL学习-索引
索引(index)是帮助MySQL高效获取数据的数据结构(有序)。在数据之外,数据库系统还维护着满足 特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据, 这样就可以在这些数据结构 上实现高级查找算法,这种数据结构就是索引。Hash索引 底层数据结构是用哈希表实现的, 只有精确匹配索引列的查询才有效, 不 支持范围查询。B+Tree索引 最常见的索引类型,大部分引擎都支持 B+ 树索引。#我们平常所说的索引,如果没有特别指明,都是指B+树结构组织的索引。
2023-10-08 12:47:20
53
1
原创 MySQL学习-存储引擎
如果应用对事务的完整性有比较高的要 求,在并发条件下要求数据的一致性,数据操作除了插入和查询之外,还包含很多的更新、删除操 作,那么InnoDB存储引擎是比较合适的选择。文件:xxx.ibd:xxx代表的是表名,innoDB引擎的每张表都会对应这样一个表空间文件,存储该表的表结 构(frm-早期的 、sdi-新版的)、数据和索引。MyISAM : 如果应用是以读操作和插入操作为主,只有很少的更新和删除操作,并且对事务的完 整性、并发性要求不是很高,那么选择这个存储引擎是非常合适的。
2023-10-08 10:30:09
45
1
原创 MySQL学习-事务
事务 是一组操作的集合,它是一个不可分割的工作单位,事务会把所有的操作作为一个整体一起向系 统提交或撤销操作请求,即这些操作要么同时成功,要么同时失败。注意: 默认MySQL的事务是自动提交的,也就是说,当执行完一条DML语句时,MySQL会立即隐 式的提交事务。#注意:上述的这种方式,我们是修改了事务的自动提交行为, 把默认的自动提交修改为了手动提 交, 此时我们执行的DML语句都不会提交, 需要手动的执行commit进行提交。赃读:一个事务读到另外一个事务还没有提交的数据。提交事务 COMMIT;
2023-10-02 19:00:56
67
1
原创 MySQL学习-多表操作
在自连接查询中,必须要为表起别名,要不然我们不清楚所指定的条件、返回的字段,到底 是哪一张表的字段。#右外连接相当于查询表2(右表)的所有数据,当然也包含表1和表2交集部分的数据。#相当于查询表1(左表)的所有数据,当然也包含表1和表2交集部分的数据。标量子查询:子查询返回的结果是单个值(数字、字符串、日期等),最简单的形式,这种子查询称为标量子查询。联合查询:对于union查询,就是把多次查询的结果合并起来,形成一个新的查询结果集。表子查询: 子查询返回的结果是多行多列,这种子查询称为表子查询。
2023-10-02 17:18:54
75
1
原创 MySQL学习-约束
SET NULL 当在父表中删除对应记录时,首先检查该记录是否有对应外键,如果有则设置子表 中该外键值为null(这就要求该外键允许取null)。CASCADE 当在父表中删除/更新对应记录时,首先检查该记录是否有对应外键,如果有,则 也删除/更新外键在子表中的记录。删除/更新行为:添加了外键之后,再删除父表数据时产生的约束行为,我们就称为删除/更新行为。添加外键的表称为子表,外键关联的主表称为父表。
2023-10-02 16:39:19
70
1
原创 MySQL学习-DCL
CASE WHEN [ val1 ] THEN [res1] ... ELSE [ default ] END 如果val1为true,返回res1,... 否 则返回default默认值#when x then y 形式类似if函数,可以接多个when then 结构最后再接else。LPAD(str,n,pad) 左填充,用字符串pad对str的左边进行填充,达到n个字符 串长度 RPAD(str,n,pad) 右填充,用字符串pad对str的右边进行填充,达到n个字符 串长度。
2023-10-01 21:08:26
54
原创 MySQL-java.net.ConnectException问题
解决:进入计算机管理找到服务栏中的MySQL,开启服务。原因:MySQL服务未开启。
2023-10-01 13:50:44
84
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人