- 博客(8)
- 收藏
- 关注
原创 SQL学习——三
sql函数语句函数:Avg()、Count()、First()、Last()、Max()、Min()、Sum()、GroupBy()、Having()、Ucase()、Lcase()、Mid()、Len()、Round()、Now()对应含义:均值,计数,取第一,取最后,最大,最小,求和,分组,代替where(where不能和合计函数一起使用),转换成大写,转换成小写,取指定字符,长度,四舍五入,当前时间(1)从table里取列i的均值(可替换为计数,取第一,取最后,最大,最小,求和,转换成大写,转换
2021-07-27 17:41:11
82
原创 SQL学习——(二)
SQL学习——(二)高级语句(1)Top:SQLsever:select top 3/50 percent */列i/列i,...,列j from 表a;Mysql:select */列i/列i,...,列j from 表a limit 3;Oracal:select */列i/列i,...,列j from 表a where Rownum < 3;(2)like:select * from 表a where 列i like "N%"(3)通配符% 包含一个或者多个-包含一个
2021-07-27 17:13:20
110
原创 正则匹配两个字符串之间的任意字符
正则匹配两个字符串之间的任意字符问题:某两个字符串间的任意字符:A(. * ?)B:.不包括\n,因此只能匹配一行A(\s\S * ?)B:单行多行都可以匹配import re s = '''{1:F01CIBKCNBJAXX92}:50F:/TR390925017971/AZRA GRE SANAYI VE TICARE2/AUKARIDUDULLU MH.3/BKRUMM:52A:YAPITRISXXX'''res1=re.findall("50F:(.*?)52A:",s)
2021-07-22 10:41:17
2089
原创 SQL学习——(一)
SQL基础语句学习(1)select查询:语句1:从表a中按照条件a和/或条件b去查询*/列a/列i,…,列j,将结果按照列n排序:select */列a/列i,...,列j from 表a where 条件 and/or 条件 order by 列n;语句2:从表a中按照条件a和/或条件b去查询列j,要求不重复,将结果按照列n排序:select distinct 列j from 表a where 条件 and/or 条件 order by 列n;(2)insert into 增加:语句1
2021-07-20 17:56:29
80
原创 XGB笔记0218
XGB笔记看了一篇知乎,里面对XGBoost描述的非常非常的清晰。决策树:三种树,分为ID3(信息增益),C4.5(信息增益率),CART(基尼指数);随机森林:决策树之间相互独立;基于决策树的多棵树决策,简单易实现计算开销小;基于bagging随机有放回的采样(T个包含M个样本的训练集);基于bagging的训练过程引入随机性(在决定划分属性的时候,先随机选择一个包含k个属性的子集,然后再从子集中选择一个最优属性进行划分);GBDT:基树采用CART回归树;树节点的划分指标:平方损失函
2021-02-18 14:49:51
168
原创 2021-02-07
数据分析1、类型① 列表索引:list[i];长度:len(list);增:list.append(x),list.insert(2,x)#2为索引值,x为增加的数据;删:list.remove(x);改:list[0]=x;查:list[3]、list[1:3]#前闭后开、list[-1];遍历:for index in range(len(list)): print(index,':',list[index])② 字典长度:len(dic);键:dic.keys();值:d
2021-02-08 14:33:07
144
原创 2021-02-07
数据分析笔记——python数据处理基础知识数据分析流程:1、明确目的2、数据:数据获取→数据清洗→数据整理3、算法:模型(调优)4、业务:多维度分析→建议结论数据处理(1)重复值处理:删;file.info()#查看file的每列信息若含有重复值,则:duplicated_index=file.dumplicated(keep=Flase)# keep=Flase可以保留所有重复行file[file[duplicated_index]].sort_values([‘列A’, ‘列B’
2021-02-07 17:13:31
103
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人