自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Zstarling的博客

twinkle, twinkle, little star, how I wonder what you are

原创 python-Dataframe的8种小示例

Python 小技巧

2024-02-08 10:28:38 1445 1

原创 Python- 分区判断的写法及其5种优化方法

执行以上代码，分别使用了 pd.cut()，np.where()，np.select() 和 apply() 这些方法来统计 col1一列分组后的数据量，各方法的返回值 count1、count2、count3、count4 分别储存在 DataFrame 中。有存在随机的10000个数据，请用Python将判断每个数在哪个区间，并输出，区间分为，小于0，0到50,50到100,100 到1000，1000以上。是Python内置函数，可以用于在遍历一个可迭代的对象时，同时返回一个计数和相应的值。

2024-02-08 09:58:54 1418

原创 SQL(COALESCE)

非空值查找及替换COALESCE

2023-12-04 23:33:40 921 1

原创基于SQL语言的数据库管理系统

常见的SQL数据库管理系统具体区别PLPGSQL和MYSQL的区别

2023-12-04 23:32:26 1458

原创 SQL -高阶3

字符串拼接与类型转换最大，最小值，提取日期部分的数值日期截断

2023-12-03 21:47:49 1798 2

原创 python basic3-zstarling

python 基础

2023-12-03 14:42:14 842

原创 python-绘图（主次坐标轴）

【代码】python-绘图（主次坐标轴）

2023-12-03 14:37:34 789

原创 sklearn库简述-zstarling

划分数据集from sklearn.model_selection import StratifiedShuffleSplit 评估模型：用于计算真实值与预测值之间的预测误差from sklearn.metrics import accuracy_score, log_loss _score结尾的函数，返回值越大，效果越好；_loss结尾的函数，返回值越小，效果越好。K近邻分类器集（KNN算法）from sklearn.neighbors import KNeighborsClas

2023-05-25 11:37:54 335

原创面试题集合1

数据标准化方法有最小-最大标准化、z-score标准化、小数定标标准化、对数变换。最小-最大标准化将数据转换为0到1之间的范围，通过对每个数据点进行以下计算实现：(X-Xmin)/(Xmax-Xmin)，其中X表示原始值，Xmin表示数据中的最小值，Xmax表示数据中的最大值。该方法的主要特点是保留了数据的相对大小和顺序关系。z-score标准化将数据转换为均值为0，标准差为1的分布，通过对每个数据点进行以下计算实现：(X-μ)/σ，其中X表示原始值，μ表示数据的平均值，σ表示数据的标准差。

2023-05-25 11:30:23 584

原创 Python-pandas的基础函数

【代码】Python-pandas的基础函数。

2023-04-18 12:50:51 240

原创 SQL-日期时间函数

【代码】SQL-日期时间函数。

2023-03-30 23:49:06 208

原创 SQL 三天连续问题

三天连续登录，三天重复出现，三次连续且值大于

2023-03-24 20:51:04 1062

原创 MYSQL-高阶2

with在sql语句中定义在group by之后。当需要对数据库数据进行分类统计的时候，往往会用上groupby进行分组。而在groupby后面还可以加入withcube和withrollup等关键字对数据进行汇总。使用 WITH ROLLUP，此函数是对聚合函数进行求和，注意 with rollup是对 group by 后的第一个字段，进行分组计算。count多条件计数，是指满足多条件行的计数，且count统计不计入空值。MySQL是可以支持直接创建字段值，但是牛客不可以，解决方式在下方。

2023-03-12 03:39:18 410

原创 SQL(HIVE)-insert用法

SQL(HIVE)-insert创建表。

2022-11-29 16:28:57 4389

原创 SQL（HIVE -HUE）剔除的三种方式

第四种方法是第三种方法的删减版，但是在hive中会报错，无语法错误。应该是不支持这种写法，至于原因还未找到，若有大佬，请指教。上述三种方法中，一般不建议使用not in。IS NULL 的执行速度最快。

2022-11-16 14:17:49 1565

原创 Python写入EXCEL

pd.ExcelWriter写入open写入方法write与writelines对比表格Dataframe形式的写入for、with 位置对比

2022-07-13 16:08:15 7894

原创 MYSQL--高阶1

文章目录----zstarling----------zstarling------IFNULL函数ifnull(x,y)表示

2022-07-12 16:28:55 301

原创 Linux-操作1(替换文本内容）

Linux字符串替换

2022-07-01 11:21:27 4571

原创 Linux-操作1(去重）

默认升序（ASCII码方式）。-b :数值排序-f:小写转化成大写排序-r:降序排序-u:去重-n:以数值的方式排序-t:设置分隔符（）-k:指定列数（)uniq: 去重默认删除重复行（重复行只保留一个）。当重复的行并不相邻时，uniq 命令是不起作用的。所以一般与sort连用。-c:去除重复行并记录出现次数（保留重复行）-u:仅显示出现一次的行列（不保留重复行）-d:只保留重复行wc:计数默认显示顺序为行数、字数（单词数）、字节数-w：字数-c：字节数-l:行数-n

2022-06-07 14:04:38 1184

原创 SQL-窗口函数

窗口函数

2022-05-28 02:07:22 2681

原创 Python连接SQL与hive

--ZstarlingSQL连接hive连接补充写入方法write与writelines对比表格Dataframe形式的写入for、with 位置对比SQL连接import pymysqldef sql(path): conn = pymysql.Connect(host='36.104.34.123', user='用户名', passwd='密码', db='库名') # 获取游标 cursor = conn.cursor() # 1、从数据库中查询 sql

2022-05-06 23:04:39 1705

原创 SQL函数计算和union

截断平均值写法SELECT b.tag, b.difficulty, -- 去掉最大值与最小值取平均，保留一位小数 ROUND(( SUM( a.score )- MAX( a.score )- MIN( a.score ))/( COUNT( score )- 2 ), 1 ) FROM examination_info b LEFT JOIN exam_record a ON b.exam_id = a.exam_id WHERE b.tag = "SQL" AND b.di..

2022-03-11 16:50:10 362 2

原创 SQL-concat字符串连接

CONCAT和CONCAT_WS的区别：concat 是按左到右的次序依次连接字段值。CONCAT_WS是用第一个字段作为连接符来连接后续字段值。SELECT uid, CONCAT( DATE_FORMAT( start_time, '%Y-%m-%d' ), ':', tag ), CONCAT_WS( ':', DATE( start_time ), ei.tag ) FROM exam_record er JOIN examination_info ei ON er.ex.

2022-03-11 16:35:16 1036

原创 SQL(count)

count判断条件计数方式，不能直接在count中用等号=，此时显示的是对是否等于1的结果的计数，并不是等于1时的计数。可以用sum-0-1的方式代替。SELECT uid, sum(IF( submit_time IS NULL, 1, 0 )) `0`, sum(IF( submit_time IS NULL, 0, 1 )) `1`, count( IF ( submit_time IS NULL, 0, 1 )= 1 ) `total` FROM exam_record GROUP

2022-03-11 15:57:50 1751

原创 SQL-索引index

索引创建、删除与使用：create方式创建索引：建表时创建索引CREATE TABLEIF NOT EXISTS user_info_vip ( id INT PRIMARY KEY AUTO_INCREMENT COMMENT '自增ID', uid INT UNIQUE NOT NULL COMMENT '用户ID', nick_name VARCHAR(64) COMMENT '昵称', achievement INT DEFAULT 0 COMMENT '成就值',

2022-02-25 15:51:54 1622

原创 SQL-插入insert四种方式

单条插入INSERT INTO `test`.`exam_record_before_2021`VALUES ( 6, 1001, 9002, '2020-01-02 09:01:01', '2020-01-02 09:21:01', 70 );多条插入INSERT INTO `test`.`exam_record_before_2021` ( `id`, `uid`, `exam_id`, `start_time`, `submit_time`, `score` )VALUES (.

2022-02-24 11:54:50 8286

原创 Python-pivot_table,merge解析

pivot_table

2022-01-12 18:04:50 1836

原创 python-openpyxl(样式设计)

openpyxl

2022-01-11 17:58:21 634

原创 SQL经典1-45题(4个表)-zstarling

Table structure for courseDROP TABLE IF EXISTS `course`;CREATE TABLE `course` ( `Cid` int(11) NOT NULL, `Cname` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NULL DEFAULT NULL, `Tid` int(11) NULL DEFAULT NULL) ENGINE = InnoDB ..

2021-06-05 18:51:46 197 2

原创 SQL经典1-45题-zstarling

1.查询" 01 “课程比” 02 "课程成绩高的学生的信息及课程分数SELECT * FROM ( SELECT * FROM score sc WHERE sc.Cid = 1 ) AS cid1, ( SELECT * FROM score sc WHERE sc.Cid = 2 ) AS cid2 WHERE cid1.score > cid2.score AND cid1.sid = cid2.sid;1.1查询同时存在" 01 “课程和” 02 "课程的情况.

2021-06-03 22:26:15 373

原创 python basic2-zstarling

basci

2021-05-28 00:55:46 174

原创 python库简介-zstarling

matplotlib.cm是matplotlib库中内置的色彩映射函数。matplotlib.cm语法 matplotlib.cm.色彩即对[数据集]应用[色彩]示例：plt.cm.Set1(catagory)色彩集cmaps = [('Perceptually Uniform Sequential', [ 'viridis', 'plasma', 'inferno', 'magma', 'cividis']), ('Sequential', [.

2021-05-27 18:57:52 667

原创 Git基本操作代码-zstarling

切换分支git checkout maingit checkout basic删除文件git rm * `删除全部文件`git rm 文件名删除文件夹rmdir 文件夹名新建文件夹touch 文件夹名新建文件mkdir 文件名删除文件或者新建文件直接提交就可以，不需要add查看日志Git log --oneline git log提交操作git commit -m "提交记录"git commit -a -m "提.

2021-05-27 14:40:18 139

原创数据库三范式原则

2021-05-21 14:37:27 415

原创 Scikit-Learn 三、模型选择与评估

详情见模型选择与评估

2021-04-26 10:39:19 213

原创 scikit-learn 一、监督学习

详情见监督学习

2021-04-26 10:38:26 190

原创 Scikit-Learn 五、数据集转换

详情见数据集转化

2021-04-26 10:38:14 205

原创 Scikit-Learn 二、无监督学习

详情见无监督学习

2021-04-26 10:38:06 186

原创 scikit-learn库

详情见scikit-learn

2021-04-26 10:37:50 131

原创Ｒ－lasso 回归

数据读取data.fl <- read.csv(“D:\important APP\study\R\data1.csv”,header=T, encoding=“UTF-8”)names(data.fl)dim(data.fl)先做一个正常的回归看看效果fit.fl.lm <- lm(Prfmc~., data.fl)summary(fit.fl.lm)对X，Y赋值Y <- data.fl[,18]# extract YX.fl <- model.matrix(P

2021-03-22 23:46:17 1634

三、模型选择与评估.xmind

三、模型选择与评估.xmind

2021-04-27

五、数据集转换.xmind

数据的清洗

2021-04-27

scikit-learn.xmind

SK-Learn 流程

2021-04-27

二、无监督学习.xmind

无监督学习大纲

2021-04-27

一、监督学习.xmind

监督学习大纲

2021-04-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

博客等级

码龄7年

64
原创

310
点赞

1784
收藏

177
粉丝

关注

私信

热门文章

分类专栏

单章 3篇
Python 15篇
SQL 19篇
算法 10篇
快捷键大全 6篇
Excel 3篇
时间序列 5篇
SPSS 3篇

最新评论

python-Dataframe的8种小示例
优快云-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
SQL -高阶3
优快云-Ada助手: 恭喜你这篇博客进入【优快云月度精选】榜单，全部的排名请看 https://bbs.youkuaiyun.com/topics/617828219。
SQL -高阶3
优快云-Ada助手: 恭喜你这篇博客进入【优快云每天值得看】榜单，全部的排名请看 https://bbs.youkuaiyun.com/topics/617681009。
SPSS缺失值处理
左与右25: EM和回归方法插值完，出现负值是啥情况，求解
SPSS-线性回归
格子衫的清色: 多元线性回归分析中自变量小等于5时看R方？

提示

确定要删除当前文章？

取消删除