- 博客(44)
- 收藏
- 关注
原创 数据分析--观察数据处理异常值
中位数、最大值最小值、标准差、偏度和峰度.......)(获取离散化的分布用numpy.histogram)文件见绑定资源(来自kaggle的HR.csv)使用了histogram和可视化两个方法。其他列的简单操作大部分都是删除空值。(将不同列放在一起观察并分析数据)这里的代码类似与sql的DQL代码。这里用到的是matplotlib。意思是删除只要有空值的行。二、找出缺失值的位置并删除。一、从df中拿出处理对象。(多了一个删除异常值)三、观察数据组成情况。
2023-10-01 16:34:28
719
原创 数据分析笔记1
···四分位数计算方法:Q1的位置=(n+1)*0.25 (n为数据的个数)···离中趋势:标准差、方差--σ的值越大表示数据越离散,σ越小表示数据越聚拢。数据分析概述:数据获取--探索分析与可视化--预处理--分析建模--模型评估。····偏态系数S与峰态系数K--均值>中位数-->正偏反之为反偏。···相对数比较--结构相对数、比例相对数、比较相对数、强调相对数。···对比维度--时间维度、空间维度、经验与计划。···集中趋势:均值、中位数与分位数、众数。···抽样理论:抽样误差、抽样精度。
2023-09-29 21:36:29
618
原创 机器学习线性回归学习总结笔记
划分数据集的包from sklearn.model_selection import train_test_split。:实现了普通最小二乘线性回归模型。引包:from sklearn.metrics import mean_squared_error。:对输入数据集 X 进行标准化处理,即将 X 缩放到均值为 0、标准差为 1 的分布。:计算输入数据集 X 的均值和标准差。:将经过标准化处理的数据集 X 还原回原始数据空间,即逆转标准化操作。:先计算 X 的均值和标准差,然后对 X 进行标准化处理。
2023-09-21 17:24:42
206
原创 机器学习 l2正则化--岭回归
损失函数+λ惩罚项|w| (绝对值会使一些w的值直接=0,相当于删除了该特征的影响)损失函数+λ惩罚项w^2 (接近于0,削弱了特征值的影响)·SAG:如果数据集、特征都比较大,选择该随机梯度下降优化。·normalize:数据是否进行标准化(默认为False)L2正则化(更常用):Ridge回归--岭回归。·alpha:正则化力度--L2正则化的惩罚项的系数λ。正则化力度(alpha)越大-->权重系数 ( W ) 越小。正则化力度(alpha) 越小-->权重系数(W)越大。学习到的数据的特征过少。
2023-09-21 16:13:14
462
2
原创 机器学习线性回归
2)、梯度下降-试错、迭代、改进 sklearn.linear_model.SGDRegressor(loss="squared_loss",fit_intercept=True)函数关系 特征值(X1,X2,X3...)和目标值(h(W))的函数关系 w是权重 B是偏置。自变量一次 :h(w)=W1X1+W2X2+W3X3...+B。参数一次 :h()=w1x+w2x^2+w3x3^3...+B。公式:h(w)=W1X1+W2X2+W3X3...+B。fit()-->模型。
2023-09-18 23:49:40
79
原创 机器学习笔记1
(subset参数:'train'是训练集,'test'是测试集,'all'是全部)2) sklearn.datasets.load_boston()#加载返回波斯顿房价数据集。1) sklearn.datasets.load_iris()#加载并返回ying尾花数据集。load和fetch返回的数据类型是datasets.base.Bunch(字典格式)分类算法:K-近邻算法、贝叶斯分类、决策树和随机森林、逻辑回归。算法:聚类 K-means。目标值:连续型的数据-回归问题。目标值:类别-分类问题。
2023-09-18 23:48:56
481
原创 数据库sql函数归纳
case [expr] when [val1] then [res1] ...else [default] end 如果expr的值等于val1,返回res1,...否则返回默认值default;否则返回value2;lpad(str,n,pad) 左填充,用字符串pad对str的左边进行填充,达到n个字符串。rpad(str,n,pad) 右填充,用字符串pad对str的右边进行填充,达到n个字符串。round(x,y)求参数x的四舍五入的值,保留 y位小数。
2023-09-17 18:56:16
182
原创 数据库DCL语句归纳
alter user '用户名'@‘主机名’ identified with mysql_native_password by '新密码';create user ‘用户名’@‘主机名’ identified by '密码';revoke 权限列表 on 数据库名.表名 from '用户名'@'主机名';grant 权限列表 on 数据库名.表名 to '用户名'@'主机名';show grants for '用户名'@'主机名';用来管理数据库用户、控制数据库的访问权限。
2023-09-17 13:45:51
127
原创 数据库DQL语句的练习及其总结
- 查询年龄小等于20的员工年龄姓名,并对查询结果按照年龄升序排列,年龄相同按照入职时间降序排列;-- 查询男,年龄在18-20之间的前5个员工的信息,结果按照年龄升序,入职时间升序排列;-- 查询年龄为20,21,22,23的女性员工信息。-- 统计员工表中,年龄小于20的男性和女性人数;-- 查询性别男,20-40名字为两个字的员工。
2023-09-16 17:38:33
97
原创 数据库DQL语句归纳及练习
select 字段列表 from 表名【where条件】 group by 分组字段名【having 分组后过滤条件】;select 字段列表 from 表名 order by 字段1 排序方式1,字段2 排序方式2;select 字段列表 from 表名 LIMIT 起始索引,查询记录数;聚合函数:(count、max、min、avg、sum)起始索引=(页码-1)*每页展示记录数。分组查询:group by。ASC:升序(默认)
2023-09-16 15:24:09
144
原创 pandas练习二
17.添加一行数据['perl',6.6]# 19.统计grammar每个字符串的长度。# 15.查看最后5行的数据。# 16.删除最后一行的数据。# 18.对数据的大小排序。
2023-08-31 17:26:42
63
原创 pandas简单练习
1.将字典创建为dataframe。2.提取有‘python’的行。5.统计第一列中数据出现的次数。12.提取大于3小于7的数据。14.提取列中最大的数据所在行。10.将数据保存至excel。9.将第一列数据转为列表。13.交换两列的位置。4.修改第二列的名字。7.去掉第一列重复值。
2023-08-31 16:36:58
75
原创 pandas的DataFrame常用属性和方法汇总
ascending:指定排序顺序,为bool值或bool值列表。示例:df.sort_values(by='Age', ascending=False) 或 df.sort_values(by=['Name', 'Age'], ascending=[True, False])。示例:df.sort_values(by='Age') 或 df.sort_values(by=['Name', 'Age'])。默认为False,会返回排序后的新DataFrame。默认为'last',将缺失值放在排序结果的最后。
2023-08-17 10:28:20
354
原创 二维数组指针C语言
函数findmax应找出两个指针所指向的整数中的最大值,存放在pmax指向的位置。其中list[]是用户传入的数组;其中op1和op2是输入的两个实数,*psum和*pdiff是计算得出的和与差。函数str_cat应将字符串t复制到字符串s的末端,并且返回字符串s的首地址。本题要求实现一个计算输入的两数的和与差的简单函数。本题要求实现一个简单函数,找出两个数中的最大值。} /* 你的代码将被嵌在这里 */}/* 你的代码将被嵌在这里 */}/* 你的代码将被嵌在这里 */}/* 你的代码将被嵌在这里 */
2023-07-20 20:43:11
492
原创 C语言二维数组
输入第一行给出一个正整数T,为待测矩阵的个数。接下来给出T个矩阵的信息:每个矩阵信息的第一行给出一个不超过10的正整数n。随后n行,每行给出n个整数,其间以空格分隔。给定一个n×n的方阵,本题要求计算该矩阵除副对角线、最后一列和最后一行以外的所有元素之和。每个矩阵的判断结果占一行。如果输入的矩阵是上三角矩阵,输出“YES”,否则输出“NO”。随后n行,每行给出n个整数,其间以空格分隔。在一行中给出该矩阵除副对角线、最后一列和最后一行以外的所有元素之和。本题要求编写程序,求一个给定的m×n矩阵各行元素之和。
2023-07-19 18:15:31
229
原创 C语言练习a
从第1号开始报数,每轮从1报到3,凡报到3的猴子即退出圈子,接着又从紧邻的下一只猴子开始同样的报数。本题要求实现一个对数组进行循环左移的简单函数:一个数组a中存有n(>0)个整数,在不允许使用另外数组的前提下,将每个整数循环向左移m(≥0)个位置,即将a中的数据由(a。
2023-07-19 11:59:35
99
1
原创 C语言排序算法练习
将N个整数按从小到大排序的冒泡排序法是这样工作的:从头到尾比较相邻两个元素,如果前面的元素大于其紧随的后面元素,则交换它们。输入在第1行中给出N和K(1≤K<N≤100),在第2行中给出N个待排序的整数,数字间以空格分隔。在一行中输出冒泡排序法扫描完第K遍后的中间结果数列,数字间以空格分隔,但末尾不得有多余空格。本题要求编写程序,将一个给定的整数插到原本有序的整数序列中,使结果序列仍然有序。本题要求对任意给定的K(<N),输出扫描完第K遍后的中间结果数列。本题要求将给定的n个整数从大到小排序后输出。
2023-07-17 15:55:21
208
3
原创 C语言基础练习
函数PrintPN要逐行输出给定范围[m, n]内每个完数的因子累加形式的分解式,每个完数占一行,格式为“完数 = 因子1 + 因子2 + ... + 因子k”,其中完数和因子均按递增顺序给出。本题要求实现一个计算整数因子和的简单函数,并利用其实现另一个函数,输出两正整数m和n(0<m≤n≤10000)之间的所有完数。例如:6=1+2+3,其中1、2、3为6的因子。本题要求实现一个判断素数的简单函数,并利用该函数验证哥德巴赫猜想:任何一个不小于6的偶数均可表示为两个奇素数之和。注意:1不是素数,2是素数。
2023-07-17 14:37:21
138
3
原创 函数练习C语言
函数PrintFN要在一行中输出给定范围[m, n]内的所有Fibonacci数,相邻数字间有一个空格,行末不得有多余空格。本题要求实现一个计算Fibonacci数的简单函数,并利用其实现另一个函数,输出两正整数m和n(0<m≤n≤10000)之间的所有Fibonacci数。所谓Fibonacci数列就是满足任一项数字是前两项的和(最开始两项均定义为1)的数列。给定两个均不超过9的正整数a和n,要求编写函数求a+aa+aaa++⋯+aa⋯a(n个a)之和。其中函数fn须返回的是n个a组成的数字;
2023-07-12 11:16:17
168
4
原创 C语言函数递归练习
本题要求实现求Fabonacci数列项的函数。Fabonacci数列的定义如下:f(n)=f(n−2)+f(n−1) (n≥2),其中f(0)=0,f(1)=1。函数接口定义:函数f应返回第n个Fabonacci数。题目保证输入输出在长整型范围内。建议用递归实现。裁判测试程序样例:int main()int n;return 0;}/* 你的代码将被嵌在这里 */输入样例:6输出样例:8。
2023-07-11 10:32:31
234
3
原创 函数练习_2
函数PrimeSum返回区间[m, n]内所有素数的和。其中number是不超过长整型的整数,digit为[0, 9]区间内的整数。本题要求编写两个函数,一个判断给定整数是否水仙花数,另一个按从小到大的顺序打印出给定区间(m,n)内所有的水仙花数。函数PrintN则打印开区间(m, n)内所有的水仙花数,每个数字占一行。水仙花数是指一个N位正整数(N≥3),它的每个位上的数字的N次幂之和等于它本身。本题要求实现一个判断素数的简单函数、以及利用该函数计算给定区间内素数和的函数。注意:1不是素数,2是素数。
2023-07-10 17:42:08
57
1
原创 C语言函数练习
其中用户传入的参数为平面上两个点的坐标(x1, y1)和(x2, y2),函数dist应返回两点间的距离。如果n是完全平方数,则函数IsSquare必须返回1,否则返回0。其中n是用户传入的参数,其值不超过10。如果n是非负整数,则该函数必须返回n的阶乘。本题要求实现一个计算非负整数阶乘的简单函数,使得可以利用该函数,计算1!本题要求实现一个计算两个数的最大公约数的简单函数。本题要求实现一个判断整数是否为完全平方数的简单函数。本题要求实现一个函数,对给定平面任意两点坐标(x。使用函数求1到10的阶乘和。
2023-07-10 11:45:23
296
1
原创 继续练习23:27 C语言
在中国数学史上,广泛流传着一个“韩信点兵”的故事:韩信是汉高祖刘邦手下的大将,他英勇善战,智谋超群,为汉朝建立了卓越的功劳。在一行中按照“min = 最小值”的格式输出n个整数中的最小值。输入在一行中首先给出一个正整数n,之后是n个整数,其间以空格分隔。在一行中输出N的位数及其各位数字之和,中间用一个空格隔开。对于给定的正整数N,求它的位数及其各位数字之和。再按从1至6报数,记下最末一个士兵报的数为5;再按从1至7报数,记下最末一个士兵报的数为4;按从1至5报数,记下最末一个士兵报的数为1;
2023-07-06 23:31:30
104
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人