- 博客(9)
- 收藏
- 关注
原创 第九章——绘图和可视化(1)
急着学plt,第8章之后学本章主要学习matplotlib和seaborn。本章用jupyter notebook。
2025-03-26 17:18:08
726
原创 第七章——数据清洗和准备(2)
不必了解太多因为Pd的底层基于np,所以处理某些数值数据的缺失值时,(整数和布尔值),功能并不完备。当此类数据类型导入缺失值时,pd将数据类型转换成float64并使用np.nan来表示空值。最近pd创建了扩展类型。也可以用Int64替代pd.Int64Dtype(),即dtype='Int64'
2025-03-26 10:10:09
362
原创 第六章——数据加载、存储与 文件格式(1)
学了数据分析之后再看ML小项目确实清晰了一些。数据加载:读取数据并使数据可访问。解析:描述加载文本数据并将其解释为表格和不同的数据类型。
2025-03-21 14:53:49
312
原创 计划——绪论
我是做学科交叉的,专业课老师说只要学会套模型就可以了。但是我想要学就还是学到能力范围内最好吧,接下来计划每天继续学一部分数据分析那本书,然后一天分析1-3个ML小项目,然后4月学DL—主要是NLP,后面再看要不要学LLM。这个号主要是监督自己学习吧,导师很努力人也很好还要给我买电脑,但是这方面他是真不会。学院发这方面文章的老师也不会,感觉他们课题组是传承下来一套模型,反复套。之后时间应该比较充裕,这个月,最迟清明前,把我的项目做出来(已经做一遍了,但是分数评估效果不太好)
2025-03-20 21:05:03
102
原创 第四章——NumPy基础:数组和向量化计算(2)
1.根据cond中的值选取xarr和yarr的值,True时选xarr,False时选yarr。使用numpy.random模块,用于从多种概率分布中,有效地生成整个样本值数组。一元func:numpy.sqrt()开方;u func是一种对ndarray中的数据执行元素级运算的函数,arr.sort(axis = 0)对每一列进行排序(1是对行)二元func:接受两个数组,并返回1个数组做结果。1——计算行上的数据;在上述方法中,布尔值会强行转为1,0。例:标准正态分布样本数组。sum可以计算1的个数。
2025-03-16 18:32:22
883
原创 第四章——NumPy基础:数组和向量化计算(1)
data2是列表的列表,所以NumPy数组arr2有两个维度,可以用arr2.ndim和arr.shape确定数组的维度(2)和形状(2,4)与reshape相反的过程称为扁平化或者散花,用.ravel()不生成副本和.flatten()生成副本实现。array函数接收任意序列型的对象,然后生成新的包含传入数据的NumPy数组。要从3个名字中选取两个来组合多个布尔条件,使用运算符&(与)和 |(或)shape:表示各维度大小的元组——data.shape。要选取布尔值以外的数据,可以使用!
2025-03-14 23:08:38
321
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人