- 博客(11)
- 收藏
- 关注
原创 一些python知识点
df.ix 效果同df.loc loc和iloc的区别: iloc只能使用整数进行索引,如df.iloc[0:2,:] loc可以使用整数和名称混合索引,如df.loc[0:2,'row1','row2'] set()的用法:确定 无序 不重复的集合 set.add() 并集运算:set.union()
2022-09-17 17:16:26
186
原创 Pytorch(二)
通过Dataset加载自己的数据集 #加载自己的数据集 dataset = Data.TensorDataset(data_tensor = x, target_tensor = y) loader = Data.Dataloader(dataset = dataset, batch_size = BATCH_SIZE, ....) # 这里的loader会返回两个值,feature_data 和 tar
2021-11-29 19:59:50
104
原创 Pytorch (一)
Transforms中几个常用的函数: ToTensor:把其他格式的数据转换为tensor from torchvision import transforms writer = SummaryWriter("logs") img = Image.open(path) tensor_trans = transforms.ToTensor() tensor_img = tensor_trans(img) Resize:改变图像尺寸。常根据已有神经网络的要求来改变输入图像的size trans_r
2021-11-23 22:44:00
1077
原创 Pytorch 图片的读取
图片的读取 from PIL import Image img = Image.open(path) # 这样读取到的图片格式是PIL格式 或者 import cv2 img = cv2.imread(path) # 这样读取的图片是np.array()格式 自定义函数读取图片并储存到列表 from torch.utils.data import Dataset from PIL import Image import os class MyData(Dataset): def __i
2021-11-23 22:23:47
814
原创 2021-11-14
一个图中多组变量 sns.distplot(train_public[col]) sns.distplot(test_public[col]) sns.distplot(train_inte[col]) plt.legend(['train_p','test_p', 'train_i']) plt.xlabel(col) plt.show() 多图绘制 fig,axes=plt.subplots(1,3) plt.subplots_adjust(wspace=0.8) sns.distp
2021-11-14 09:10:29
539
原创 堆排序(2):topk问题
解决思路: 取列表前k个元素,建立一个小根堆,堆顶就是这k个里面最小的数 依次向后遍历原列表,对于列表中的元素,如果小于堆顶,则忽略该元素; 如果大于堆顶,这表示现在堆顶的元素肯定不是前k大的,直接扔掉,将堆顶更换为新元素,并重新建堆 遍历整个列表结束后,这个小根堆里的数就是前n大的数,此时倒序弹出堆顶即可 1、建小根堆(只需把前面代码中的两个>号换成<号即可)...
2021-11-10 22:41:27
117
原创 数据结构:堆排序(一)
大根堆:父节点值 大于 子节点 小根堆:父节点值 小于 子节点 1、堆排序的第一步是建堆,即把某个无序的二叉树构建成堆,这里以大根堆为例。 建堆的思路:从堆顶的元素开始遍历,依次与其左右子节点中较大的比较 1)若父节点更大,保留父节点位置,开始遍历子节点树杈 2)若子节点更大,交换父子节点的位置,开始遍历子节点树杈 依次遍历,直至遍历至最后一个节点,具体到代...
2021-11-10 22:35:24
572
原创 reset_index重置索引
pandas contact 之后,一定要记得用reset_index去处理index,不然容易出现莫名的逻辑错误 重置索引 不是很懂,跟着做就是了
2021-10-29 22:18:36
273
原创 重新学习python的一些语法
最近在做个贷预测时发现,在R和python里调用lgb,设置同样的参数,R的结果要比python差20个百分点,于是想重新学习一下python的语法结构,果断抛弃R语言。找了别人分享的一段baseline,记录了一些其中没见过的函数。 1)、pd.set_option() 好像是设置输出台显示dataframe的格式,最大行列数、小数位数等 # 显示所有列 pd.set_option('display.max_columns', None) pd.set_option('displ...
2021-10-29 20:59:50
165
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人