- 博客(9)
- 问答 (3)
- 收藏
- 关注
原创 python对docx文件进行处理,识别docx文件内容是否带有某个词
学校给了我一个任务,有几百个文件,有些是docx格式,有些是doc格式,有些事pdf格式!!!!!!需要注意的是,这个代码不能处理pdf和doc文件,幸好学校给我的那几百个文件里面,pdf、doc占比不是很大,因此对于这两类文件,我就是一个一个打开找的!!!!!!任务为:在这几百文件里面找出内容里面含有 “小花” 、 “大树” 、“绿草” 这些字眼的文件直接上代码,我慢慢解释from docx import Documentimport os#读取文档path='C:/U
2022-05-20 13:39:14
1101
原创 NLP对数据集进行(词性标注):将所有的词性进行汇总并且编号;将所有的英文词对应的词性转换成编号,得到list
我最近在做一个自然语言处理的作业,词性标注首先对词性标注的数据集进行处理直接上代码,我再解释一下# -*- coding: utf-8 -*-import nltkdef trans_chaToNum(tagged): pred = [] for tag in tagged: result = tag[1] pred.append(result) # 2.把字符编号,不同的字符对应不同的编号 mylist = set(p
2022-05-08 20:43:48
1139
原创 将string里的所有的标点符号全部去除,只剩下英文字母,空格和数字
python 代码功能如下:将string里的所有的标点符号全部去除,只剩下英文字母,空格和数字直接上代码:# -*- coding: utf-8 -*-import re# make English text cleandef clean_text(text): # keep English, digital and space # 就是会把标点符号全部去除掉 comp = re.compile('[^A-Z^a-z^0-9^ ]') retur
2022-05-08 09:57:29
1638
原创 cmd查看当前目录的文件及进入某文件以及安装keras-contrib
一开始打开,默认目录是:C:\Users\lenovo接下来输入dir,再按回车键,就可以看见该目录下的所有文件接下来,输入cd Desktop,再按回车键,就可以进入Desktop这个文件夹啦前缀就变了,意思就是你现在在Desktop这个文件夹了。------------------------------------------------------------------------说我篇幅太短了,那我就再继续记录一下,我为什么要进入该文件夹,因为我想安装keras_..
2022-05-07 16:38:55
3555
原创 查看.pth文件里面保存了哪些权重及那些权重的shape
废话不多说,直接上代码import torch content = torch.load('logs/ep100-loss0.253-val_loss1.945.pth',map_location=torch.device('cpu'))#torch.load('路径') 但是我的电脑没有GPU,是集成显卡呜呜呜,所以还得加个后面那部分map_location=torch.device('cpu')print(content.keys()) print(content['extr
2022-05-05 20:03:43
2047
原创 训练little wihte:events.out.tfevents到底是什么文件?
第一次训练的时候,我只知道我会把模型的参数 每25个epoch 保存在logs这个文件夹内,我一共设置了100个epoch,那就是logs文件夹会有4个 .pth文件。但是我打开文件夹的时候,发现,其中还有这个文件夹这是我没想到的(原谅我是一个小白(lll¬ω¬))我仔细看了一下。2022_05_03是日期,我确实在那天有运行过train文件,但是当时出现了很多错误,我就一直在改错,改了两天,一直在05_05 才改错完成,运行成功,所以出现了那么多文件夹。只有最后一个文件夹里面是有完好内
2022-05-05 10:02:53
6794
6
原创 将文件夹中的png、wegb图片全部转换为jpg图片
我有一堆图片,有png格式、jpg格式,还有wegb格式,幸好我一共就只有11张图片,我把wegb格式的图片自己手动转换成了jpg格式wegb-->jpg将wegb格式的图片用画图打开,再另存为jpgpng-->jpgimport os#这里的D:/RMN/VOCdevkit/VOC2007/JPEGImages 换成你自己存放图片的目录dirName = "D:/RMN/VOCdevkit/VOC2007/JPEGImages\\" #最后要加双
2022-05-03 10:16:47
596
原创 对GAN\WGAN\WGAN-GP进行一段话总结
总结:GAN网络由两部分组成:生成模型和判别模型生成模型就是输入噪点,输出逼真的样本判别模型为二分类器,判断真假更新判别模型的参数(损失函数带有log):在Discriminator中真是样本与1的loss+在D中虚假样本与0的loss然后更新生成模型的参数(损失函数带有log):在D中fake与1的lossWGAN网络就是更改了GAN的loss函数, 将loss函数中的log去掉了,并且把+改成了-WGAN中的鉴别器(D判别模型)也称为评论家WGAN删除了鉴别器的输出中.
2022-03-22 20:05:10
692
原创 Video Caption
米娜桑,哦哈哟~最近在写video caption相关综述学习video caption的时间不长,也是近一年才开始接触。说实话,也只是半吊子(〃ー〃)这一年来也没有特别特别认真的学习写这个文章也有个目的就是逼迫我努力学习(〃▽〃)我现在是上海一所大学的研一苟 一只(*ノ▽ノ)希望有大佬可以给我提提意见,指导我一下有志同道合的朋友可以一起做研究~...
2021-11-17 09:39:42
472
2
空空如也
word插入mathtype公式很奇怪,该如何解决┭┮﹏┭┮
2023-09-19
代码有时候在一开始Import之间会出现seed_value设置,是有什么作用呢?
2022-05-13
pycharm调用文件,project和文件夹都是红色波浪号是什么情况?
2021-10-15
TA创建的收藏夹 TA关注的收藏夹
TA关注的人