
python
文章平均质量分 50
前端子金
这个作者很懒,什么都没留下…
展开
-
用python向txt文件中写数据时的追加和覆盖问题
最近在用python从WOS网站中爬取内容并保存到本地的txt文件中,发现每次写入都是把txt文件中原来存在的内容覆盖掉了,那么如何才能在原来的基础上继续往里面添加内容呢?1、原来的打开文件的方式是: file = open(pathTxt, 'w', encoding='utf-8')2、修改后的写法:(将文件的打开模式由“写入”改为“追加”) file = open(...原创 2018-12-22 10:34:23 · 26290 阅读 · 1 评论 -
python如何将多个空格只保留一个
用python在进行文本处理的时候,经常会去除空格,那么当有多个连续的空格存在时,如何只保留一个呢?可以采用如下方式:(text为要处理的文本字符串)text = "123 45"clean_str = ' '.join(text.split())print(clean_str) //输出为123 45 原理:先将字符串通过split函数变为字符数组,再用字符串...原创 2018-12-22 10:43:02 · 14660 阅读 · 0 评论 -
用selenium和chromedriver从网页中爬数据以及chromedriver安装时出现的问题
1、首先下载selenium。用命令pip install selenium。2、下载chromedriver,本人的chrome浏览器的版本号是68,对应的chromedriver版本用的是2.40,大家可以参照一下这篇博客https://blog.youkuaiyun.com/weixin_42244754/article/details/815418943、把下载后的chromedriver...原创 2018-12-05 09:03:45 · 447 阅读 · 1 评论 -
Keras中的Embedding和Word2vec的区别
最近在接触深度学习,在自然语言处理的应用中,不可避免的要把文本转换成词向量,那么如何转化它呢?以及目前几种主要转化方式是有什么不一样呢?接下来借助我最近做的文本分类的问题加以解释说明,主要理清word2vec和keras提供的Embedding层的差别,这也是一度使我比较困惑的地方。一、one-hot一切要从one-hot编码开始。我们在对文本进行预处理时,一般会根据自己的训练文档来构...原创 2018-12-29 09:34:41 · 6851 阅读 · 2 评论