
python实战经验
nameforcsdn
这个作者很懒,什么都没留下…
展开
-
实战python3中的正则表达式
python中的正则表达式(re模块)基本语法讲解链接:https://www.cnblogs.com/tina-python/p/5508402.html实战经验1、所有中文的unicode码的范围是[\u4e00-\u9fa5];2、findall()时,正则表达式中每一层()包含的那些所能匹配到的元素会被放在一个通道,即一个tuple中;3、正则表达式写的不合适,可能会因为文本中...原创 2018-11-23 11:05:25 · 124 阅读 · 0 评论 -
pandans.read_csv()和.to_csv()方法中的encoding参数问题
参考:https://www.cnblogs.com/maoguy/p/6807941.html在含有中文编码的情况下,to_csv()方法的encoding参数默认为"gbk",而read_csv()方法的encoding参数默认为"utf-8",所以最好的防止由于编码出错导致读取错误的方法就是在to_csv()和read_csv()方法同时显式地设置相同的encoding参数。所以以我自己...转载 2019-06-05 10:39:03 · 4986 阅读 · 0 评论 -
unbuntu pip 无法安装包的问题 需要使用sudo权限
参考:https://blog.youkuaiyun.com/ignoreyou/article/details/81079304更新软件源sudo apt-get update1、安装pipsudo apt-get install python-dev python-pip2、安装制定版本的tensorflow例如安装1.3版本sudo pip install tensorflow==1....转载 2019-06-05 15:09:57 · 845 阅读 · 0 评论 -
6种分词工具的效率、效果对比
转自:https://www.jianshu.com/p/575fd73ce379六种分词器使用建议:对命名实体识别要求较高的可以选择HanLP,根据说明其训练的语料比较多,载入了很多实体库,通过测试在实体边界的识别上有一定的优势。中科院的分词,是学术界比较权威的,对比来看哈工大的分词器也具有比较高的优势。同时这两款分词器的安装虽然不难,但比较jieba的安装显得繁琐一点,代码迁移性会相对弱一点...转载 2019-07-05 09:50:10 · 4447 阅读 · 0 评论 -
Pycharm Unittests模式解决
看了很多篇博客,都是说出现这种情况的原因是什么,即程序中出现了以test()或者_test()的函数命名,但是提出的解决方案本人都试了,没有用…也可能是我姿势不对…自己捯饬发现了解决方案。记录一下。首先通过这个进入Configurations,如果你的是Unittests的话,此时应该是这样的(…忘记截图了,就当已经看到了~)然后通过右上角的“-”将“Python”下的文件全部删除不要...原创 2019-07-20 20:41:00 · 974 阅读 · 0 评论 -
python获取当前文件路径
python获取当前路径import os,sys使用sys.path[0]、sys.argv[0]、os.getcwd()、os.path.abspath(file)、os.path.realpath(file)sys.path是Python会去寻找模块的搜索路径列表,sys.path[0]和sys.argv[0]是一回事因为Python会自动把sys.argv[0]加入sys.path。...转载 2019-08-08 15:06:38 · 838 阅读 · 2 评论