
数据处理与可视化(python)
qinglv1
如有问题,请发送给到邮箱:772152438@qq.com
展开
-
numpy操作的一些注意事项
1.a为数组,判断a里面是否存在某个元素符合某个条件 使用np.any(a>1)而不是a.any()>1,这些去别的什么的要注意 也可以使用a[a>1]=0,也就是将a数组里面的大于1的元素变为0...原创 2018-05-14 13:54:46 · 503 阅读 · 0 评论 -
关于爬虫icrawler
icrawler框架包含6个内置的图像抓取工具。 谷歌 bing 百度 Flickr 通用网站图片爬虫(greedy) UrlList(抓取给定URL列表的图像) 以上参考文章https://www.ctolib.com/topics-125069.html 做爬虫的话,一般得需要api的账号和密钥,这个...原创 2019-01-25 17:29:40 · 1473 阅读 · 0 评论 -
查找列表中某个值的位置(python
转载自:https://blog.youkuaiyun.com/wudiyi815/article/details/7775549p=list.index(value)list为列表的名字value为查找的值p为value在list的位置 以下内容引自:http://www.linuxidc.com/Linux/2012-01/51638.htmPython3.2.2列表操作总结...转载 2019-01-14 17:24:51 · 2087 阅读 · 0 评论 -
安装icrawler
如果出现没有icrawler模块的时候,使用以下命令安装(自己的经历,第一个命令有可能会超时,可以使用第二个命令)pip install icrawler 或者conda install -c hellock icrawler....原创 2019-01-24 18:19:42 · 1442 阅读 · 1 评论 -
Python中排序sort 、sorted和argsort函数
转载自:https://blog.youkuaiyun.com/cissy930426/article/details/51055840sort函数是list列表中的函数,而sorted可以对list或者iterator进行排序用sort函数对列表排序时会影响列表本身,而sorted不会>>> a = [1,2,1,4,3,5] >>> a.sort() ...转载 2019-01-14 16:27:52 · 275 阅读 · 0 评论 -
os.walk和os.listdir
1.os.walk(),可以一级一级循环低递归到最下面的一级目录 for root,_,img_names in os.walk(img_dir): for img_name in img_names: img_path = os.path.join(root,img_name) imgs.append(img_path)...原创 2019-01-24 12:32:41 · 677 阅读 · 1 评论 -
shutil模块和os模块,对于文件的操作模块
转载自:https://www.cnblogs.com/JarningGau/p/5333996.htmlPython默认模块 os和shutil 实用函数os.sep 可以取代操作系统特定的路径分隔符。windows下为 '\\'os.name 字符串指示你正在使用的平台。比如对于Windows,它是'nt',而对于Linux/Unix用户,它是 'posix'os.g...转载 2019-01-18 11:38:33 · 120 阅读 · 0 评论 -
协方差矩阵
参考链接:https://www.cnblogs.com/chaosimple/p/3182157.html1.理解协方差矩阵的关键就在于牢记它的计算是不同维度之间的协方差,而不是不同样本之间。拿到一个样本矩阵,最先要明确的就是一行是一个样本还是一个维度,心中明确整个计算过程就会顺流而下,这么一来就不会迷茫了。 理解协方差矩阵的关键就在于牢记它计算的是不同维度之间的协方差,而不是不同样本之间...原创 2018-06-14 13:51:03 · 304 阅读 · 0 评论 -
python对excel和.txt和.json的读入
一.import osimport numpy as npfrom numpy import *import xlrd#这个是对excel进行读入的模块workbook = xlrd.open_workbook(r'E:/wenjiian.xlsx')PIVOT_name = workbook.sheet_names()[7]#这个是说的为第几个工作表格sheet几什么的,读取这个工作表的...原创 2018-05-31 13:52:45 · 287 阅读 · 0 评论 -
python读写文件
一.写入with open("E:/ac.txt", 'r', encoding='utf-8') as json_file: for line in json_file.readlines(): data_accu.append(line.strip('\n') )#这个只是去除两边的转义字符“\n”二.读入with open("E:/data_train.json", ...原创 2018-05-30 12:00:08 · 545 阅读 · 0 评论 -
python创建字典,并且排序
word_dict = {}#exclude_str = ",。!?、()【】<>《》=:+-*—“”…"for char in temp_pro: #for char in temp_pro[i]: #if char not in exclude_str: if char not in word_dict: # 为了去掉空白 ...原创 2018-05-30 11:55:34 · 450 阅读 · 0 评论 -
python对于excel和.txt的写入
1.对于数据量不是特别大的(<6055) import xlwtf_1 = xlwt.Workbook()sheet1 = f_1.add_sheet(u'sheet1', cell_overwrite_ok=True)sheet1.write(0, 0, "数据")sheet1.write(0, 1, "频数")for i in range(1,len(lw_key)+1):...原创 2018-05-30 11:53:26 · 522 阅读 · 0 评论 -
re模块-去掉某些符号python
1.去掉里面字符中间的一些特殊符号line.strip('\n')#只能去掉两端的某些符号acc_fact[i][j]= re.sub(r'["[",\]]', '', acc_fact[i][j])#去掉中间任意的“[]”原创 2018-05-30 11:45:12 · 4337 阅读 · 0 评论 -
plt里面的一些问题,python
1.解决plt画图的时候中文字体乱码的问题 import matplotlib.pyplot as pltfrom pylab import *zhfont1 = matplotlib.font_manager.FontProperties(fname='C:\Windows\Fonts\simkai.ttf')#解决中文乱码问题x=range(len(acc_key))#因为原始的里面存...原创 2018-05-30 11:40:22 · 456 阅读 · 0 评论 -
python以某个符号为分隔符或者分开re.split()或者re.findall()函数
也就是正则的分开或者寻找某个元素,使用正则模块比较容易操作原创 2018-06-12 15:32:54 · 5676 阅读 · 0 评论 -
Python去掉括号及其里面的内容(re模块)
python去掉括号之间的字符在字符串中识别括号并删除括号及其中的内容括号包括 大中小 3种括号 输入为 1个字符串 s="我是一个人(中国人)[真的]{确定}"; 输出为 result = "我是一个人"1.若括号为半角括号常见的英文(半角)符号如( ) 直接用正则匹配即可s="我是一个人(中国人)aaa[真的]bbbb{确定}"a = re.sub(u"\\(.*?\\)|\\{.*?}|\...转载 2018-06-12 14:59:52 · 50066 阅读 · 3 评论 -
python中的super()函数
转载自:https://blog.youkuaiyun.com/killeri/article/details/80717322最能感受到super函数的作用在于进行钻石继承的时候。 钻石继承:由一个基类衍生两个及以上的超类,然后在衍生,在类树的最底层生成一个子类,这样的类树结构就是一个类似 钻石外形,所以,最底层类继承称为钻石继承首先: 这是直接通过超类调用方法给子类使用class base...转载 2019-01-25 18:37:18 · 491 阅读 · 0 评论