- 博客(34)
- 资源 (4)
- 收藏
- 关注
原创 字符处理
1、判断是否为汉字:char = '我'print((char >= u'\u4e00') and (char <= u'\u9fa5'))输出:True
2019-08-01 10:56:24
291
原创 计数器
输入:from collections import Countercounter = Counter()for word in ['我', '是', '中国', '人', '我', '爱', '中国']: counter[word] += 1 print(counter)输出:Counter({'我': 2, '中国': 2, '是': 1, '人': 1...
2019-08-01 09:57:23
260
原创 Kafka安装配置
1、进入kafka官网,下载kafka最新版本。在Centos 7命令行下载:[root@172 software]# wget http://mirrors.tuna.tsinghua.edu.cn/apache/kafka/2.3.0/kafka_2.12-2.3.0.tgz2、解压下载的kafka压缩包。[root@172 software]# tar ...
2019-07-09 09:59:35
289
原创 neo4j安装及插件配置(附下载地址及插件版本对应)
一、操作步骤1、下载Neo4J社区版,将压缩包解压至安装目录(自己给定,如“E:\neo4j-community-3.5.6”)Windows:Linux:2、加入环境变量Windows:Linux:vi /etc/profile在最后加上以下代码:# neo4jNEO4J_HOME=/root/neo4j-community-3.5...
2019-07-01 11:02:13
2371
原创 cypher相关
一、查询语法1、单维度查询MATCH (node)-[relationship]->(node)WHERE (node|RELATIONSHIP)RETURN (node|RELATIONSHIP)举例:查询实体//n:Check的别名 LIMIT限制展示的节点数量MATCH (n:Check) RETURN n LIMIT 10查询关...
2019-06-27 18:04:57
409
1
原创 AC自动机字符串匹配——python代码实现
import ahocorasickdef build_actree(wordlist): actree = ahocorasick.Automaton() for index, word in enumerate(wordlist): actree.add_word(word, (index, word)) actree.make_automato...
2019-06-11 23:13:40
3573
1
原创 centos相关
1、监视NVIDIA的GPU使用情况$ watch -n 0.1 nvidia-smi每0.1s显示一次显存情况2、查找文件路径# 查找文件find / -name [file]# 查找文件夹find / -name [path] -type d# 查找内容find . | xargs grep -ri [content]# 只显示文件名称//find ....
2019-05-22 18:02:50
191
原创 docker相关
1、运行容器docker run -it centos2、保存对容器的更改在对容器更改后,新开一个cmdC:\Users\xiaoxy>docker psCONTAINER ID IMAGE COMMAND CREATED STATUS PORTS ...
2019-04-23 13:53:41
133
原创 json相关
1、将dict写入json文件(可成功写入中文)with codecs.open(r'state_urls.json', 'w', 'utf-8') as f: # type(state_urls) = dict f.write(json.dumps(state_urls, ensure_ascii=False)) print('state_urls写入成功!')...
2019-04-15 15:14:24
260
原创 xpath小技巧
1、选择当前节点下部分节点如:获取http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2018/11/01/01/110101001.html的“统计用区划代码”和“城乡分类代码”两列内容xpath = '//tr[@class="villagetr"]/td/preceding-sibling::*[1]/text()'获取http...
2019-04-14 21:34:08
336
原创 Pytorch使用小技巧
1、nn.Conv2d默认padding为'valid',如何设置为'same'?使用公式计算:o = output p = padding k = kernel_size s = stride d = dilationo = [i + 2*p - k - (k-1)*(d-1)]/s + 1参考网址:https://discuss.pytorch.org/t/how-...
2019-04-06 22:24:39
259
原创 pycharm快捷键
1、代码规范化:Ctrl+Alt+L2、函数加注释(insert docstring):将光标移在函数名或类名上,Alt+Enter,选中“Insert docstring”3、保存文件:Ctrl+S新建py文件自动生成注释、时间、作者:File-Settings-Editor-File and Code Templates-Python Script效果:...
2019-04-06 11:27:04
508
转载 eclipse pydev自动加辅助信息
1、新建py文件时自动加上创建时间、作者https://blog.youkuaiyun.com/wenyusuran/article/details/253824972、为函数自动加上参数注解create docstring功能将光标移至函数名上,快捷键:Ctrl+1。在弹出的浮窗中选择”Make docstring”。按Enter应用该功能。...
2019-03-23 20:47:23
364
原创 python文件读写
mode带'b'的表示二进制格式1、rb以二进制格式打开一个文件。当读取图片或进行文本传输时,需要转换为二进制格式。# mode='rb'# 'aaa.txt'内容为'我是一只猪猪侠'f = open('aaa.txt', mode='rb')content = f.read()print(content, type(content))f.close()输出:...
2019-03-22 22:56:42
308
原创 pip默认镜像地址
pip默认镜像地址:https://pypi.org/simple修改pip默认镜像源后,有的包可能只有默认源有。临时使用默认源安装:pip install [module] -ihttps://pypi.org/simple...
2019-03-19 17:47:30
32797
3
原创 函数——python
函数不定长参数加了星号(*)的变量名会存放所有未命名的变量参数。加了(**)会存放所有命名的变量参数示例def test(a,b,c,*tup_args,**dict_args): print(a) print(b) print(c) print(tup_args) print(dict_args)test(1,2,3,'a1','a2...
2019-03-16 22:34:14
312
原创 MySQL学习笔记
1.MySQL安装 Windows: 可执行文件: 点点点 压缩包: mysql.exe 客户端 放置任意目录 初始化 服务端:mysqld.exe 服务端初始化:cmd --> cd ...
2018-12-25 21:16:12
152
原创 机器学习笔记(七):SVM
一、前导1、最优化问题最优化问题一般是指对于某一个函数而言,求解在其指定作用域上的全局最小值问题,一般分为以下三种情况(备注:以下几种方式求出来的解都有可能是局部极小值,只有当函数是凸函数的时候,才可以得到全局最小值):①无约束问题:求解方式一般求解方式梯度下降法、牛顿法、坐标轴下降法等;②等式约束条件:求解方式一般为拉格朗日乘子法拉格朗日乘子法求解③不等式约...
2018-10-11 22:41:46
1975
原创 梯度下降法python+numpy实现
批量梯度下降法(Batch Gradient Descent, BGD):使用所有样本在当前点的梯度值来对变量参数进行更新操作。随机梯度下降法(Stochastic Gradient Descent, SGD):在更新变量参数的时候,选取一个样本的梯度值来更新参数。小批量梯度下降法(Mini-batch Gradient Descent, MBGD):集合BGD和SGD的特性,从原...
2018-10-11 16:28:05
2805
1
原创 数据结构与算法LeetCode刷题(Python)
参考资料:1、《面试算法LeetCode刷题班》 - 小象学院2、csujedihy / lc-all-solutions一、链表 1. 链表的必备知识要点(包括基础知识、刷题中使用的STL等知识) 2. 链表逆序(LeetCode 92 ,206. Reverse Linked List 1,2) 3. 求两个链表的交点(LeetCod...
2018-10-07 11:59:37
1824
原创 机器学习笔记(六):聚类算法
一、聚类算法总括1.1 定义对大量未标注的数据集按数据内部存在的数据特征划分为多个不同类别,使类别内数据比较相似,类别间数据相似度比较小。1.2 和分类算法区别分类算法:有监督学习聚类算法:无监督学习1.3 样本相似度度量1.3.1 闵可夫斯基距离(Minkowski)a. p=1:曼哈顿距离b. p=2:欧氏距离(常用)c. p为无穷大:切比雪...
2018-10-03 20:46:51
1332
原创 数据结构与算法(Python)学习笔记
一、引入概念1、学习数据结构与算法的必要性没有看过数据结构和算法,有时面对问题可能会没有任何思路,不知如何下手去解决;大部分时间可能解决了问题,可是对程序运行的效率和开销没有意识,性能低下;有时会借助别人开发的利器暂时解决了问题,可是遇到性能瓶颈的时候,又不知该如何进行针对性的优化。如果我们常看兵法,便可做到胸有成竹,有时会事半功倍!同样,如果我们常看数据结构与算法,我们写程序时也能游刃有...
2018-10-01 11:41:58
1335
原创 数据不平衡:下采样、上采样python代码实现
一、下采样所有数据存在DataFrame对象df中。数据分为两类:多数类别和少数类别,数据量相差大。数据预处理已将多数类别的Label标记为1,少数类别的Label标记为0。从多数类中随机抽取样本(抽取的样本数量与少数类别样本量一致)从而减少多数类别样本数据,使数据达到平衡的方式。import numpy as npimport pandas as pddef lower_sam...
2018-09-29 16:02:17
24638
2
原创 机器学习笔记(三):决策树
ID3、C4.5、CART分类树算法总结决策树剪枝:①前置剪枝:API自带前置剪枝,实践证明这种策略无法得到比较好的结果②后置剪枝:分类树和回归树决策树可视化...
2018-09-25 08:31:10
191
原创 机器学习笔记(一):回归算法
目标函数和损失函数是一样的,概念不一样。目标函数是模型优化过程中方向考虑的函数,损失函数是构建好的模型的损失值:预测值和实际值之间的差距的体现函数。目标函数批量梯度下降BGD随机梯度下降SGD小批量梯度下降法MBGD ...
2018-09-25 08:29:00
167
原创 机器学习标准化处理小技巧
数据标准化StandardScaler (基于特征矩阵的列,将属性值转换至服从正态分布)标准化是依照特征矩阵的列处理数据,其通过求z-score的方法,将样本的特征值转换到同一量纲下常用与基于正态分布的算法,比如回归数据归一化MinMaxScaler (区间缩放,基于最大最小值,将数据转换到0,1区间上的)提升模型收敛速度,提升模型精度常见用于神经网络Normalizer...
2018-07-09 16:18:28
480
原创 pip install pyltp报错解决办法
报错一:error: Microsoft Visual C++ 14.0 is required. Get it with “Microsoft Visual C++ Build Tools”: http://landinghub.visualstudio.com/visual-cpp-build-tools笔者安装Microsoft Visual C++ 14.0后,依然不能顺利安装pyltp,...
2018-07-06 21:35:20
5287
3
原创 pandas小技巧
1、更改列的数据类型①一列:pd.to_numeric(s)②多列:df[['a','b']] = df[['a','b']].apply(pd.to_numeric)2、将DataFrame中数据进行标签编码,实现与sklearn.processing.LabelEncoder相同的效果In[3]: pd.Categorical(['a', 'c', 'b',...
2018-07-03 21:08:51
400
原创 Matplotlib小技巧
案例一小技巧:1、曲线上两点连线2、曲线上两点标注3、坐标轴范围设置import numpy as npimport matplotlib.pyplot as pltif __name__ == '__main__': x = np.arange(0, 3.01, 0.01) y = np.log(x) plt.plot(x, y, 'r-', lw=3, label=...
2018-06-26 23:09:32
597
pyltp whl文件——python3.6版
2018-07-06
pyltp whl文件——python3.5版本
2018-07-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人