- 博客(53)
- 收藏
- 关注

原创 我的另一个博客
csdn简直太坑了,下东西要用C币,改了规则以后C币基本上只能通过购买,而且挺贵的。我非常厌烦csdn这种行为,但是有一些资料无奈又必须从上面下载。有的时候为了下载一个东西,浪费太多太多的时间,无法专心来做技术。在淘宝上面买过csdn积分下载,但是这不是长久之计。 本来想要写一些文章,通过阅读量来刷一些C币,但是看了积分规则,已经没有这一选项。无奈只能上传一些自己写的小算法来坑害别人,这种开源的力...
2018-04-07 10:51:35
207
原创 csdn的糟糕体验
假如一个人想要在网上查找一些东西,很不幸它登上了csdn,接下来必定是一番糟糕的体验。1:疯狂的广告,简直不忍直视左侧的广告,最下边的广告,还有下面推荐栏当中插入的广告,总之广告无处不在。即使使用去广告插件以后,还有提示2:下面的登录提示按钮 假如你没有用csdn账号登录该网站,就会出现下面的图片,提示你登录3:阅读更多按钮 一篇文章稍微长一点,就会出现...
2018-11-10 16:09:30
594
原创 机器学习当中I函数代表什么意思?
机器学习算法推导当中,有的时候能看到一个函数 ,这个函数代表什么意思? 代表的是指示函数(indicator function)。它的含义是:当输入为True的时候,输出为1,输入为False的时候,输出为0。例如: ,表示当 不等于 的时候输出为1,否则输出为0。...
2018-08-13 16:10:51
15315
4
翻译 python 当中星号的作用
当星号出现在函数形参当中的时候,*代表接受元组tuple类型参数, **代表接受字典key-value参数。当星号出现在一个列表,或者元组前面的时候代表,将它们分解开来。 参考:python函数参数前面单星号(*)和双星号(**)的区别What does ** (double star/asterisk) and * (star/asterisk) do for para...
2018-08-08 22:17:23
1147
原创 python 二分查找
三种类型的二分查找,当查找的元素当中有重复的时候,第一种是返回中间的值,第二种返回的是最左边的值,第三种返回的是最右边的值。比如在[0,0,0,1,1,1,1,1,2,2]当中查找1,方法1结果是5, 方法二结果是3,方法三结果是7class Solution: def binary_search(self, nums, target): start = 0 ...
2018-08-02 12:08:54
790
原创 按照一个数的大小分裂数组,以及荷兰国旗问题
给定一个数组arr, 和一个数num, 请把小于等于num的数放在数组的左边, 大于num的数放在数组的右边。要求额外空间复杂度O(1), 时间复杂度O(N)。Python代码def split_array(arr, num): """维持一个小于等于区域的index, 如果一个数小于等于num,则和index位置交换 如果一个数大于num,则直接跳下一个 """...
2018-06-26 20:34:23
503
原创 小和问题
Java实现public class smallSum { public static int samllSumCount(int[] arr){ if (arr == null || arr.length <2){ return 0; } return mergeSort(arr, 0, arr.length...
2018-06-26 16:16:37
2139
1
原创 python sorted()和list.sort()的区别
What is the difference between `sorted(list)` vs `list.sort()`?list.sort改变了sort的值sorted可以对各种迭代器进行排序,并且不改变原来的值。
2018-06-25 22:07:38
1291
原创 python当中如何克隆一个列表
How to clone or copy a list?【python】正确复制列表的方法b = a #这种情况是将a和b放在同一个引用上了,不算是copyb = a.copy() #这个方法和下面的三个方法,虽然id(b) != id(a),但是里面的对象id是一样的b = a[:]b = list(a)b = copy(a) b = copy.deepcopy(a) #只有这种方法...
2018-06-25 22:06:02
4517
原创 给定一个double类型的浮点数base和int类型的整数exponent。求base的exponent次方。
Java解法public class countPower { public static double Power(double base, int exponent){ double res = 1; int n = 1; if (exponent > 0){ n = exponent; }...
2018-06-25 12:07:28
774
原创 输入一个整数,输出该数二进制表示中1的个数。其中负数用补码表示。
public class countOneNumber { //输入一个整数,输出该数二进制表示中1的个数。其中负数用补码表示。 public static int numberof1(int n){ /** * 应该让1左移,而是是让n右移,当n为负数的时候右移很坑的。 */ int count = 0; ...
2018-06-25 10:57:57
2142
原创 python 中的import
Python 的 import 机制python当中导入的顺序是这样的:导入当前目录下面的文件,导入系统sys.path路径的文件。一个文件可以当做脚本运行,也可以当做是模块运行。后者在运行的时候需要加-m。以脚本运行,相对导入会出错。以模块运行,相对导入会成功。...
2018-06-07 10:44:23
385
原创 os.mkdir和os.makedirs的区别
参考:os.mkdir() 和 os.makedirs() 的区别区别在于,os.makedirs会递归的建立输入的路径,即使是上层的路径不存在,它也会建立这个路径,而os.mkdir父级路径不存在,那么就会报错。...
2018-06-06 12:24:18
6591
1
原创 注释
对于注释的基本思想: 事实上,注释乃是下策,假如代码能够告诉我们这是什么,那么为什么还要多此一举的需要注释哪?所以这一思想才是非常重要的,注释总是为了挽救那些糟糕的代码。所以,上策乃是修改你的代码,让你的代码本身自带注释,当我们迫不得已的时候,我们才进行注释,我们运用注释的时候表示我们没有能力让我们程序自己说清楚这件事情,这就是对待注释的基本思想,因为在一个程序当中,你不可能长久的去维护注释,而...
2018-05-30 12:28:56
995
转载 python的with语句
来自IBM DeveloperWorkd的一篇文章, 介绍了上下文管理器,以及with as的运行原理。浅谈 Python 的 with 语句
2018-05-10 10:28:09
162
原创 错误 AttributeError: module 'copy' has no attribute 'copy' 的解决方法
出现这个错误的原因可能是在当前目录下面可能有名叫“copy”的文件。 删除它,就不会报这个错误了。参考:Pygame AttributeError: 'module' object has no attribute 'copy'...
2018-05-08 08:57:38
19838
4
原创 pyplot设置图像的信息
当使用pyplot设置图形的信息的时候,是设置当前图形,当前坐标轴的信息。画图:hist 直方图pie 饼图scatter 散点图bar 条形图boxplot 盒图polar 极坐标图violinplot 琴图-----------------------------------------------------------设置图形信息:title 设置图标------------------...
2018-05-04 21:39:12
919
原创 python warning
python当中要发出警告,那么需要通过warn函数。在warning control的过程当中有两个步骤:第一步是对于每个警告是否进行处理,这个时候使用的函数为filterwarnings()第二部是打印警告,这个时候使用的函数是showwarnning()如果先要忽略所有的警告,可以使用下面的方法:方法1:import warningswarnings.filterwarnings('ign...
2018-05-04 16:55:39
4273
原创 我已经掌握的机器学习算法
stacking votingsklearn当中使用的分类方法: sklearn.svm.SVC sklern.tree.DecisionTreeClassifier sklearn.ensemble.RandomForestClassifier sklearn.naive_bayes.GaussianNB sklearn.neighbors.KNeighborsClassifie...
2018-05-03 22:42:50
191
原创 概率图
概率图probability plot是用图形的方式来观察两个数据集的一种方式。主要分为p-p(Probability-Probability)图和q-q(Quantile-Quantile)图。 q-q图是使用分位数来比较数据。如果两个数据的累计概率密度 cumulative distribution function (CDF)知道,那么直接使用它的逆函数可以作为分位数的划分信息,因为逆...
2018-05-03 11:19:48
2087
原创 文后参考文献著录规则 GB/T 7714-2005
这个文库里面很全,mark一下文后参考文献著录规则[J] 期刊 [M] 专著 [C]论文集 [D]学位论文 [P]专利比如对于dwork的differential privac 这一篇文章引用论文《面向数据发布和分析的差分隐私保护》中:Dwork C. Differential Privacy//Proceedings of the 33rd International Colloquium...
2018-04-17 11:41:02
9277
原创 论文中的双斜杠是什么意思
参考文献中的双斜杠代表什么意思?双斜杠代表专著和其中的析出文献。 格式是: 专著的析出文献//专著。 其中析出文献代表的意思是从专著里面提取出来的文献。...
2018-04-17 11:22:38
17039
原创 程序中好的命名
1:选个好名字吧我们对变量进行命名,最主要的原因不是为了让机器能够更好的执行,机器说:我无所谓,只要正确就行。 我们是让人更好的去读程序。所以,如果一段代码里面都是xx, y, i,r之类的变量,那么过几天你自己都看不懂了,更不要说别人。所以看下面两段代码:本质上机器都可以执行,但是要让人看懂,显然后者成本更低:x = x -xxxxx = fido + salesTax( fido );x ...
2018-04-14 22:38:09
1030
原创 Python命名规则
原文来自这里: Naming Conventions总的规则 命名是给人看的,所以应该突出它的使用情况,而不是实现情况。也就是说,命名应该以问题为导向。命名风格 b 单个小写字母 B 单个大写字母 lowercase 小写情况 lower_case_with_underscores 带下划线的小写情况 UPPERCASE 大写情况 UPPER_CASE_WITH_UNDERS...
2018-04-14 20:44:27
4150
原创 各种机器学习算法
决策树算法的优缺点 copy from sklearn decision treeSome advantages of decision trees are:Simple to understand and to interpret. Trees can be visualised.Requires little data preparation. Other techniques often...
2018-04-11 10:00:42
334
原创 二元信息熵 python实现、绘图
import matplotlib.pyplot as pltfrom math import logimport numpy as np#计算二元信息熵def entropy(props, base=2): sum = 0 for prop in props: sum += prop * log(prop, base) return sum * -...
2018-04-06 23:08:55
3463
原创 使用graphviz画图
graphviz和dot的关系graphviz 是 graph visualization software的缩写,是由AT&T开源出来的软件,它使用dot语言来绘制图形。所以dot是graphviz下面的一个非常得力的工具。安装graphviz在官网上下载软件以后,在windowss上面配置环境变量即可使用使用dot命令绘制图形的一般格式如下:dot example.dot -Tpng ...
2018-04-06 17:03:34
1340
原创 latex常用公式总结
可以参考:常用数学符号的 LaTeX 表示方法前面的话:latex是一个文档排版系统,它和我们使用的word是一个等级的。而我为了编辑公式,只使用了latex中的数学模式,这只是latex的一小块内容,我们平时叫做latex公式,在这一个层面上,它和mathtype是一个等级的。我写博客的时候,还有在word中使用latex的时候,只是使用了这一小块内容,所以要搞清楚这之间的关系。避免有的时候搞混...
2018-04-05 11:04:52
45283
原创 matplotlib 当中 线段、标记、颜色的可选值
================ ===============================character description================ =============================== - solid line style 实线 -- das...
2018-04-03 11:48:43
1786
原创 Feature Engineering Made Easy全书总结
第二章总结 特征理解包含了哪些内容第三章总结 特征提升包含什么第四章总结 特征构造讲了什么第五章总结 特征选择讲了什么?第六章 特征转换讲什么?第七章 特征学习讲了什么?...
2018-04-02 14:47:11
1707
原创 第七章 特征学习讲了什么?
首先说一个问题,那就是我们上一章的PCA和LDA都是参数假设的。在PCA中我们最后的结果可以由原始数据通过一定的分解得到,也就是我们的参数是依赖我们的数据的。PCA和LDA都是线性转换。而特征学习当中不依赖这一假设,它和上一节的特征转换都属于特征提取的领域。本章主要介绍的是深度学习,神经网络,介绍了其中的受限布尔兹曼机RBM,使用sklearn中的neural_network 中的Bernoull...
2018-04-02 11:54:50
1849
原创 第六章 特征转换讲什么?
特征转换和前面的特征选择和特征构造都有点像,但是他们还是不一样的。特征转换讲的是如何从已有的信息里面构造出来有用的特征,如何用更少的特征来更好的描绘出来我们的模型。这里就涉及到了降维的概念。但是这和特征选择还是不一样的,特征选择是从我们已有的特征里面选择出来和目标值相关的特征,而特征转换是从已有的特征里面通过变换构造出来一些新的变量,然后选择更少的变量更好的描绘我们的模型。特征转换里面也有产生新的...
2018-04-02 11:08:28
847
原创 第五章总结 特征选择讲了什么?
特征选择是在众多的特征里面选择和我们的变量相关的特征,在这一章里面讲了很多的方法:第一个是使用相关系数来进行度量,相关系数越高,表明我们的特征和目标变量越相关。第二个是使用统计学当中的一些知识来进行检测。sklearn中的SelectKBest可以帮助我们完成特征选择的任务。常见的有卡方检测、方差检测等。 还有一些比如P值等。第三个是使用基于模型的特征选择方法。sklearn中的SelectFro...
2018-04-02 10:27:55
392
原创 第五章 几种模型的内存消耗情况对比
逻辑回归模型 在fit的时候需要在内存当中创建很大的矩阵,在预测时候直接将矢量相乘和相加。knn模型 在fit的时候把数据存储下来,基本不消耗时间,在预测的时候消耗时间。不标准化的数据容易影响knn模型。下面是几种模型的准确率和fit和predict时间对比。...
2018-03-30 21:48:02
1353
1
原创 第四章总结 特征构造讲了什么
1:分类数据填充。直接使用众数进行填充,使用value_counts方法。2:处理分类数据。 对于无序的分类数据,直接转化为虚拟变量。对于有序的分类变量,直接转化为label,即有序的数字即可。3:处理数值数据。对于数值数据,我们可以把它们切分开来,然后转化为有序的数字即可。4:对于数值类型的数据,可以使用多项式结合的方式进行扩展。5:最后介绍了如何处理文本数据。介绍了字袋模型还有Tf-idf方法...
2018-03-30 20:21:04
437
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人