- 博客(32)
- 收藏
- 关注
原创 【Python数据分析之pandas06】层次化索引
层次化索引 Pandas层次化索引将对象的索引分层,以便调用。s1 = pd.Series(range(1,11),index=[['a','a','a','b','b','b','c','c','d','d'],[1,2,3,1,2,3,1,2,2,3]])s1'''a 1 1 2 2 3 3b 1 4 2 5 ...
2018-03-19 17:20:48
570
原创 【Python数据分析之pandas05】处理缺失化数据
首先,Python用.isnull的方法判断对象元素是否为NaN(缺失值)。s1 = pd.Series(['one','two',np.nan,'three'])s1.isnull()'''0 False1 False2 True3 Falsedtype: bool''' 之前提到了一种填充缺失值的方法是重新索引时修改其method属性,这...
2018-03-18 13:38:34
318
原创 【Python数据分析之pandas04】数学方法
统计与汇总 pandas对象的统计基本与numpy的数学方法差不多,不过pandas数组都是基于没有缺失数据的情况下构建的,即当对象中存在NAN值的时候,NaN值将会被自动排除,除非整个切片或对象都是NaN。 pandas对象的sum方法:data = pd.DataFrame([[1.4,np.nan],[7.1,-4.5],[np.nan,np.nan],[0.75,-1.3]])...
2018-03-17 14:55:17
436
原创 重归算法
既然决定在这条路上走过去,就不得不面对这座大山。今后尽量保证每天都做题,遇到不同类型的题目就放上来,也为自己今后考研面试或者工作面试提供些许帮助。 第一天,上手一个简单的。 给定一个序列,求其最长连续子序列的和。#include <stdio.h>#include <string.h>#include<iostream>using na...
2018-03-17 11:05:19
216
原创 【Python数据分析之pandas03】数据结构的基本功能--2
算数运算和数据对齐 pandas一个强大的功能是,它可以对不同索引的对象进行算数运算。s1 = pd.Series([1,2,3,4],index=['a','b','c','d'])s1'''a 1b 2c 3d 4dtype: int64'''s2 = pd.Series([4,78,32,89,61],index=['a','b','e',...
2018-03-16 18:04:50
246
原创 【Python数据分析之pandas02】数据结构的基本功能--1
重新索引 Series和DataFrame在创建时可以对其index属性进行修改(DataFrame中index修改行属性)。创建后需要对index修改需要用到reindex方法。s1 = pd.Series([1,2,3],index=['c','a','b'])s1.reindex(['a','b','c'])'''结果:a 2b 3c 1dtype: ...
2018-03-15 19:30:46
242
原创 【Python数据分析之pandas01】两个常用的数据结构
Series - series可以看做是一个定长的有序字典,与一维数组形式相同,区别是series的索引可以是任意数据类型。 - series本身拥有一个name属性,它的index也有自己的name属性(这条性质为下文中series传入DataFrame提供基础)。 - 传入:可以传入一维数组或字典。传入时,可以修改其索引。#导入数组a = np.array([1,2,3,4...
2018-03-15 08:48:53
301
原创 【Python数据分析之Numpy03】线性代数
线性代数相关函数 一下所列的函数都包含在numpy.linalg函数里 diag:返回对角线元素或将一维数组转化为方阵。np.diag([1,2,3,4,5])'''array([[1, 0, 0, 0, 0], [0, 2, 0, 0, 0], [0, 0, 3, 0, 0], [0, 0, 0, 4, 0], [0, 0,...
2018-03-12 19:02:10
172
原创 【Python数据分析之Numpy02】利用数据进行数据处理
矢量化计算 概念是:用数组表达式代替循环。 例:计算点(x,y)到原点的长度。首先介绍一个函数,np.meshgrid(*x,*y)。这个函数接收两个数组*x,*y,对于这两个数组上的所有元素,进行一一对应,生成两个矩阵,两个矩阵相同位置上的元素就是点的x和y坐标。points = np.arange(-5,5,0.01,dtype=np.float64)xs,ys = np.mes...
2018-03-11 18:12:08
223
转载 计算机专业要不要考研
这个问题困扰了我很久很久,所幸看到这篇文章。不能说茅塞顿开,但总算不至于在黑暗中苦苦摸索。特此转载,与和我有相同困扰的大学生们分享。 你说:“他们都有很强的开发能力,只是不太喜欢读书,也只是希望混个学历对今后在岗位上晋升有好处”,我可以向你保证,你所说的人绝对不是开发能力很强的人。因为,1)高手不可能不喜欢读书;2)高手不可能想去混一个学历;3)高手不可能认为晋升是因为学历的原因。 ...
2018-03-11 16:37:50
6054
原创 【Python数据分析工具之Numpy01】数组创建ndarray
创建数组 np.array(*list):以list创建一个数组list1 = [1,2,3,4,5]arr1 = np.array(list1)print(arr1)//输出结果:[1 2 3 4 5] np.empty(*shape):创建一个没有任何具体值的数组(但是数组里的值并不是0,而是一些未初始化的垃圾值)arr1 = np.empty((3,3))arr1''...
2018-03-09 21:09:34
308
原创 【机器学习数学基础之概率论与统计05】多元随机向量及其分布
几种常见的分布 联合分布 联合分布很难描述清楚,智能给出概念。但是在相互独立的随机变量中,它们联合分布是它们各自分布的乘积。 对于连续型随机变量,加上积分就可以了。 边缘分布 在二维情况下的直观解释: 条件分布 二维情况下的条件分布: 实际上,贝叶斯公式可以由条件概率和全概率公式得出。 由二维推广到多维的条件概率的链规则: 贝叶...
2018-03-08 11:02:19
1026
原创 【机器学习数学基础之概率论与统计04】非参数估计
非参数估计指不知道分布类型,对样本进行模型估计。一般只用在一维和二维。直方图估计 具体概念详见课件: 直方图与初高中所理解的直方图没什么不同,直方图估计...
2018-03-07 20:52:52
402
原创 【机器学习数学基础之概率论与统计03】抽样分布
两个概念 独立同分布样本:当X1,X2,...,Xn相互独立且具有相同的分布函数F的时候,称X1,X2,...,Xn为独立同分布样本,记为X1,X2,...,Xn ~ F. 抽样分布:X1,X2,...,Xn为独立同分布样本(IID),其均值和方差为μ和σ²。那么对于这些样本有样本均值 ,即求平均值。因为每个Xi都是随机变量,所以样本均值也是随机变量,对样本均值进行分布描述,那么该分布...
2018-03-07 16:10:17
1385
原创 【机器学习--线性回归01】线性回归模型
等了很久,终于进入机器学习环节了。开始前只想说一句话:数学一定一定要学好!!!没有学完概率的我今天开头真的是看的昏昏欲睡,就算是现在也只能大概理解其原理,等抓紧时间学完概率,再来好好咀嚼一下这部分内容。最后给自己一碗鸡汤:从菜鸟走向大神,这是道路。目标函数 对于线性回归模型,它的目标函数一般包括两部分:损失函数和正则项。 在回归...
2018-03-06 23:01:09
490
原创 【机器学习数学基础之概率论02】随机变量的分布函数及单值
连续性随机变量的分布函数 分布函数(CDF):F(x)=P(X≤x) 概率密度(pdf):p(a<x≤b)=∫(a,b)p(x)dx 两者关系:p(x)=F'(x) *连续性随机变量在某一点的概率均为0 *对于连续性随机变量的概率密度,可以简单理解为概率离散型随机变量的分布函数 分布函数(CDF):F(x)=P(X≤x) 概率质量...
2018-03-06 08:38:20
499
原创 【机器学习数学基础之概率论01】贝叶斯公式
概率的三个公理 1.事件A的概率是一个非负实数:P(A)≥0。 2.合法命题(必然事件)的概率为1。 3.对两两不相交(互斥)事件,有。条件概率 联合概率:P(A,B)=P(A|B)*P(B) 条件概率:P(A|B)=P(A,B)/P(B) *给定任意B,若P(B)>0,则P(·|B)也是一个概率,即满足概率的三个概率公理: 1...
2018-03-05 21:22:43
337
原创 【机器学习数学基础之矩阵03】线性回归
线性回归(最小二乘法) 一维模型:对于直角坐标系中一系列样本点(x,y),找到合适的a,b,使得f(x)=ax+b成立,并且f(x)~=y。实际上,线性回归的过程就是寻找a,b的过程,而判定最优解的方法就是寻找误差最小值,即: 。arg min是机器学习术语,表示让arg成立的min的值。 根据矩阵求导相关知识求出一维模型的解: 。 多维模型:对于一系列样本点(x,y), 找到...
2018-03-05 08:53:44
383
原创 【机器学习数学基础之矩阵02】矩阵求导
多元函数导数 对于n维函数 ,y本身没有导数,但其对于每一个分量都有偏导,于是有如下定义: 梯度向量:,其性质类似与一元函数的一阶导。 Hessian矩阵: *值得注意的是,因为偏导顺序不影响结果,所以Hessian矩阵是一个实对称矩阵。最速下降法 最初看这个内容的时候迷迷糊糊的,但实际上很简单的一个东西。最速下降法在一元函数中是指沿着...
2018-03-04 22:29:29
3081
原创 【机器学习数学基础--矩阵01】线性空间
范数 定义:是一个描述线性空间的度量,可以理解为二维空间的长度。 如||x1-x2||表示向量x1,x2之间的距离。 *Frobenius范数:机器学习常用范数。 即:矩阵所有元素先取平方和,再开平方。特征分解 特征值:满足公式: ,其中 λ 为特征值,x为A的对应于λ的特征向量。 特征分解:公式: ,其中,P是A所有特征向量展开组成的矩阵。 ...
2018-02-27 15:42:56
603
原创 【微信公众平台04】自定义菜单
首先自定义菜单需要获取access_token,由于access_token有效时间仅为两个小时,因此,我们需要将其封装成函数,为今后的开发省去麻烦。class wxcommon{ public static function getToken(){ $url="https://api.weixin.qq.com/cgi-bin/token?grant_type=client_cr...
2018-02-24 16:54:01
182
转载 分享一篇激动人心的文章
看完这篇文章我只有一个感觉:在人工智能这条路上任重道远,未来等着我的是一篇光明和一片荆棘;我渴望这片荆棘,因为我向往着光明。 分享这篇文章,希望那些和我一样渴望在未来人工智能领域闯出一片天地,但又对未来不知所错的人一个小小的引路。这篇文章或许称不上圣经,但绝不是鸡汤文。希望你我一同勉励。 AI 领域最最稀缺的人才——人工智能架构师...
2018-02-23 23:02:00
956
原创 【Python全栈06】汉诺塔
首先补充两个没碰到过的函数。eval()和exec()函数 作用: eval():将一个字符串当作代码来执行并返回执行结果。 exec():将一个字符串当作代码来执行但不返回执行结果。汉诺塔cnt = 0def hano(n,a,b,c,): global cnt if(n==1): cnt+=1 prin...
2018-02-23 22:52:48
162
原创 【Python全栈05】函数与参数
前面忘了说了,由于我是在网易云课堂图灵学院上学Python的,很多内容都是借鉴上面讲义的,也借此帮图灵学院宣传一波,课程免费,学的又很系统,老师讲的很好! 广告结束,开始正文。函数和参数两个我合起来写,以例子为主,Python的函数参数设置感觉比C++和Java好用多了。普通参数def func(name,age): print("我的名字是{0}\n我今年{1}岁了".fo...
2018-02-23 01:50:18
176
原创 【微信公众平台03】自动回复
之前尝试开发的过程中,遇到了很多困难,究其原因,还是对代码原理不甚了解,也没学过php相关知识,于是打算回过头来,一步一步再浅析一下相关文件。 weixin.class文件主要作用是自动回复消息,我不是用上一篇推荐的SDK版本,可能现在用的这个版本更合我胃口,也更好理解,具体解析写在代码注释里吧。 <?phprequire 'weixin.config.php';$w...
2018-02-22 21:18:38
302
原创 【Python全栈04】基本语法——循环
循环这里和c语言基本相同,直接做例子吧。一、打印空心矩形#打印空心矩形length = input("请输入矩形的长:")width = input("请输入矩形的宽:")length = int(length)width = int(width)for i in range(width): if i==0 or i==width-1: for j in ...
2018-02-22 18:38:33
257
原创 【Python全栈03】基本语法——运算符
算数运算符 加减乘除:+、-、*、/ *这里与其他语言基本相同,唯一值得一提的是Python3.x里的‘/’是传统数学意义上的除法(即有带小数)。 取余:% 取整:// 幂运算:** *注意:Python没有++,--运算符!比较运算符 等于、不等于:==,!=赋值运算符 赋值:=,+=,-=,*=,/=......逻辑运算符 ...
2018-02-21 22:07:38
164
原创 【微信公众平台02】云服务器搭建及url配置
其实如果真的要做微信公众号开发,那就得自己搭建一个服务器。但由于目前只在摸索阶段,用新浪云百度云就够了。下面我大致讲讲百度云的注册和购买。 首先,登陆到百度云,点击应用引擎BAE(用这个就够了)。接下新人添加部署具体需要做什么我也忘了,不过应该都是些小事,反正只要找到添加部署这个按键就可以了。 类型选php-5.5,代码版本我选的是svn,域名可以自己取. 最后付...
2018-02-21 11:56:43
3844
原创 【微信公众平台开发01】微信测试号注册
因为最近开发一个小项目,需要用到微信开发知识,由于真的是一窍不通,走了很多弯路。有段时间真的是焦头烂额,项目进度也停滞不前。希望借这一系列的文章让自己重新梳理一下过程,顺便记录一下不会的东西。 我直接开始说测试号是因——公众号认证实在是太太太太.......太麻烦了,还要钱,对于我这样的穷苦大学生来说实在是不划算。测试号的有效期是一年,足够我开发测试使用了。测试号的注册很简单,只要有...
2018-02-21 00:50:12
1028
原创 【Python全栈02】基本语法--变量
一、变量命名规则 Python变量命名规则与其他语言基本相同,有如下几点: 1.变量命名可以包含数字,大小写字母,下划线或更多,但不推荐使用其他符号。 *数字不能作开头,如 4man 是不可以的。 2.不建议使用下划线开头的变量名,因为它们一般具有特殊含义。 *如 _age, __name,理论上可以,但不推荐。 ...
2018-02-20 22:05:32
164
原创 【Python全栈01】基本语法-“Hello world”又来了!
本来想写一个环境配置章节的,但是深感能力不够,很可能误认子弟,于是给大家贴一个地址,方便大家学习。 http://www.cnblogs.com/zhouzhishuai/p/8401103.html 这个博客是我图灵学院周志帅老师开的,很适合对Python感兴趣的人学习,大家可以常去看看。 除了这个博客上写的anaconda之外,大家还可以用Python官网的IDLE,...
2018-02-20 20:18:52
188
原创 仅以此博客勉励自己
作为一个刚接触编程一年多的小白,相信这个博客应该是没有人光顾的。 创建这个博客的目的呢,既希望能为自己未来就业做一些打算,也是鞭策自己不断改善。至少在这个思路整理的过程中,能更清楚地梳理学习内容或者项目,不至于学的乱糟糟的。当然,如果将来有幸能成为众多编程大佬的其中一个,也希望这些总结能帮助到那些和我一样曾在苦海中挣扎的人。 我的文章类型并不固定,完全取决于自己目前的学习状况。...
2018-02-20 12:19:57
214
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人