
Python
文章平均质量分 72
诗蕊
Put your heart into it
展开
-
在Pandas中像写SQL一样做数据分析
在python中可以使用pandas包来进行类似SQL的数据查询,这篇文章就给出一些用pandas去做类似SQL的操作的例子。首先导入numpy和pandas包。import numpy as npimport pandas as pd本文使用tips数据集用来讲解类似SQL操作的例子,首先导入以DataFrame的形式的tips数据集url = 'https://raw.g原创 2018-01-13 23:12:10 · 17706 阅读 · 0 评论 -
面向对象封装案例
封装是面向对象编程的一大特点,面向对象编程的第一步就是将属性和方法封装到一个抽象的类中。外界使用类创建对象,然后让对象调用方法,而对象方法的细节都被封装在类的内部。在对象的方法内部是可以直接访问对象的属性的。1. 例如我们有如下需求:(1). 小明体重75.0公斤 (2). 小明每次跑步会减肥0.5公斤 (3). 小明每次吃东西体重增加1公斤 首先我们对需求进行分析,要完成以上需...原创 2018-09-02 12:38:28 · 1302 阅读 · 0 评论 -
Python-多态
面向对象的三大特性: 1. 封装:封装是根据职责将属性和方法封装到一个抽象类中,是定义类的准则,在python面向对象基础语法和面向对象封装案例中详细介绍过。 2. 继承:继承实现了代码的重用,相同的代码不需要重复的表现,同时当父类不能满足子类的需求时,可以在子类中对父类进行重新。 在 Python-继承单继承&多继承中介绍过。 3. 多态:多态实现了不同的子类对象调用相同的父类方法...原创 2018-09-08 09:52:22 · 501 阅读 · 0 评论 -
标签传播算法(Label Propagation Algorithm)
半监督学习(Semi-supervised Learning SSL)半监督学习是一种有监督学习和无监督学习想结合的一种方法,其主要思想是基于数据分布上的模型假设,利用少量的已标注数据进行指导并预测未标记数据的标记,并合并到标记数据集中去。标签传播算法的基本思路标签传播算法是基于图的半监督学习方法,基本思路是从已标记的节点的标签信息来预测未标记的节点的标签信息,利用样本间的关系,建...原创 2018-09-03 19:55:33 · 30598 阅读 · 10 评论 -
Python 学习笔记一
python 的运行:python 的执行与C或C++不同,C和C++可以直接编译成机器能够识别二进制的机器指令,运行效率会非常高。而Python是依赖解释执行器的,没有真正的生成计算机的机器指令,所以运行效率不高。 python的解释执行器: CPython(python3) :是由C语言写的 Jython:是由java写的 IronPython:是由.net写的...原创 2018-10-06 10:28:38 · 957 阅读 · 2 评论 -
python学习笔记二
列表的字符串文本解析方法split和joins.split(sep=None)将字符串使用sep作为分隔符分割s字符串,返回分割后的字符串的列表,当不给定参数时,用空白字符作为分隔符进行分割。s.join(iterable)用可迭代对象中的字符串,返回一个中间用s进行分割的字符串示例:s = 'beijing is capital'l = s.split(' ') ...原创 2018-10-10 16:34:30 · 796 阅读 · 0 评论 -
Pyhton学习笔记三
函数原创 2018-10-28 09:38:04 · 2235 阅读 · 0 评论 -
python 学习笔记四
文章目录装饰器 decorators装饰器 decorators函数装饰器是指装饰的一个函数,传入的是一个函数,返回的也是一个函数的函数函数装饰器的语法:def 装饰器函数名(参数):语句块return 函数对象被装饰函数的语法:@装饰器函数名def 函数名(形参列表):语句块示例:# 定义一个装饰器函数def mydeco(fn): def fx(): ...原创 2018-10-31 18:31:44 · 542 阅读 · 0 评论 -
Python学习笔记五
系统模块 sys系统模块全都是运行时系统相关的信息import syssys.path # 模块搜索路径 path[0] 是当前脚本程序的路径sys.modules # 已加载模块的字典sys.version # 版本信息sys.version_info # 版本信息的命名元组sys.platform # 操作系统平台名称信息sys.a...原创 2018-11-04 18:19:39 · 969 阅读 · 0 评论 -
Python学习笔记六
文章目录异常(exception)try语句的两种用法异常(exception)什么是错误:错误是指由于逻辑或语句等导致一个程序无法正常秩序的问题特点:有些错误是无法预知的什么是异常:异常是程序出错时标识的一种状态,当异常发生时,程序不会再向下执行,而转去调用此函数的地方待处理此错误并恢复为正常状态。异常的作用:(1) 通知上层调用者有错误产生需要处理(2) 用作信号try语句的两...原创 2018-11-08 09:37:17 · 795 阅读 · 0 评论 -
Python学习笔记七
字节串bytes和字节数组bytearray字节串bytes作用:存储以字节为单位的数据说明:字节串是不可变的字节序列,字节是0-255之间的整数创建空字节串的字面值:b’’b""b’’’’’’b"""&q原创 2018-11-15 12:45:14 · 813 阅读 · 0 评论 -
Python学习笔记九
文章目录迭代器函数的重写异常(with)环境管理器对象的属性管理函数运算符重载反向算术运算符的重载迭代器函数的重写迭代器:可以用next(it)函数取值的对象就是迭代器迭代器协议:迭代器协议是指对象能够使用next函数获取下一项数据,在没有下一项数据触发一个StopIterator来终止迭代的约定实现方法:类内需要有__next__(self)方法来实现迭代器协议语法形式:class...原创 2018-12-02 22:11:44 · 730 阅读 · 0 评论 -
RNN
文章目录循环神经网络与前馈神经网络的异同点RNN的展开模型基于时间的反向传播算法调整$W_y$所需的梯度计算:调整$W_s$所需的梯度计算:调整$W_x$所需的梯度计算循环神经网络与前馈神经网络的异同点循环神经网络的原则与前馈神经网络相同,但是也有以下两个主要区别,循环神经网络使用:1. 序列作为训练阶段的输入。2. 记忆要素存储是隐藏层神经与的输出,在接下来训练步骤中将作为网络的额外输入。...原创 2019-03-04 16:53:14 · 3277 阅读 · 0 评论 -
Python-继承(单继承&多继承)
面向对象有三大特性:封装、继承和多态 封装:根据职责将属性和方法封装到一个类中 继承:可以实现代码重用,相同的代码不需要重复编写 多态:不同的对象调用相同的方法,产生不同的执行结果,增加代码的灵活度为什么需要继承首先我们看以下的一个例子 我们有以下几个类:Animal:其中封装了drink, eat, run 和sleep四个方法, Dog:其中也封装了eat, drink, ...原创 2018-09-07 20:26:56 · 3531 阅读 · 0 评论 -
python面向对象基础语法
定义简单的类定义只包含方法的类class 类名: def 方法1(self, 参数列表): pass def 方法2(self, 参数列表): pass方法的定义格式几乎和函数一样,但是第一个参数必须是self, 类名的命名规则要符合大驼峰命名法并且类名第一个字母要大写 2. 创建对象对象变量 = 类名()简单的面向对象例...原创 2018-08-31 12:01:22 · 636 阅读 · 0 评论 -
线性回归(liner regression)原理及python实现
之前介绍过的神经网络属于分类,首先介绍一下分类和回归的区别:分类和回归主要区别在于Y变量,分类的Y变量通常是类别变量,例如性别、颜色、是否健康等;而回归的Y变量为连续数值型,如房价、降雨量等。线性回归有几种分类,我们从最简单的线性回归开始说。-简单线性回归(simple linear regression)简单线性回归通常就是包含一个自变量x和一个因变量y,这两个变量可以用一条直线来模拟。如原创 2018-01-07 21:51:27 · 19584 阅读 · 1 评论 -
TensorFlow——Session会话控制&Variable变量
这篇文章主要讲TensorFlow中的Session的用法以及Variable。Session会话控制Session是TensorFlow为了控制和输出文件的执行语句,运行session.run()就能获得运算结果或者部分运算结果。我们在这里使用一个简单的矩阵相乘的例子来解释Session的两个用法。 首先我们要加载TensorFlow并建立两个矩阵以及两个矩阵所做的运算。这里我们建原创 2018-01-30 22:27:33 · 7565 阅读 · 0 评论 -
Python 日期处理
下面的代码是根据业务需求整理的几个处理日期的方法。import datetimeclass DateTime(object): def __init__(self, input_date): self.input_date = input_date # input_date 的前一天 # 例如:输入的input_date = datetime原创 2018-01-18 14:32:07 · 11720 阅读 · 0 评论 -
用tensorflow建造一个简单的神经网络
reference:https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/3-2-create-NN/ 这篇文章主要讲怎样建造一个完整的神经网络,包括添加神经层,计算误差,训练步骤定义一个添加层神经层函数我们知道一个神经网络可能包含很多个隐藏层,所以如果我们定义一个添加层函数,在后面如果需要增加神经层就只原创 2018-02-02 17:33:40 · 6084 阅读 · 0 评论 -
神经网络预测结果可视化
在用tensorflow建造一个简单的神经网络中建立了一个简单的三层(输入层,隐藏层,输出层)的神经网络。这篇文章主要说怎样将我们构建的神经网络训练的过程以及结果可视化。 在用tensorflow建造一个简单的神经网络中建立神经网络的代码import tensorflow as tfimport numpy as npdef add_layer(inputs, in_size, ou原创 2018-02-02 19:15:37 · 11121 阅读 · 3 评论 -
逻辑回归(Logistic Regression)原理及Python实现
前面有讲过线性回归,但是很多非线性问题不能用简单的线性回归来分类。这时需要用到逻辑回归,逻辑回归是一种非线性的回归。原创 2018-01-14 23:16:35 · 18581 阅读 · 0 评论 -
numpy 100题
原网址:https://github.com/rougier/numpy-100/blob/master/100%20Numpy%20exercises.md# 100 numpy exercise# 题目来源于 https://github.com/rougier/numpy-100/blob/master/100%20Numpy%20exercises.md# 1. 导入nump...翻译 2018-02-09 14:11:42 · 4002 阅读 · 0 评论 -
TensorFlow计算模型——计算图
上图是tensorflow的一个基本构造图以及流向。tensorflow 由两个单词构成:tensor和flow,也就是张量和流,这个名字反映出了张量之间通过计算相互转换的过程。 TensorFlow计算模型——计算图 TensorFlow中每一个计算都是计算图上的一个节点,而节点之间的边描述了计算之间的依赖关系。 上图中每一个节点都是一个运算,而每一条边代表了计算之间的依赖关系。在上图原创 2018-01-28 23:21:05 · 8298 阅读 · 0 评论 -
MAC OS上安装XGBoost步骤
安装Python环境 MAC OS 已在带Python 2.7,此步请忽略。 安装Homebrew Homebrew类似于ubuntu中的apt-get和centos中的yum,是OSX里面的一个非常有用软件安装工具. 安装这个软件的目的在于更新gcc版本,官方文档中说最新的gcc版本才使XGBoost支持多线程。 直接将上述代码粘贴至终端即可安装,下同(除非特别说明)。/usr/bin...原创 2018-03-24 20:44:35 · 1097 阅读 · 0 评论 -
训练模型填充空值(fill null)的几种方法
我们在进行模型训练时,不可避免的会遇到某些特征出现空值的情况,下面整理了几种填充空值的方法1. 用固定值填充对于特征值缺失的一种常见的方法就是可以用固定值来填充,例如0,9999, -9999, 例如下面对灰度分这个特征缺失值全部填充为-99data['灰度分'] = data['灰度分'].fillna('-99')2. 用均值填充对于数值型的特征,其缺失值也可以用未缺失...原创 2018-05-11 13:03:19 · 16670 阅读 · 2 评论 -
Spark RDD (二)
在Spark RDD(一)https://blog.youkuaiyun.com/katherine_hsr/article/details/80743626中,介绍了RDD的原理,创建RDD和全局作用域和局部作用域,这里我们介绍一下RDD的操作(Operations)。 我们可以通过转换来调整数据集,包括映射、筛选、连接、转换数据集中的值。 RDD支持两种类型的操作:转换:是从一个已有的数据集中建立一个...原创 2018-06-22 11:52:27 · 387 阅读 · 0 评论 -
softmax函数和交叉熵损失函数
在CNN中,全连接层后会加上softmax函数,并且一般用交叉熵函数作为损失函数。这篇文章主要记录softmax把CNN的输出变成概率的过程以及交叉熵如何为优化过程提供度量,并且用python实现。softmax函数softmax函数将一个N维向量的输入的每一维都转换成区间维(0,1)之间的一个实数,公式如下: pi=eai∑Nk=1eakpi=eai∑k=1Nekap_i=\frac{...原创 2018-08-11 16:27:26 · 6785 阅读 · 0 评论 -
python进程(一)
文章目录多任务编程进程进程的优先级父子进程进程相关的函数os.getpid()os.getppid()os._exit(status)sys.exit([status])僵尸进程处理僵尸进程的方法os.wait()os.waitpid(pid, option)创建二级子进程处理在父进程中使用信号处理的方法,忽略子进程发来的信号孤儿进程多任务编程可以有效的利用计算机资源,同时执行多个任务进程...原创 2019-07-10 17:53:12 · 922 阅读 · 0 评论