自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 收藏
  • 关注

原创 类与对象︱Python学习笔记

类与对象 1. 对象 = 属性 + 方法 对象是类的实例。换句话说,类主要定义对象的结构,然后我们以类为模板创建对象。类不但包含方法定义,而且还包含所有实例共享的数据。 封装:信息隐蔽技术 我们可以使用关键字 class 定义 Python 类,关键字后面紧跟类的名称、分号和类的实现。 【例子】 class Turtle: # Python中的类名约定以大写字母开头 """关于类的一个简单例子""" # 属性 color = 'green' weight = 10

2020-08-05 22:00:01 197

原创 函数与Lambda表达式︱Python学习笔记

函数与Lambda表达式 1. 函数 还记得 Python 里面“万物皆对象”么?Python 把函数也当成对象,可以从另一个函数中返回出来而去构建高阶函数,比如: 参数是函数 返回值是函数 函数的定义 函数以def关键词开头,后接函数名和圆括号()。 函数执行的代码以冒号起始,并且缩进。 return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。 def functionname(parameters): "函数_文档字符串" fu

2020-08-02 21:09:29 207

原创 序列︱Python学习笔记

序列 在 Python 中,序列类型包括字符串、列表、元组、集合和字典,这些序列支持一些通用的操作,但比较特殊的是,集合和字典不支持索引、切片、相加和相乘操作。 1. 针对序列的内置函数 list(sub) 把一个可迭代对象转换为列表。 【例子】 a = list() print(a) # [] b = 'I Love LsgoGroup' b = list(b) print(b) # ['I', ' ', 'L', 'o', 'v', 'e', ' ', 'L', 's', 'g', 'o',

2020-07-31 20:16:02 234

原创 列表︱Python学习笔记

列表 列表 简单数据类型 整型<class 'int'> 浮点型<class 'float'> 布尔型<class 'bool'> 容器数据类型 列表<class 'list'> 元组<class 'tuple'> 字典<class 'dict'> 集合<class 'set'> 字符串<class 'str'> 1. 列表的定义 列表是有序集合,没有固定大小,能够保存任意数量任意类型的 Python 对

2020-07-28 20:29:10 179

原创 异常处理︱Python学习笔记

异常处理 异常就是运行期检测到的错误。计算机语言针对可能出现的错误定义了异常类型,某种错误引发对应的异常时,异常处理程序将被启动,从而恢复程序的正常运行。 1. Python 标准异常总结 BaseException:所有异常的 基类 Exception:常规异常的 基类 StandardError:所有的内建标准异常的基类 ArithmeticError:所有数值计算异常的基类 FloatingPointError:浮点计算异常 OverflowError:数值运算超出最大限制 ZeroDivision

2020-07-24 21:11:04 117

原创 条件语句︱Python学习笔记

条件语句 1. if 语句 if expression: expr_true_suite if 语句的 expr_true_suite 代码块只有当条件表达式 expression 结果为真时才执行,否则将继续执行紧跟在该代码块后面的语句。 单个 if 语句中的 expression 条件表达式可以通过布尔操作符 and,or和not 实现多重条件判断。 【例子】 if 2 > 1 and not 2 > 3: print('Correct Judgement!') #

2020-07-23 20:01:39 125

原创 变量、运算符与数据类型︱Python学习笔记

变量、运算符与数据类型 1. 注释 在 Python 中,# 表示注释,作用于整行。 【例子】单行注释 # 这是一个注释 print("Hello world") # Hello world ''' ''' 或者 """ """ 表示区间注释,在三引号之间的所有内容被注释 【例子】多行注释 ''' 这是多行注释,用三个单引号 这是多行注释,用三个单引号 这是多行注释,用三个单引号 ''' print("Hello china") # Hello china """ 这是多行注释,用三个双引号

2020-07-22 21:02:58 161

原创 Pandas基础|综合练习︱Python学习笔记

端午节的淘宝粽子交易 (1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。 (2) 商品标题带有“嘉兴”但发货地却不在嘉兴的商品有多少条记录? (3) 请按照分位数将价格分为“高、较高、中、较低、低”5 个类别,再将 类别结果插入到标题一列之后,最后对类别列进行降序排序。 (4) 付款人数一栏有缺失值吗?若有则请利用上一问的分类结果对这些缺失 值进行合理估计并填充。 (5) 请将数据后四列合并为如下格式的 Series:商品发货地为 ××,店铺为 ××,共计 ×× 人付款,单价为 ××。

2020-07-01 23:11:40 222

原创 方差分析|概率统计学习笔记

方差分析 1 概要 方差分析(Analysis of variance, ANOVA) 主要研究分类变量作为自变量时,对因变量的影响是否是显著的。 方差分析的方法是由20世纪的统计学家Ronald Aylmer Fisher在1918年到1925年之间提出并陆续完善起来的,该方法刚开始是用于解决田间实验的数据分析问题,因此,方差分析的学习是和实验设计、实验数据的分析密不可分的。 实验设计和方差分析都有自己相应的语言。因此,在这里我们通过一个焦虑症治疗的实例,先了解一些术语,并且思考一下,方差分析主要用于解决

2020-06-29 22:48:06 1359

原创 Pandas基础|时序数据︱Python学习笔记

第9章 时序数据 import pandas as pd import numpy as np 一、时序的创建 1. 四类时间变量 现在理解可能关于③和④有些困惑,后面会作出一些说明 名称 描述 元素类型 创建方式 ① Date times(时间点/时刻) 描述特定日期或时间点 Timestamp to_datetime或date_range ② Time spans(时间段/时期) 由时间点定义的一段时期 Period Period或period_range ③ Date off

2020-06-29 22:39:41 335

原创 Pandas基础|分类数据︱Python学习笔记

第8章 分类数据 import pandas as pd import numpy as np df = pd.read_csv('data/table.csv') df.head() School Class ID Gender Address Height Weight Math Physics 0 S_

2020-06-28 21:50:47 253

原创 常见分布与假设检验|概率统计学习笔记

3 常见分布与假设检验 文章目录3 常见分布与假设检验1 一般随机变量1.1 随机变量的两种类型1.2 离散型随机变量1.3 连续型随机变量2 常见分布2.1 离散型分布2.1.1 二项分布(Binomial distribution)2.1.2 泊松分布(Poisson distribution)2.1.3 二项分布,泊松分布,正态分布的关系2.1.4 其他离散型随机分布几何分布(Geometric distribution)负二项分布(Negative binomial distribution)超几何

2020-06-27 23:03:01 592

原创 Pandas基础|文本数据︱Python学习笔记

第7章 文本数据 import pandas as pd import numpy as np 一、string类型的性质 1. string与object的区别 string类型和object不同之处有三: ① 字符存取方法(string accessor methods,如str.count)会返回相应数据的Nullable类型,而object会随缺失值的存在而改变返回类型 ② 某些Series方法不能在string上使用,例如: Series.str.decode(),因为存储的是字符串而不是字节

2020-06-26 22:18:44 356

原创 数理统计与描述性统计|概率统计学习笔记

typora-root-url: tupian 文章目录typora-root-url: tupian一、数理统计概念1.基本概念释义2.统计量与抽样3.常用的统计量二、描述性统计1.数据集中趋势的度量2. python实现3.数据离散趋势的度量4.python实现5. 分布特征6.偏度与峰度7. 公式与python实现 一、数理统计概念 1.基本概念释义 定义:在数理统计中,称研究对象的全体为总体,通常用一个随机变量表示总体。组成总体的每个基本单元叫个体。从总体 XXX 中随机抽取一部分个体 X1,.

2020-06-24 09:46:59 369

原创 Pandas基础|缺失数据︱Python学习笔记

第6章 缺失数据 在接下来的两章中,会接触到数据预处理中比较麻烦的类型,即缺失数据和文本数据(尤其是混杂型文本) Pandas在步入1.0后,对数据类型也做出了新的尝试,尤其是Nullable类型和String类型,了解这些可能在未来成为主流的新特性是必要的 import pandas as pd import numpy as np df = pd.read_csv('data/table_missing.csv') df.head() School

2020-06-23 15:35:16 371

原创 随机事件与随机变量|概率统计学习笔记

一、随机事件 1.基本概念释义 现实生活中,一个动作或一件事情,在一定条件下,所得的结果不能预先完全确定,而只能确定是多种可能结果中的一种,称这种现象为随机现象。 ​ 例如,抛掷一枚硬币,其结果有可能是出现正面,也有可能是出现反面;掷骰子游戏中,出现的数字可能是1,2,3,4,5,6其中的任意一个。以上这些现象都是随机现象。 使随机现象得以实现和对它观察的全过程称为随机试验,记为**EEE**。随机实验满足以下三个条件: 可以在相同条件下重复进行; 结果有多种可能性,并且所有可能结果事先已知

2020-06-21 10:53:52 472

原创 零基础入门cv04︱Python学习笔记

Datawhale 零基础入门CV赛事-Task5 模型集成 在上一章我们学习了如何构建验证集,如何训练和验证。本章作为本次赛题学习的最后一章,将会讲解如何使用集成学习提高预测精度。 5 模型集成 本章讲解的知识点包括:集成学习方法、深度学习中的集成学习和结果后处理思路。 5.1 学习目标 学习集成学习方法以及交叉验证情况下的模型集成 学会使用深度学习模型的集成学习 5.2 集成学习方法 在机器学习中的集成学习可以在一定程度上提高预测精度,常见的集成学习方法有Stacking、Bagging和Boost

2020-06-02 22:15:11 234 1

原创 零基础入门cv04︱Python学习笔记

Datawhale 零基础入门CV赛事-Task4 模型训练与验证 在上一章节我们构建了一个简单的CNN进行训练,并可视化了训练过程中的误差损失和第一个字符预测准确率,但这些还远远不够。一个成熟合格的深度学习训练流程至少具备以下功能: 在训练集上进行训练,并在验证集上进行验证; 模型可以保存最优的权重,并读取权重; 记录下训练集和验证集的精度,便于调参。 4 模型训练与验证 为此本章将从构建验证集、模型训练和验证、模型保存与加载和模型调参几个部分讲解,在部分小节中将会结合Pytorch代码进行讲解。 4

2020-05-30 21:16:26 186

原创 零基础入门cv03︱Python学习笔记

1.卷积神经网络(CNN)介绍 一类特殊的人工神经网络,是深度学习中一个重要分支。 较传统计算学习算法,精度和速度较高 在计算机视觉领域,CNN是解决图像分类、图像检索、物体检测和语义分割的主流模型 cnn每一层由众多的卷积核组成,每个卷积核对输入的像素进行卷积操作,得到下一次的输入。随着网络层的增加卷积核会逐渐扩大感受野,并缩减图像的尺寸。 cnn是一种层次模型,输入的是原始的像素数据。cnn通过卷积(convolution)、池化(pooling)、非线性激活函数(non-linear activ

2020-05-26 23:40:32 237

原创 零基础入门cv02︱Python学习笔记

数据读取与数据扩增 图像读取 由于赛题数据是图像数据,任务为识别图像中的字符。故我们需要完成对数据的读取操作,较常见的相关库为pillow和opencv pillow 是python图像处理函式库(PIL)的一个分支。 提供了常见的图像读取和处理的操作,可与ipython notebook无缝集成。 from PIL import Image im = Image.open('/Users/linyuepu/Downloads/IMG_2054.png') # 读取照片 im [外链图片转存失败,

2020-05-23 22:58:50 343

原创 函数篇︱Python学习笔记

python不仅能灵活定义函数,也可以直接调用内置函数。 调用内置函数 需要知道函数名称和参数 也可通过交互式命令查看帮助信息 例如:http://docs.python.org/3/library/functions.html#abs 可通过官方文档查看abd函数的帮助信息 # abs函数 help(abs) Help on built-in function abs in module builtins: abs(x, /) Return the absolute value

2020-05-23 16:04:36 400

原创 零基础入门cv01︱Python学习笔记

赛题数据 训练集数据包括3w张照片,验证集数据包括1w张照片,每张照片包括颜色图像和对应的编码类别和具体位置。 1. 训练集 mchar_train.zip,包含30000张图片。 2. 验证集 mchar_val.zip,包含10000张图片。 3. 测试集 mchar_test_a.zip,包含40000张图片。 4. 提交结果模板 mchar_sample_submit_A.csv 5. 训练集、验证集和测试集中字符的位置 mchar_train.json、mchar_val.json ,为降低比赛

2020-05-20 21:51:47 323

原创 Pandas基础6.1︱Python学习笔记

2002 年-2018 年上海机动车拍照拍卖 import numpy as np import pandas as pd df = pd.read_csv('./2002年-2018年上海机动车拍照拍卖.csv') df.head() Date Total number of license issued lowest ...

2020-05-01 22:30:47 299

原创 Pandas基础5.1|Python学习笔记

import numpy as np import pandas as pd df = pd.read_csv('./data/table.csv') df.head() Unnamed: 0 School Class ID Gender Address Height ...

2020-04-30 15:34:13 269

原创 Pandas基础3.2|Python学习笔记

import numpy as np import pandas as pd df = pd.read_csv('./data/table.csv',index_col = 'ID') df.head() Unnamed: 0 School Class Gender Address Hei...

2020-04-28 11:45:54 567

原创 爬虫基础4.1|Python学习笔记

回顾selenium(自动化测试工具) 应用场景:用代码的方式去模拟浏览器操作过程(如:打开浏览器、在输入框里输入文字、回车等),在爬虫方面很有必要 高级-查找元素:介于打开页面和关闭页面之间,与爬虫常见的HTML页面解析、定位到具体的某个元素类似,区别在于调用者是driver 高级-页面交互:找到元素后,进行“交互”,如键盘输入(需提前导入模块) 高级-等待页面加载(wait): 应用场景...

2020-04-27 23:13:50 156

原创 Pandas基础3.1|Python学习笔记

import numpy as np import pandas as pd df = pd.read_csv('./data/table.csv',index_col = 'ID') df.head() Unnamed: 0 School Class Gender Address Hei...

2020-04-26 23:07:48 155

原创 Pandas基础2.3|Python学习笔记

import numpy as np import pandas as pd df = pd.read_csv('./data/table.csv',index_col='ID') df.head() Unnamed: 0 School Class Gender Address Heig...

2020-04-26 15:27:52 335 1

原创 Pandas基础2.2|Python学习笔记

import numpy as np import pandas as pd df = pd.read_csv('./data/table.csv',index_col='ID') df.head() Unnamed: 0 School Class Gender Address Heig...

2020-04-26 13:29:56 185

原创 爬虫基础2.2|Python学习笔记

基于BS4库的HTML内容遍历方法 HTML基本格式:<> * < / >构成了所属关系,形成了标签的树形结构 标签树的下行遍历 .contents 子节点的列表,将< tag >所有儿子节点存入列表 .children子节点的迭代类型,与.contents类似,用于循环遍历儿子节点 .descendadts子孙节点的迭代类型,包含所有子孙节点,用于循环遍历...

2020-04-25 10:55:56 162

原创 爬虫基础2.1|Python学习笔记

Beautiful Soup库的基本元素 理解:Beautiful Soup库是解析、遍历、维护“标签树”的功能库,对应一个HTML、XML文档的全部内容 BS是一个HTML/XML的解析器,主要用于解析和提取HTML/XML数据; 基于HTML DOM,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,性能低于lxml; BS用来解析HTML较简单,API非常人性化,支持CS...

2020-04-24 17:17:09 232

原创 爬虫基础1.3|Python学习笔记

JavaScript的使用 在< script >< /script >中直接编写 通过< script src=‘目标文档的URL’ >< script >连接外部Js文件 herf属性值 作为某个元素的实践属性值或者是超链接的herf属性值 JavaScript基本语法 执行顺序:按照HTML文件中出现的顺序一次执行 严格区别大小写 忽略空...

2020-04-24 15:57:22 126

原创 爬虫基础1.2|Python学习笔记

1、使用开发者工具检查网页 菜单 - 更多工具 - 开发者工具 / 右击 - 检查 / F12 Elements:允许用户从浏览器的角度来观察网页。HTML、CSS、DOM(Document Object Model)对象。 Network:网页向服务器请求了哪些资源、资源的大小以及加载资源的相关信息。HTTP的请求头、返回内容等。 Source:源代码面板,调试JavaScript Conso...

2020-04-24 03:04:30 197

原创 Pandas基础2.1|Python学习笔记

import numpy as np import pandas as pd df = pd.read_csv('./data/table.csv',index_col='ID') df Unnamed: 0 School Class Gender Address Height ...

2020-04-23 20:49:02 209 1

原创 爬虫基础1.1|Python学习笔记

1、Internet互联网以一组标准的网络协议组相连,形成逻辑上的单一巨大国际网络。 WWW万维网是一个超文本相互链接而成的全球性系统,是Internet所能提供的服务之一。 2、HTTP是一个客户端(用户)和服务器端(网站)之间进行请求和应答的标准。 客户代理user agent(客户端) (HTTP请求)----> 源服务器origin server(应答服务器存储资源码e.g.HTML...

2020-04-21 22:06:16 187

原创 Pandas基础1.1|Python学习笔记

【练习一】 现有一份关于美剧《权力的游戏》剧本的数据集,请解决以下问题: (a)在所有的数据中,一共出现了多少人物? import pandas as pd import numpy as np df = pd.read_csv('C:/Users/PuLinYue/Desktop/joyful-pandas/data/Game_of_Thrones_Script.csv') df.head()...

2020-04-20 22:18:37 639 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除