自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 【python】collections.defaultdict()的用法

可以是 list、set、str 等等,作用是当 key 不存在时,返回的是工厂函数的默认值,比如 list 对应 [ ] ,str 对应的是空字符串,set 对应 set( ),int 对应 0。需要传入两个参数,第一个参数是键值,第二个参数是默认值,如果字典中不存在该键则返回默认值,如果存在该键则返回该值。这种方法可以在字典中添加没有的键值对,进而修改原字典,字典的键和值分别对应两个参数。相同,但它带有一个默认的值,若key值不存在时返回一个默认的值。来创建字典,直接就可以避免键不存在而报错的情况。

2023-12-17 10:56:53 236

原创 爬虫--列车时刻表数据(python)

这样打印出来,就是序号那一列,其余列也是同样的方式解析,具体每一个元素他在什么路径下,可以去源代码页面复制某个具体数据的 XPATH,然后把前面和表格 XPATH 一样的部分用一个点。请求网页的过程其实就是让软件模拟我们点击网页中按钮的过程,这里需要讲到一些html的知识,不再拓展,关键的是防止被网站的反爬程序封ip的方法就是设置一个请求头headers。到这里我们就请求到了网页,这里可以理解为得到了整个网页的源代码,下面我们要在整个网页的源代码里找到我们所需要的数据,也就是下一步,解析网页数据。

2023-12-12 14:05:22 1225

原创 今日学习——反向传播(Back Propagation算法BP算法)

前向传播和反向传播是神经网络进行参数优化运算时必不可少的两个步骤。前向传播是指:神经网络前一层的输出作为下一层神经元的输入,带入去计算下一层的输出并且不断前进,直到得到整个神经网络的输出。反向传播与之对应,是指:每次前向传播过程结束得到整个网络的输出后,计算神经网络输出和真实样本标记之间的差距作为损失函数,并以此损失函数反过来从网络的输出层开始往网络的输入层不断计算各层参数的梯度的方法。

2023-12-02 10:17:18 181

原创 分布函数弱收敛和一致收敛

(这里其实是给出了每个小区间内函数差值上界)是某一分布函数,所以必定。(这里给出了每个小区间内。

2022-10-05 19:39:32 753

原创 李航《统计学习方法》第4章——朴素贝叶斯法

输入空间为 nnn 向量:X⊆Rn\mathcal{X} \subseteq \mathbb{R}^nX⊆Rn输出空间为类标记:Y={c1,c2,...,cK}\mathcal{Y} = \{ c_1,c_2,...,c_K\}Y={c1​,c2​,...,cK​}训练数据集: T={(x1,y1),(x2,y2),...,(xN,yN)}T = \{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}T={(x1​,y1​),(x2​,y2​),...,(xN​,yN​)} ,由联合分布

2022-07-06 10:13:25 421

原创 kmeans算法及python实现

算法步骤:1.选择初始化的 k 个样本作为初始聚类中心: a1,a2...aka_1,a_2...a_ka1​,a2​...ak​;2.针对数据集中每个样本 xjx_jxj​, 计算它到 k 个聚类中心的距离并将其分到距离最小的聚类中心所对应的类中;3.针对2中分好的每个类别 aja_jaj​,重新计算它的类中心 aj′=1∣cj∣∑xi∈cjxia_j' = \frac{1}{|c_j|}\sum_{x_i \in c_j} x_iaj′​=∣cj​∣1​∑xi​∈cj​​xi​(即属于该类的所有

2022-05-23 14:18:30 1684

原创 李航《统计学习方法》第二章——感知机及python实现

感知机对偶形式算法2.2(1) 初始化参数 α=0\alpha = 0α=0,b=0b = 0b=0,η∈(0,1]\eta \in (0,1]η∈(0,1](2) 对于特征数据进行循环:\quad \quad如果 yi(∑j=1Nαjyjxj∗xi+b)⩽0y_i(\sum_{j=1}^N \alpha_j y_j x_j * x_i + b) \leqslant 0yi​(∑j=1N​αj​yj​xj​∗xi​+b)⩽0 ,更新参数:\quad \quad \quad \quad \qua

2022-05-18 22:00:00 431

原创 Mac powerpoint无法输入的问题解决

设备:Macbook Air今天使用ppt的时候突然发现没有办法正常使用了,无法键入,而且还老是闪来闪去的退出的时候还发出类似于震动的声音,蛮大的之前也遇到这个问题来着,没有在意,一直搁置到了今天,在网上搜索了一阵儿终于解决了问题原因:开启了欧陆词典划线取词把这个关闭了之后问题就解决了,如下图:欧路词典--偏好设置--取词--把开启划词搜索的对号去掉就可以了~(很神奇...

2022-05-10 12:01:46 1000

原创 何书元《概率引论》第一章

1.1 有限样本空间试验S的可能结果叫做样本点,用 ω\omegaω 表示;试验S的样本点 ω\omegaω 构成的集合称为样本空间,用 Ω\OmegaΩ 表示。A. 有限样本空间极其事件如果样本空间只有有限个样本点,即 Ω={ω1,ω2,...,ωn}\Omega = \{ \omega_1, \omega_2, ...,\omega_n\}Ω={ω1​,ω2​,...,ωn​} ,则称 Ω\OmegaΩ 为有限样本空间。例如投掷一枚骰子的样本空间为:Ω={ω ∣ ω=1,

2022-04-28 09:17:50 1020

原创 Python中DataFrame转换成ndarray

今天用pandas读入csv数据之后想转换成ndarray,在网上找到的方法如下:import pandas as pddata = pd.read_csv('/Users/ada/data/wine.csv',sep=';')data = data.values问题解决了,开心~还有一个小问题就是怎么索引array里的列:data[...,0:10]前面加上三个点点就可以啦,这样就是数据的1-10列。顺便再学习一下ndarray转换成DataFrame方法如下:import pan

2022-04-20 16:16:18 3830

原创 今日学习——卷积神经网络(CNN)

文章目录一、空间不变性和局部性二、边界检测——一个小例子感受卷积全链接神经网络是各层之间的神经元每个都链接在一些,这样一来就会出现一个问题,那就是当我们的输出层神经元很多的时候,链接就会很多,参数的维度就会很高。比如说,假设我们有一个足够充分的照片数据集,数据集中是拥有标注的照片,每张照片具有百万级像素,这意味着网络的每次输入都有一百万个维度。 即使将隐藏层维度降低到1000,这个全连接层也将有106×10310^6 \times 10^3106×103个参数。 想要训练这个模型将不可实现,因为需要有大

2022-04-15 15:42:29 5482 1

原创 李航《统计学习方法》第一章学习笔记

1.1 关于统计学习定义统计学习是从数据出发,提取数据的特征,抽象出数据的模型,最后又回到对数据的分析和预测中去。分类统计学习包括监督学习、非监督学习、半监督学习、强化学习等,监督学习是本书重点。三要素统计学习的方法大致可以表述为:从现有的数据出发,在模型的假设空间(模型的集合)上运用某个评价准则,从假设空间中选取一个最优的模型,并且设计选取规则算法。简言之,三要素就是:模型、策略、算法。1.2 监督学习监督学习是指我们的数据带有标签的学习过程,也就是监督学习的所用的数据其实

2022-04-13 22:02:36 376

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除