- 博客(12)
- 收藏
- 关注
原创 吴恩达机器学习笔记10-照片OCR
OCR:让计算机从图片中读出文字信息OCR的步骤文本检测。找出有文字的区域字符切分分类器分类字符这样的步骤称为机器学习流水线文本检测滑动窗口 指的是在图片中移动的矩形范围取出图像,然后使用机器学习算法进行训练和判断滑动窗口的大小要有变化,以检测不同大小的目标膨胀算子:把滑动窗口扫描的文字的位置进行膨胀去掉长宽比例不合适的文本位置字符切分把...
2018-08-11 20:10:32
387
原创 吴恩达机器学习笔记9-大规模机器学习
最强的机器学习方法:使用低偏差的算法和大量的数据使用大量数据前先检查一下使用少量的数据行不行,也要通过训练集和验证集的cost图来判断是否需要继续增加数据随机梯度下降很多学习算法使用了梯度下降的算法。当m很大时,计算梯度就会变得很复杂,这种算法叫做批量梯度下降,每次考虑所有的样本。假如有3亿的数据,每次求梯度都会很慢。 而随机梯度下降每次只考虑一个训练样本 1. 将所有数据打乱...
2018-08-11 20:09:45
201
原创 吴恩达机器学习笔记8-异常检测
基本含义一组数据,判断其中某一个是否异常Dataset:{x(1),x(2),...,x(m)}Dataset:{x(1),x(2),...,x(m)}Dataset:\{x^{(1)},x^{(2)},...,x^{(m)}\} Is xtestxtestx_{test} anomalous?我们对其分布进行建模,模型为p(x)p(x)p(x)如果p(xtest<ϵ)...
2018-08-11 20:08:24
439
原创 吴恩达机器学习笔记7-降维
从特征中去掉冗余的部分2D->1D:线性相关的两个特征变量可以投影到它们的拟合直线上3D->2D:3维的点可以投影到一个平面上主成分分析法PCA寻找一个向量对所有样本点进行投影,获得最小的投影误差。一般问题:N维数据降到K维,需要K个投影向量PCA和线性回归的区别:PCA要求样本点到向量的投影的长度最短,是距离的平方最小,而现行回归是函数值的差的平方最小...
2018-08-11 20:07:47
200
原创 吴恩达机器学习笔记6-聚类
聚类算法是无监督学习算法k-means算法是一个常用的聚类算法算法过程 1. 簇分配。随机选择K个点作为聚类中心,遍历每个点,离A近的点算A类,离B近的点算B类,以此类推 2. 移动聚类中心。计算每一类的中心(平均值的点) 3. 重新计算每个点所属的类别。如果聚类中心不变,每个点的类别也不变,那么算法收敛,否则到2。算法接收的输入 1. K,聚类的数量 2. 训练集x1,x2...
2018-08-11 20:07:11
278
原创 吴恩达机器学习笔记5-SVM
给定训练样本 D=(x⃗ 1,y1),x⃗ 2,y2),...,x⃗ n,yn),yi∈{+1,−1}D=(x→1,y1),x→2,y2),...,x→n,yn),yi∈{+1,−1}D={(\vec x_1,y_1),\vec x_2,y_2),...,\vec x_n,y_n)},y_i\in \{+1,-1\} 超平面为w⃗ Tx⃗ +b...
2018-08-11 20:06:26
187
原创 吴恩达机器学习笔记4-误差分析
推荐的方法: 1. 开始一个简单的算法,然后快速实现,在交叉验证集上进行验证 2. 画出学习曲线,尝试不同的方案 3. 误差分析,手动检查算法错误的例子,看看是否存在系统性错误最好有一种数值化评估算法的方法,以便分析算法的优劣偏斜类:数据中一个类别的量远比另一个的多,会导致学习器直接全部猜测为数据量大的类True Positive:预测为正实际为正 True Negative:...
2018-08-11 20:05:50
511
原创 吴恩达机器学习笔记3-评估假设
判断过拟合的方法 1. 观察图像。但是特征太多没办法观察 2. 划分数据集为训练集和测试集,70%和30%。又叫交叉验证。模型选择 可以一个一个模型试,计算测试集cost,但是这样选择出来的模型和参数可能出现过度拟合测试集了。为了解决这个问题,把数据集分为 1. 训练集 60% 2. 交叉验证集 20% 3. 测试集 20%针对选择模型复杂度的问题 高偏差:训练集和验证集...
2018-08-11 20:04:31
341
原创 吴恩达机器学习笔记2-神经网络
前向传播(Forward Propagation)a(1)=xa(1)=xa^{(1)}=x a(2)=g(θ(1)x)a(2)=g(θ(1)x)a^{(2)}=g(\theta^{(1)}x) a(3)=g(θ(2)a(2))a(3)=g(θ(2)a(2))a^{(3)}=g(\theta^{(2)}a^{(2)}) 反向传播(Backward Propagation)梯度下降算...
2018-08-11 20:03:36
145
原创 吴恩达机器学习笔记1-基础
梯度下降: 1. 需要选择学习速率 2. 需要许多次迭代 3. 在有许多特征变量的情况下也能运行地很好标准方程: 1. 不需要选择学习速率 2. 不需要迭代 3. 需要求解(XTX)-1,复杂度为O(n3) 标准方程中(XTX)不可逆,往往是两个原因 1. 两个数据线性相关 2. 数据量小于特征数不可逆的矩阵仍然可以计算伪逆逻辑回归:针对输出值是离散的情况,使用下...
2018-08-11 19:56:46
160
原创 视频拼接问题
姑且叫视频拼接问题。假设有n个视频片段,利用软件每次将k个视频片段拼接成一个视频,同时要求有m个时间轴并行,也就是同一屏幕同一时间有m个视频片段播放(空间并行度 = m,时间并行度≈k/m),拼接出来的理论上就会有[n/k]个视频,假设每个视频长度为L,由k个视频片段组成(不同视频的L和k可以不同)。 但是问题是n个视频片段长度不一样,会导致每次的一组k个视频片段播放到最后就有一些会播放结束...
2018-06-20 11:02:35
784
原创 利用moviepy对韩国女团视频进行自动剪辑
首先从网上下载女团的饭拍视频,建议是饭拍的竖屏视频,横屏的太远,女团的身体看得不明显,横屏的也不需要进行处理,因为我们的屏幕是横屏的,放横屏的视频自然是没有障碍。当然,看完这篇文章你也可以自己创建你喜欢的布局样式。我这里是从http://www.gaobei.com/fanpai下载的视频,当然你可能需要一个百度网盘的超级会员,或者自己破解客户端。为了对视频进行编辑,你可能会想到PR,但是PR的问...
2018-06-16 17:01:11
3993
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人