
机器学习
文章平均质量分 73
MachineLP
成功收获成果,失败收获智慧,投入收获快乐!
展开
-
[pytorch] PyTorch图像分类框架(支持多种主流分类模型)
Git Repo:https://github.com/MachineLP/PyTorch_image_classifierCV 训练/测试/部署分类任务| *** | 具体 | 样例 || :-----------------: | :---------???? :---------????| 模型方面 | (efficientnet/resnest/seresnext等) | 1 || 数据增强 | (旋转/镜像/对比度等、mixup/cutmix) | 2 || 损失函数 | (交叉熵/f原创 2020-10-21 09:44:06 · 2235 阅读 · 4 评论 -
[ES] es 搜索的高级功能:搜索并按照不同字段sore权重计算得分排序
电商搜索中一个通用搜索语句:GET /_search{ "query": { "function_score": { "query": { "bool": { "should": [ { "match_phrase": { "title": { ...原创 2020-08-03 11:05:05 · 2722 阅读 · 0 评论 -
Attention 待更新
Attention注意力机制可以描述为一个函数,这个函数将query和一组key-value对映射成一个输出。Scaled Dot-Porduct Attention原创 2020-02-25 16:40:44 · 242 阅读 · 0 评论 -
[中文语音识别后文本加标点] 文本数据增强方法
数据增强技术在很多领域应用广泛,例如:在图像领域中有:旋转、反转、噪声、mixup、cutmix等等;在语音识别领域有:语音信号添加随机背景噪声、语谱图随机mask等等......在文本领域也有很多方法:其中ICLR 2019 workshop论文《EDA: Easy Data Augmentation Techniques for Boosting Performance on Te...原创 2020-02-25 16:03:30 · 1695 阅读 · 2 评论 -
pandas速查表
统计特征:https://zhuanlan.zhihu.com/p/82394380描述性统计:差值:https://www.jianshu.com/p/4e9801c74f01原创 2019-12-12 14:10:13 · 264 阅读 · 0 评论 -
CTR中tricks
原创 2019-12-06 14:29:29 · 148 阅读 · 0 评论 -
pandas减少数据内存使用率/提高计算效率方法
数据量大的时候、或者内存紧张、想着提高计算效率, 加一下这个(可节省50%+内存同时提高计算效率):def reduce_mem_usage(df, verbose=True): numerics = ['int16', 'int32', 'int64', 'float16', 'float32', 'float64'] start_mem = df.memory_usage...原创 2019-12-05 20:36:25 · 968 阅读 · 0 评论 -
scala-sparkML学习笔记:迁移文件/ 通过 .!! 隐式方法直接执行系统命令
Scala作为script使用也是非常的方便。原文地址:https://www.yangbajing.me/2019/03/22/scala实战:迁移文件/还可以参考:Scala-通过ProcessBuilder执行hive命令:https://blog.youkuaiyun.com/qq_16038125/article/details/86682405浅析ProcessBuilder:http...原创 2019-11-13 17:50:36 · 253 阅读 · 0 评论 -
MachineLP好文推荐
MachineLP:其实事物发展有自己的潮流和规律,当你身处潮流之中的时候,要紧紧抓住潮流的机会,想办法脱颖而出,即使没有成功,也会更加洞悉时代的脉搏,收获珍贵的知识和经验。而如果潮流已经退去,这个时候再去往这个方向上努力,只会收获迷茫与压抑,对时代、对自己都没有什么帮助。但是时代的浪潮犹如海滩上的浪花,总是一浪接着一浪,只要你站在海边,身处这个行业之中,下一个浪潮很快又会到来。你需要敏感而...原创 2019-11-02 10:22:37 · 958 阅读 · 0 评论 -
scala-sparkML学习笔记:struct type tinyint size int indices array int values array double type
错误类型:CSV data source does not support struct<type:tinyint,size:int,indices:array<int>,values:array<double>> data type.predictPredict.select("user_id", "probability", "label")...原创 2019-10-29 22:14:20 · 2535 阅读 · 0 评论 -
机器学习之模型选择(交叉验证)
问题模型选择问题:对于一个学习问题,可以有多种模型选择。比如要拟合一组样本点,可以使用线性回归,也可以用多项式回归。那么使用哪种模型好呢(能够在偏差和方差之间达到平衡最优)?还有一类参数选择问题:如果我们想使用带权值的回归模型,那么怎么选择权重w 公式里的参数τ?形式化定义:假设可选的模型集合是Μ = {M1, M2, … , Md },比如我们想分类,那么SVM、logistic回归、神经网原创 2015-08-23 10:39:25 · 7922 阅读 · 0 评论 -
机器学习之特征选择
特征选择严格来说也是模型选择中的一种。这里不去辨析他们的关系,重点说明问题。假设我们想对维度为n 的样本点进行回归,然而,n 可能大多以至于远远大于训练样例数m。但是我们感觉很多特征对于结果是无用的,想剔除n 中的无用特征。n个特征就有2��种去除情况(每个特征去或者保留),如果我们枚举这些情况,然后利用交叉验证逐一考察在该情况下模型的错误率,太不现实。因此需要一些启发式搜索方法。第一种,前向搜索原创 2015-08-23 12:53:29 · 1051 阅读 · 0 评论 -
光流法与KLT
一 光流光流的概念是Gibson在1950年首先提出来的。它是空间运动物体在观察成像平面上的像素运动的瞬时速度,是利用图像序列中像素在时间域上的变化以及相邻帧之间的相关性来找到上一帧跟当前帧之间存在的对应关系,从而计算出相邻帧之间物体的运动信息的一种方法。一般而言,光流是由于场景中前景目标本身的移动、相机的运动,或者两者的共同运动所产生的。其计算方法可以分为三类:(转载 2015-08-25 09:22:00 · 1590 阅读 · 0 评论 -
deep learning:Theano安装攻略
按照Deep Learning Tutorials,运行一些主要的算法使用Theano.安装Theano过程:(系统:win7,64-bit) 1. 首先安装python,我选择安装Anaconda (Windows 64-Bit Python 2.7 Graphical Installer 下载地址)。Anaconda的一些命令(在Anaconda的命令行窗口输入):转载 2015-08-25 15:33:37 · 1433 阅读 · 0 评论 -
机器学习之Softmax回归
机器学习之Softmax回归-Softmax回归模型是logistic回归模型在多分类问题上的推广,在多分类问题中,类标签 y 可以取两个以上的值。-Softmax回归模型对于诸如MNIST手写数字分类等问题是很有用的,该问题的目的是辨识10个不同的单个数字。-Softmax回归是有监督的在 logistic 回归中,我们的训练集由 个已转载 2015-08-27 10:08:32 · 2117 阅读 · 0 评论 -
机器学习算法与Python实践之(一)k近邻(KNN)
机器学习算法与Python实践这个系列主要是参考《机器学习实战》这本书。因为自己想学习Python,然后也想对一些机器学习算法加深下了解,所以就想通过Python来实现几个比较常用的机器学习算法。恰好遇见这本同样定位的书籍,所以就参考这本书的过程来学习了。 一、kNN算法分析 K最近邻(k-Nearest Neighbor,KNN)分类算法可以说是最简单的机器学习算转载 2015-08-29 10:24:12 · 883 阅读 · 0 评论 -
机器学习算法与Python实践之(八)朴素贝叶斯
模型概述朴素贝叶斯方法,是指朴素:特征条件独立贝叶斯:基于贝叶斯定理根据贝叶斯定理,对一个分类问题,给定样本特征x,样本属于类别y的概率是 p(y|x)=p(x|y)p(y)p(x) 。。。。。。(1) 在这里,x是一个特征向量,将设x维度为M。因为朴素的假设,即特征条件独立,根据全概率公式展开,公式(1)可以表达为 p(y=c k |x)=∏ M i=1原创 2015-08-29 10:48:55 · 2254 阅读 · 0 评论 -
机器学习算法与Python实践之(三)支持向量机(SVM)进阶
机器学习算法与Python实践之(三)支持向量机(SVM)进阶 机器学习算法与Python实践这个系列主要是参考《机器学习实战》这本书。因为自己想学习Python,然后也想对一些机器学习算法加深下了解,所以就想通过Python来实现几个比较常用的机器学习算法。恰好遇见这本同样定位的书籍,所以就参考这本书的过程来学习了。 在这一节我们主要是对支持向量机进转载 2015-08-29 10:29:59 · 978 阅读 · 0 评论 -
机器学习算法与Python实践之(二)支持向量机(SVM)初级
机器学习算法与Python实践之(二)支持向量机(SVM)初级 机器学习算法与Python实践这个系列主要是参考《机器学习实战》这本书。因为自己想学习Python,然后也想对一些机器学习算法加深下了解,所以就想通过Python来实现几个比较常用的机器学习算法。恰好遇见这本同样定位的书籍,所以就参考这本书的过程来学习了。 在这一节我们主要是对支持转载 2015-08-29 10:28:30 · 806 阅读 · 0 评论 -
机器学习算法与Python实践之(七)逻辑回归(Logistic Regression)
机器学习算法与Python实践之(七)逻辑回归(Logistic Regression)zouxy09@qq.comhttp://blog.youkuaiyun.com/zouxy09 机器学习算法与Python实践这个系列主要是参考《机器学习实战》这本书。因为自己想学习Python,然后也想对一些机器学习算法加深下了解,所以就想通过Python来实现几个比较常用的机器学转载 2015-08-29 10:38:42 · 1010 阅读 · 0 评论 -
机器学习算法与Python实践之(四)支持向量机(SVM)实现
机器学习算法与Python实践之(四)支持向量机(SVM)实现zouxy09@qq.comhttp://blog.youkuaiyun.com/zouxy09 机器学习算法与Python实践这个系列主要是参考《机器学习实战》这本书。因为自己想学习Python,然后也想对一些机器学习算法加深下了解,所以就想通过Python来实现几个比较常用的机器学习算法。恰好遇见这本同样定转载 2015-08-29 10:32:05 · 1237 阅读 · 0 评论 -
机器学习算法与Python实践之(五)k均值聚类(k-means)
机器学习算法与Python实践之(五)k均值聚类(k-means) 机器学习算法与Python实践这个系列主要是参考《机器学习实战》这本书。因为自己想学习Python,然后也想对一些机器学习算法加深下了解,所以就想通过Python来实现几个比较常用的机器学习算法。恰好遇见这本同样定位的书籍,所以就参考这本书的过程来学习了。 机器学习中有两类的大问题,一转载 2015-08-29 10:35:13 · 1156 阅读 · 0 评论 -
机器学习算法与Python实践之(六)二分k均值聚类
机器学习算法与Python实践之(六)二分k均值聚类 机器学习算法与Python实践这个系列主要是参考《机器学习实战》这本书。因为自己想学习Python,然后也想对一些机器学习算法加深下了解,所以就想通过Python来实现几个比较常用的机器学习算法。恰好遇见这本同样定位的书籍,所以就参考这本书的过程来学习了。 在上一个博文中,我们聊到了k-means算转载 2015-08-29 10:36:41 · 1090 阅读 · 0 评论 -
Stanford机器学习---第六讲. 怎样选择机器学习方法、系统
本栏目(Machine learning)包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM(Support Vector Machines 支持向量机)、聚类、降维、异常检测、大规模机器学习等章节。所有内容均来自Standford公开课machine le转载 2015-09-04 21:04:46 · 692 阅读 · 0 评论 -
机器学习之基于3D卷积神经网络的人体行为理解(论文笔记)
基于3D卷积神经网络的人体行为理解(论文笔记) 最近看Deep Learning的论文,看到这篇论文:3D Convolutional Neural Networks for Human Action Recognition。比较感兴趣是CNN是怎么应用于行为理解的,所以就看看。这篇论文发表在TPAMI2013。它基本上没有公式的,论文倾于从论述角度描述它的基转载 2015-09-04 20:37:23 · 2105 阅读 · 0 评论 -
机器学习之深度学习(Deep Learning)
Deep Learning是机器学习中一个非常接近AI的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,最近研究了机器学习中一些深度学习的相关知识,本文给出一些很有用的资料和心得。Key Words:有监督学习与无监督学习,分类、回归,密度估计、聚类,深度学习,Sparse DBN,1. 有监督学习和无监督学习给定一组数据(input,target转载 2015-09-04 20:40:30 · 1519 阅读 · 0 评论 -
机器学习之Convolution Neural Network (CNN) 原理与实现
本文结合Deep learning的一个应用,Convolution Neural Network 进行一些基本应用,参考Lecun的Document 0.1进行部分拓展,与结果展示(in python)。分为以下几部分:1. Convolution(卷积)2. Pooling(降采样过程)3. CNN结构4. 跑实验下面分别介绍。PS:本篇blog为转载 2015-09-04 20:47:18 · 3554 阅读 · 0 评论 -
Stanford机器学习---第三讲. 逻辑回归和过拟合问题的解决 logistic Regression & Regularization
本栏目(Machine learning)包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM(Support Vector Machines 支持向量机)、聚类、降维、异常检测、大规模机器学习等章节。所有内容均来自Standford公开课machine lear转载 2015-09-04 20:59:13 · 1029 阅读 · 0 评论 -
Stanford机器学习---第四讲. 神经网络的表示 Neural Networks representation
本栏目(Machine learning)包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM(Support Vector Machines 支持向量机)、聚类、降维、异常检测、大规模机器学习等章节。所有内容均来自Standford公开课machine lear转载 2015-09-04 21:01:02 · 856 阅读 · 0 评论 -
Stanford机器学习---第七讲. 机器学习系统设计
本栏目(Machine learning)包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM(Support Vector Machines 支持向量机)、聚类、降维、异常检测、大规模机器学习等章节。所有内容均来自Standford公开课machine lear转载 2015-09-04 21:06:07 · 658 阅读 · 0 评论 -
Stanford机器学习---第八讲. 支持向量机SVM
本栏目(Machine learning)包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM(Support Vector Machines 支持向量机)、聚类、降维、异常检测、大规模机器学习等章节。所有内容均来自Standford公开课machine lear转载 2015-09-04 21:08:42 · 1117 阅读 · 0 评论 -
Stanford机器学习---第十讲. 数据降维
本栏目(Machine learning)包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM(Support Vector Machines 支持向量机)、聚类、降维、异常检测、大规模机器学习等章节。内容大多来自Standford公开课machine learnin转载 2015-09-05 14:02:41 · 662 阅读 · 0 评论 -
Stanford机器学习---第一讲. Linear Regression with one variable
本栏目(Machine learning)包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM(Support Vector Machines 支持向量机)、聚类、降维、异常检测、大规模机器学习等章节。所有内容均来自Standford公开课machine lear转载 2015-09-04 20:54:35 · 768 阅读 · 0 评论 -
什么是机器学习?
接触机器学习差不多有一年的时间了。记得一年前,最初还不知道机器学习这个词(悲催),刚开始导师给推荐的一本书是模式识别(Duda.等人),看的我是云里雾里,根本看不下,简直就是天书,我想回过头来想想这本书到底适合不适合入门,我个人想是不太同意的,除非你有了一定的基础,你还有足够的耐心。呵呵…后来渐渐的接触到了机器学习,其实模式识别仅仅也是机器学习的一个分支,刚开始也是找各种资料,查:到底“什么是机器学原创 2015-09-10 16:01:51 · 815 阅读 · 0 评论 -
机器学习之无监督特征学习——Unsupervised feature learning and deep learning
无监督学习近年来很热,先后应用于computer vision, audio classification和 NLP等问题,通过机器进行无监督学习feature得到的结果,其accuracy大多明显优于其他方法进行training。本文将主要针对Andrew的unsupervised learning,结合他的视频:unsupervised feature learning by转载 2015-09-04 20:51:24 · 1254 阅读 · 0 评论 -
Stanford机器学习---第九讲. 聚类
本栏目(Machine learning)包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM(Support Vector Machines 支持向量机)、聚类、降维、异常检测、大规模机器学习等章节。内容大多来自Standford公开课machine learn转载 2015-09-05 14:01:52 · 643 阅读 · 0 评论 -
机器学习笔试面试系列算法集锦
前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大。 纵观IT行业的招聘岗位,机器学习之类的岗位还是挺转载 2015-09-10 21:24:40 · 969 阅读 · 0 评论 -
机器学习之支持向量机通俗导论(理解SVM的三层境界)
作者:July、pluskid ;致谢:白石、JerryLead出处:结构之法算法之道blog。前言 动笔写这个支持向量机(support vector machine)是费了不少劲和困难的,原因很简单,一者这个东西本身就并不好懂,要深入学习和研究下去需花费不少时间和精力,二者这个东西也不好讲清楚,尽管网上已经有朋友写得不错了(见文末参考链接),但在描转载 2015-09-04 20:33:44 · 3415 阅读 · 0 评论 -
Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable
本栏目(Machine learning)包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM(Support Vector Machines 支持向量机)、聚类、降维、异常检测、大规模机器学习等章节。所有内容均来自Standford公开课machine lear转载 2015-09-04 20:56:41 · 687 阅读 · 0 评论 -
Stanford机器学习---第五讲. 神经网络的学习 Neural Networks learning
本栏目(Machine learning)包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM(Support Vector Machines 支持向量机)、聚类、降维、异常检测、大规模机器学习等章节。所有内容均来自Standford公开课machine lear转载 2015-09-04 21:03:16 · 667 阅读 · 0 评论