
机器学习
文章平均质量分 83
周雄伟
这个作者很懒,什么都没留下…
展开
-
机器学习用python代码实现线性回归算法的几个例子
数学推导见相关参考书。### 例子1:线性回归画图的例子-最小二乘法import numpy as npimport matplotlib.pyplot as pltx=[1,2,3,4,5,6,7,8,9]y=[0.199,0.389,0.580,0.783,0.980,1.177,1.380,1.575,1.771]print(np.ones(2))#增加维度A=np.vsta...原创 2018-05-16 23:25:09 · 1533 阅读 · 1 评论 -
Softmax回归
Contents [hide] 1 简介 2 代价函数 3 Softmax回归模型参数化的特点 4 权重衰减 5 Softmax回归与Logistic 回归的关系 6 Softmax 回归 vs. k 个二元分类器 7 中英文对照 8 中文译者 简介在本节中,我们介绍Softmax回归模型,该模型是lo...转载 2018-10-08 08:11:37 · 289 阅读 · 0 评论 -
机器学习算法逻辑整理---逻辑回归算法
原创 2018-10-07 22:14:52 · 340 阅读 · 0 评论 -
LogisticRegression模型参数整理
sklearn 的 LogisticRegression 模型的相关参数整理:原创 2018-10-07 22:05:54 · 4296 阅读 · 0 评论 -
开始使用gensim入门
原文链接介绍了基本概念,以及理解和使用gensim的基本元素,并提供了一个简单的例子。核心概念和简单例子从宏观来看,gensim提供了一个发现文档语义结构的工具,通过检查词出现的频率。gensim读取一段语料,输出一个向量,表示文档中的一个词。词向量可以用来训练各种分类器模型。这三个模型是理解gensim的核心概念,所以接下来依次介绍。同时,会以一个简单例子贯穿讲述。语料语料是...转载 2018-09-19 10:26:51 · 626 阅读 · 0 评论 -
《机器学习(周志华西瓜书)》学习笔记1:第三章-线性模型
一、线性回归 线性回归的基本思想是采用对输入样例各个特征进行线性加权的方式得到预测的输出,并将预测的输出和真实值的均方误差最小化。1)如果输入样例只有一个特征,那这个过程就是用一条直线去拟合平面直角坐标系上的点; 2)如果有两个特征,表现在平面直角坐标系上就是用一条直线将用不同标记(如XX和OO)区分的输入样例分割开来;3)如果有两个以上特征,那就会映射到高维空间,用超平面来分割。 ...原创 2018-09-09 13:05:29 · 1976 阅读 · 0 评论 -
sklearn文本特征提取与“达观杯”文本智能处理挑战赛
参加的第一个线上比赛,经历了下比赛过程, 记录下。这个比赛比较简单, 主要是要调参费时间,只提交了两次结果,下次比赛认真对待。核心思路:文本矢量化后进行逻辑回归训练。print("start....")## 导入需要的库import pandas as pdfrom sklearn.linear_model import LogisticRegressionfrom sk...原创 2018-09-08 14:29:02 · 883 阅读 · 0 评论 -
如何使用 scikit-learn 为机器学习准备文本数据
文本数据需要特殊处理,然后才能开始将其用于预测建模。我们需要解析文本,以删除被称为标记化的单词。然后,这些词还需要被编码为整型或浮点型,以用作机器学习算法的输入,这一过程称为特征提取(或矢量化)。scikit-learn 库提供易于使用的工具来对文本数据进行标记和特征提取。在本教程中,您可以学到如何使用 scikit-learn 为 Python 中的预测建模准备文本数据。完成本教...转载 2018-09-08 13:10:54 · 430 阅读 · 0 评论 -
提高机器学习模型性能的五个关键方法
如何提高机器学习模型性能, 可从五个关键方面入手。1. 数据预处理2. 特征工程3. 机器学习算法4. 模型集成与融合5. 数据增强以下是各个方面的具体分析和方法:[ 说明:1、这里主要是各个关键方法的知识汇总梳理,便于集中学习,具体的实际应用内容后续单独写。 2、参考整理了很多大拿的文章和资料,但忘了记录来处,如有不适当转载的,请留言,我看到后第一时间删除。 ]第...原创 2018-09-08 11:52:10 · 34853 阅读 · 4 评论 -
用python创建的神经网络--mnist手写数字识别率达到98%
周末根据Tariq Rashid大神的指导,没有使用tensorflow等框架,用python编写了一个三层神经网络,并应用再mnist手写库识别上,经过多方面参数调优,识别率竟然达到了98%。 调优比较难,经验感觉特别宝贵,为避免时间长了忘记,记录整理如下。目录一、加载所需要的库二、定义神经网络类三、创建神经网络对象并用MNIST训练集训练四、用测试集测试准确率五、参数...原创 2018-08-11 22:41:39 · 65603 阅读 · 64 评论 -
使用anaconda安装tensorflow (windows10环境)
已有环境:python3.6.1anaconda隔离管理多个环境,互不影响。这里,在anaconda中安装最新的python3.6.5 版本。linux环境下使用anaconda安装tensorflow步骤见:https://blog.youkuaiyun.com/ebzxw/article/details/80693152一. 安装anaconda1. 下载地址: https://www.anaconda....原创 2018-06-15 22:42:06 · 157582 阅读 · 90 评论 -
机器学习环境搭建笔记
搭建一个新环境,具体过程记录如下:原创 2018-06-14 15:10:06 · 2666 阅读 · 0 评论 -
隐马尔科夫模型(HMM)择时应用的量化策略
HMM模型隐马尔科夫模型(HMM)择时应用的量化策略。 仅为研究学习使用, 不作为任何投资策略建议。文章内容从各处整理汇总而成, 感谢各位大神分享。 具体策略代码均调试通过。一、从大奖章讲起Renaissance & Medallion(文艺复兴科技和大奖章)量化圈都非常熟悉了。Simons一群物理学家和数学家碰撞在一起,1989年到2008年的yearly return达到35.6%。...原创 2018-05-26 22:17:04 · 16208 阅读 · 11 评论 -
机器学习K-Means及DBSCAN聚类算法的python代码
### K-Means (AgglomerativeClustering 为层次聚类使用,相应两行被替换) 向量距离聚类#coding=utf-8import numpy as npimport matplotlib.pyplot as plt#from sklearn.cluster import KMeansfrom sklearn.cluster import Agglomer...原创 2018-05-14 01:12:37 · 3532 阅读 · 1 评论 -
机器学习与tensorflow入门教程(任何人都能看懂)
说明:汇集相关资料整理,基本概念讲的比较清楚,总共整理下来分为四个部分,比较长,慢慢看。主要内容来自机器之心日本东京 TensorFlow 聚会联合组织者 Hin Khor 所写的 TensorFlow 系列介绍文章,需要会python;偏重概念理解,相关代码未全部验证,仅供参考。如果需要进一步理解代码与实现方法,可参考另外一篇。https://blog.youkuaiyun.com/ebzxw/articl...原创 2019-01-23 15:10:26 · 59217 阅读 · 14 评论