
机器学习
瑶子ove
每天进步一点
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
XGBoost参数说明
转自:https://blog.youkuaiyun.com/han_xiaoyang/article/details/52665396本文仅收集模型参数定义,具体代码示例请参考上述链接。1、简介XGBoost算法现在已经成为很多数据工程师的重要武器。它是一种十分精致的算法,可以处理各种不规则的数据。构造一个使用XGBoost的模型十分简单。但是,提高这个模型的表现就有些困难(至少我觉得十分纠结)。这...转载 2018-12-30 10:42:23 · 2741 阅读 · 0 评论 -
机器学习分类器性能指标总结(附类别不平衡问题研究)
一、ROC曲线(1)定义ROC: 接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的感受性。常用于二分类问题中的模型比较,主要表现为一种真正例率 (TPR) 和假正例率 (FPR) 的权衡。横轴:负正类率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的比例;(1-Specifici...原创 2018-12-08 16:59:46 · 2377 阅读 · 0 评论 -
kaggle 房价预测-----python
本文参考七月在线内容。所有数据从kaggle网站获取import numpy as npimport pandas as pdfrom pandas import Series,DataFrameimport matplotlib.pyplot as pltfrom pylab import mplmpl.rcParams['font.sans-serif'] = ['SimHei']...原创 2018-10-03 18:18:55 · 1471 阅读 · 0 评论 -
机器学习实战——朴素贝叶斯练习
参考:https://www.cnblogs.com/zy230530/p/6847243.html 代码段需完善假设这里要被分类的类别有两类,类c1和类c2,那么我们需要计算概率p(c1|x,y)和p(c2|x,y)的大小并进行比较:如果:p(c1|x,y)>p(c2|x,y),则(x,y)属于类c1 p(c1|x,y)<p(c2|x,y),则(x,y)属于类c...原创 2018-08-26 01:24:40 · 536 阅读 · 0 评论 -
机器学习实战之PCA---python
参考:https://blog.youkuaiyun.com/hustqb/article/details/78394058# -*-coding:utf-8 -*-import numpy as npimport matplotlib.pyplot as plt'''简化数据的原因: 1、数据更易使用 2、降低算法计算开销 3、降噪 ...原创 2018-09-16 00:07:28 · 371 阅读 · 0 评论 -
机器学习实战练习———logistic回归:疝气病预测病马死亡概率
参考:https://blog.youkuaiyun.com/c406495762/article/details/77851973import numpy as npimport random'''sigmoid()函数定义'''def sigmoid(inX): return 1.0/(1 + np.exp(-inX))'''梯度上升算法'''def gradAscent...原创 2018-08-29 00:20:38 · 1090 阅读 · 0 评论 -
news ---stock练习-----python
news_stock练习:from sklearn.feature_extraction.text import CountVectorizer,TfidfVectorizerimport pandas as pdimport numpy as npfrom sklearn.svm import SVCfrom sklearn.metrics import roc_auc_scoref...原创 2018-10-07 17:06:39 · 271 阅读 · 0 评论 -
kaggle练习---- Home Depot Product Search Relevance
import numpy as npimport pandas as pdfrom sklearn.ensemble import RandomForestRegressor,BaggingRegressorfrom nltk.stem.snowball import SnowballStemmerfrom sklearn.model_selection import cross_val...原创 2018-10-07 22:22:34 · 458 阅读 · 0 评论 -
TencentAdCompetition
'''TencentAdCompetition: 计算广告是互联网最重要的商业模式之一,广告投放效果通常通过曝光、点击和转化各环节来衡量,大多数广告系统受广告效果 数据回流的限制只能通过曝光或点击作为投放效果的衡量标准开展优化。 腾讯社交广告(`http://ads.tencent.com`)发挥特有的用户识别和转化跟踪数据能力,帮助广告主跟踪广告投放后的转化效果, ...原创 2018-10-16 01:01:52 · 314 阅读 · 0 评论