
机器学习
ttdata
如果半途而废,就意味着从头来过
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
特征选择的一些方法
https://wenku.baidu.com/view/12929b5b8762caaedd33d4f2.html转载 2017-09-07 14:17:16 · 343 阅读 · 0 评论 -
机器学习-特征选择
文章来自我的微信公众号CodingRush,欢迎扫码关注。很多时候我们需要做特征选择,一方面是因为我们希望模型能够使用好的特征拟合数据,另一方面多余的特征会导致模型复杂度高,降低模型的泛化能力。最常见的例子就是,文本分类,我们不可能把所有的词都作为特征,而是希望选一些“好的”词作为特征进入到模型。下面我们简单的谈一谈常用的几种特征选择方法。1、Fre转载 2017-09-07 14:25:45 · 421 阅读 · 0 评论 -
机器学习-文本特征选择
一、课题背景概述文本挖掘是一门交叉性学科,涉及数据挖掘、机器学习、模式识别、人工智能、统计学、计算机语言学、计算机网络技术、信息学等多个领域。文本挖掘就是从大量的文档中发现隐含知识和模式的一种方法和工具,它从数据挖掘发展而来,但与传统的数据挖掘又有许多不同。文本挖掘的对象是海量、异构、分布的文档(web);文档内容是人类所使用的自然语言,缺乏计算机可理解的语义。传统数据挖掘所处理的数据是结转载 2017-09-07 14:26:41 · 3333 阅读 · 0 评论 -
机器学习-特征提取
第4步:特征工程或许比选择算法更重要的是正确选择表示数据的特征。从上面的列表中选择合适的算法是相对简单直接的,然而特征工程却更像是一门艺术。主要问题在于我们试图分类的数据在特征空间的描述极少。利如,用像素的灰度值来预测图片通常是不佳的选择;相反,我们需要找到能提高信噪比的数据变换。如果没有这些数据转换,我们的任务可能无法解决。利如,在方向梯度直方图(HOG)出现之前,复杂的视觉任务转载 2017-09-07 14:28:55 · 2137 阅读 · 0 评论 -
机器学习 必读的课程内容
https://www.leiphone.com/news/201610/Oqndr7PXFB9BRI9p.html转载 2017-09-07 14:35:37 · 430 阅读 · 0 评论 -
特征工程-特征离散化
连续特征的离散化:在什么情况下将连续的特征离散化之后可以获得更好的效果?Q:CTR预估,发现CTR预估一般都是用LR,而且特征都是离散的。为什么一定要用离散特征呢?这样做的好处在哪里?A:在工业界,很少直接将连续值作为逻辑回归模型的特征输入,而是将连续特征离散化为一系列0、1特征交给逻辑回归模型,这样做的优势有以下几点:0、 离散特征的增加和减少都很容易,易于模型的转载 2017-09-07 14:40:19 · 738 阅读 · 0 评论 -
以客户为中心进行数据挖掘
http://www.mahaixiang.cn/sjfx/997.html转载 2017-09-07 14:49:47 · 1023 阅读 · 0 评论