
人工智能
yfx000
这个作者很懒,什么都没留下…
展开
-
特征工程入门与实践_笔记_sklearn_python
目录一、特征理解1、定类数据2、定序数据3、定距数据4、定比数据二、清洗数据1、识别缺失值(1)删除缺失值的行(2)填充缺失值(医学类数据禁用,因为要求真实)2、标准化、归一化三、特征构建1、定类特征的填充2、定量特征的填充3、定类特征的编码4、定序特征的编码5、连续值分箱6、扩展数值特征之多项式拟合7、文本的特征构建...原创 2019-11-17 16:23:00 · 756 阅读 · 0 评论 -
AutoML_自动机器学习_框架_信息_汇总_全面_资源
本文旨在对好的AutoML框架或重要信息做个汇总,不定期更新,并统计了截至2019-10的github星数(star)一、概念理解AutoML和神经架构搜索(NAS),是深度学习领域的新一代王者。这些方法能快糙猛地搞定机器学习任务,简单有效,高度符合当代科技公司核心价值观。https://zhuanlan.zhihu.com/p/42924585在传统深度学习...原创 2019-10-23 13:23:38 · 1772 阅读 · 2 评论 -
两步安装tensorflow在windows上
总体来说两步就能安装成功:1、安装python,如下是exe安装程序懒人必备https://www.python.org/ftp/python/3.5.3/python-3.5.3-amd64.exe 说明:tensorflow原文:“TensorFlow supports only 64-bit Python 3.5 on Windows.” 所以我上面选得3...原创 2017-03-04 23:09:58 · 3446 阅读 · 2 评论 -
machine learning 常用算法
一、监督学习1、分类(1)KNN (K个nereast neighbors)(2)DT 决策树 (Decision Tree)(3)SVM 支撑向量集(Support Vector machine )(4)NN 神经网络(nerual network)(5)NB 贝叶斯 (native bayes)2、回归(1)LR (Linear Regres原创 2017-07-09 16:42:33 · 298 阅读 · 0 评论 -
中心极限定理-通俗理解
中心极限定理-通俗理解:1、大量相互独立的随机变量,其求和后的平均值服从正态分布,分布是指按照每个平均值的出现频数去判断分布2、给定一个任意分布的总体。每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。然后把这 m 组抽样分别求出平均值。 这些平均值的分布接近正态分布。 本文的例子通过扔骰子,模拟实现,思路如下:1、进行了5000组实验,每个实验,扔100次骰子并求和,...原创 2018-08-03 00:00:20 · 12489 阅读 · 0 评论 -
数据挖掘十大经典算法
数据挖掘十大经典算法一、C4.5 C4.5,是机器学习算法中的一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法ID3的改进算法,所以基本上了解了一半决策树构造方法就能构造它。决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的分类条件。二、The k-means algorithm 即K-Means算法...转载 2018-12-27 22:02:20 · 412 阅读 · 0 评论 -
机器学习_公开数据集
机器学习_公开数据集https://archive.ics.uci.edu/https://aws.amazon.com/cn/public-datasets/https://www.kaggle.com/competitionshttp://www.kdnuggets.com/datasets/index.htmlhttp://www.sogou.com/labs/resource/list...原创 2019-04-04 15:06:46 · 578 阅读 · 0 评论 -
nvidia_DIGITS_深度学习_模型训练_工具_平台
DIGITS (theDeep LearningGPUTrainingSystem) is a webapp for training deep learning models. The currently supported frameworks are: Caffe, Torch, and Tensorflow.githubhttps://github.com/NVIDIA/D...原创 2019-07-29 10:20:44 · 610 阅读 · 0 评论