
机器学习
文章平均质量分 91
SummerStoneS
这个作者很懒,什么都没留下…
展开
-
bias-variance trade-off
The bias-variance dilemma (or bias-variance trade-off) is a fundamental concept in machine learning and statistical modeling that describes the trade-off between two types of errors that can occur when building predictive models:Definition: Bias refers to原创 2025-02-09 11:26:29 · 696 阅读 · 0 评论 -
建模数据预处理--数据检查、变量标准化、分布变换、构造特征、特征筛选
一、数据检查1)缺失值有时候是null,有时候全是0,这个需要比想象中更仔细,因为取数的同学们有时候会默认填充0,有时候是因为数据库迁移,产品刚刚发布所以太远的数据没有等原因造成的,这些需要及时确认对于有些变量仅对特定的人有值,(比如说理财的产品偏好,当然只有买了理财的人才会有偏好数据可以分析),可以给没有这个值的人填充一个数值,可以是999这样这个字段不会取到的大值(但是要注意在模型...原创 2019-08-09 12:09:28 · 738 阅读 · 0 评论 -
python prophet 预测销量及参数调整
prophet是一个比较自动的时间序列模型,在时间足够长的情况下,可以捕捉到年周期,月周期,季度周期,一周内的周期等,以及长期趋势,它可以通过图直观地展示各个因素对预测结果的影响,也可以在单一的数据序列(例如销量)之外加入其它影响序列的因素,比如说节日的影响,我们可以给各个节日的影响强度自定义数字,以及节日的前期预热,和节日的延续时间窗prophet一个重要特性是changepoint,它会自...原创 2020-03-22 21:38:56 · 6766 阅读 · 4 评论 -
SVM支持向量机分类模型SVC理论+python sklean.svm实践
支持向量机是啥有一次公司项目上的同事一起吃饭(面前是一锅炒土鸡),提到了支持向量机,学文的同事就问支持向量机是什么,另一个数学物理大牛想了一下,然后说,一种鸡。。。确实很难一句话解释清楚这只鸡。。。supportvectormachine从字面意思来说应该是依靠supportvector来划分数据(其实也能回归啦。。)的机器学习模型。它是一个凸优化问题。SVM的核心将数据的特征投射到高维,然后原创 2017-11-16 17:32:07 · 11899 阅读 · 0 评论 -
tensorflow学习day2简单监督学习模型及用tf.train.Saver实现检查点恢复
对于有监督学习问题,通用的模型训练和评估框架可以是:# 有监督学习框架import tensorflow as tfdef inference(x): # 计算模型在x上的输出,返回结果def loss(x, y): # 根据x对应的实际y值和模型给出的y值计算损失def inputs(): # 读取训练数据x和ydef train(total_los原创 2017-09-30 14:26:01 · 1466 阅读 · 0 评论 -
TensorFlow学习Day3读取csv文件,动手写个logistic,softmax分类模型
上一篇讲到了logistic模型,今天用kaggle竞赛的数据集Titanic做一个小小的训练示范。数据集可以从官网下载:https://www.kaggle.com/c/titanic/data首先我们写一个读取文件的函数# 读取文件def read_csv(batch_size, file_name, record_defaults): filename_queu原创 2017-10-02 12:26:55 · 2400 阅读 · 0 评论