实例
没有简介
mintminty
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
赛题笔记《地铁乘客流量预测比赛》
1. 赛题背景 分析地铁站的历史刷卡数据,预测站点未来客流量变化,挖掘出行规律 提供2019.1.1-2019.1.25共81个站点的刷卡数据记录,以及路网地图(邻接关系),预测未来一天各站点的逐十分钟累积进出站人次 2. EDA 答辩人2: 周末(图中前两簇)与工作日(图中后五簇)的流量差异,与站点类型有关 ,办公属性站点差异较大,旅游属性站点差异较小。所以纯粹以周末或非周末作为区分,可能不太合理 城际客流的“潮汐效应”,火车站站点的周六和周日流量会存在镜像分布的特点,就比如周六到火车站乘火车,周原创 2020-07-03 12:45:04 · 3687 阅读 · 0 评论 -
《动手学深度学习 pytorch版》代码笔记——第5-8章
第五章 卷积神经网络 知识点1:randn() 与 rand() 函数 作用 np.random.randn() 从标准正态分布中返回一个或多个样本值 np.random.rand(m, n) 生成m行n列的均匀分布的伪随机数 知识点2:统一数据类型 描述: 5.1.3 图像中物体边缘检测中,第一个小例子会出现 expected backend CPU and dtype Float but got backend CPU and dtype Long 的报错。 解决: 将X的数据原创 2020-05-22 18:52:33 · 338 阅读 · 4 评论 -
《动手学深度学习 pytorch版》代码笔记——第1-4章
【1】《动手学深度学习 pytorch版》 【2】《动手学深度学习》 对着敲代码时常会遇到零星问题,本篇博客意在记录实现过程中小小的坑,边学边记~ 1. 数据类型问题 报错: Expected object of scalar type Double but got scalar type Float for argument #2 ‘mat2’ 异常代码行: def linreg(X, w,...原创 2020-05-08 10:58:21 · 1347 阅读 · 0 评论 -
廖雪峰python教程(3)——函数式编程
1. 高阶函数 1.1 map/reduce 【1】一文搞懂python的map、reduce函数 【2】廖雪峰python教程——函数式编程 (1)map 函数 map(function_to_apply, list_of_inputs) function_to_apply 代表函数 list_of_inputs 代表输入序列 返回迭代器 # 如要实现列表中每个元素的平方,并返回新列...原创 2020-04-29 15:50:11 · 408 阅读 · 0 评论 -
廖雪峰python教程(2)——高级特性
廖雪峰python教程——高级特性 1. 切片 本小节的课后习题: 在不调用str的strip()方法情况下,实现一个trim()函数,去除字符串首尾的空格。 (自己写了半天,然后一看别人写的,非常简洁。要注意利用递归。) def trim(s): if len(s) != 0: if s[0] == ' ': return trim(s[1:]...原创 2020-04-27 13:51:32 · 471 阅读 · 0 评论 -
廖雪峰python教程(1)——基础+函数章节
1. 字符编码 【1】廖雪峰python教程——字符串和编码 【2】彻底弄懂 Unicode 编码 1个字节能表示的最大的整数就是255(二进制11111111=十进制255) 2个字节可以表示的最大整数是65535 4个字节可以表示的最大整数是4294967295 编码类型 内容 问题 ASCII 目前为止共定义了128个字符,包括大小写字母、数字和一些符号,如A-65,...原创 2020-04-25 14:08:07 · 786 阅读 · 0 评论 -
Datawhale组队学习 Task5-模型融合
目录大纲1. 集成学习Ensemble Learning1.1 Boosting1.2 Bagging和随机森林1.2.1 Bagging(全称 Bootstrap AGGregatING)1.2.2 随机森林(Random Forest)1.3 结合策略1.3.1 Stacking1.3.2 K折交叉验证下的Stacking(以5折为例)1.3.2 Blending1.3.3 Stacking ...原创 2020-04-03 23:05:15 · 481 阅读 · 1 评论 -
Datawhale组队学习 Task4-建模调参
内容概览1. 基础模型1.1 读取数据1.2 线性回归1.2.1 初试1.2.2 改进1.3 五折交叉验证1.4 模拟真实业务情况1.5 学习率曲线与验证曲线2. 对比模型2.1 线性模型+嵌入式特征2.2 非线性模型3. 模型调参3.1 贪心算法3.2 网格调参3.3 贝叶斯调参 1. 基础模型 1.1 读取数据 知识点1:reduce_mem_usage 函数 对于大量使用数字类型的数据压缩...原创 2020-04-01 17:03:03 · 403 阅读 · 0 评论 -
Datawhale组队学习 Task3-特征工程
Task3-特征工程1. 特征工程概述1.1 相关定义及理解1.2 内容2. 代码示例2.1 导入数据2.2 删除异常值(本文利用箱线图剔除异常值)2.2.1 箱线图2.2.2 删除2.3 用于决策树的特征构造2.3.1 数据分桶2.4 (扩展)用于LR的特征构造2.4.1 power中的异常值处理2.4.2 归一化处理2.4.3 对类别特征进行OneEncoder2.5 特征筛选2.5.1 过滤...原创 2020-03-27 15:25:06 · 450 阅读 · 0 评论 -
Datawhale组队学习 Task2-数据分析
数据分析内容概览1. 数据载入及总览1.1 载入各种数据科学以及可视化库1.2 载入数据1.3 总览数据1.3.1 head()+shape观察数据1.3.2 describe()熟悉相关统计量1.3.3 info()熟悉数据类型2. 判断缺失和异常2.1 缺失值2.2 异常值3. 了解预测值分布3.1 总体分布概况3.1.1 为什么要转化为正态分布3.1.2 样本不服从正态分布怎么办3.1.3 ...原创 2020-03-24 18:00:56 · 1040 阅读 · 2 评论 -
Datawhale组队学习 Task1-赛题理解
1. 赛题概况 任务:预测二手车交易价格 数据:来自某交易平台的二手车交易记录,数据量超过40w,包含31列变量信息,其中15列为匿名变量,抽取15w条作为训练集,5万条作为测试集A,5万条作为测试集B,同时对对name、model、brand和regionCode等信息进行脱敏。 2. 数据概况 注:脱敏处理后均为label encoding形式,即数字形式 Field Descri...原创 2020-03-21 17:28:23 · 334 阅读 · 0 评论
分享