- 博客(17)
- 收藏
- 关注
原创 Task4 建模调参
一、学习目标了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程。二、主要应用线性回归模型:线性回归对于特征的要求;处理长尾分布;理解线性回归模型;模型性能验证:评价函数与目标函数;交叉验证方法;留一验证方法;针对时间序列问题的验证;绘制学习率曲线;绘制验证曲线;嵌入式特征选择:Lasso回归;Ridge回归;决策树;模型对比:常用线性模型;常用非线性模型;模型调参:贪心调参方法;网格调参方法;贝叶斯调参方法;三、代码示例读取数据reduc
2021-04-22 22:21:43
149
原创 Task3 特征工程
一、特征工程内容常见的特征工程包括:异常处理:通过箱线图(或 3-Sigma)分析删除异常值;BOX-COX 转换(处理有偏分布);长尾截断;特征归一化/标准化:标准化(转换为标准正态分布);归一化(抓换到 [0,1] 区间);针对幂律分布,可以采用公式: log(1+x1+median)log(\frac{1+x}{1+median})log(1+median1+x)数据分桶:等频分桶;等距分桶;Best-KS 分桶(类似利用基尼指数进行二分类);卡方分桶;缺失值处理:不
2021-04-18 14:56:26
266
原创 河北高校数据挖掘大赛之Task2 EDA-数据探索性分析
一、EDA目标EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集是否可以用于接下来的机器学习或者深度学习使用。当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。完成对于数据的探索性分析,并对于数据进行一些图表或者文字总结。二、内容介绍载入各种数据科学以及可视化库:数据科学库 pandas、numpy、scipy;可视化库
2021-04-16 13:55:33
156
原创 河北高校数据挖掘比赛之Task1赛题理解
今天是对二手车价格预测比赛的赛题理解,主要内容是了解赛题的数据和目标,清楚评分体系。下载数据并挂载到实验室,熟悉比赛流程。一、了解学习目标本次新人赛以二手车市场为背景,要求选手预测二手汽车的交易价格,这是一个典型的回归问题。其中包括数据科学库、通用流程和baseline方案学习三部分。二、赛题概况赛题以预测二手车的交易价格为任务,数据集报名后可见并可下载,该数据来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取15万条作为
2021-04-12 15:30:46
250
1
原创 河北高校数据挖掘竞赛Task0熟悉规则(基于阿里天池实验室)
这次数据挖掘学习主要是关于二手车的交易价格的预测,接下来就是第一天的学习内容啦。一、阿里云-阿里天池实验室搭建GPUGPU(图形处理器),是图形系统结构的重要元件,是连接计算机和显示终端的纽带。在这次学习中, 主要使用了阿里天池实验室所提供的GPU来完成模型的搭建。二、实验室搭建步骤首先我们需要注册阿里云的账户,当然,你也可以使用钉钉,支付宝,淘宝等账户,同样可以进入页面当中。当然啦,只有你报名一个比赛之后,才可以真正使用它自带的实验室功能。接下来我们就来讲解一下搭建流程和注意事项吧。ste
2021-04-11 11:45:24
776
原创 哈希表实现电话查询系统
#include<iostream>using namespace std;struct Data{ char *name; char *phone; char *adress; Data *nextData;};class Hash{private: Data *phoneBook[8];public: Hash(); void Add(ch...
2018-12-28 22:28:18
2309
1
原创 C++实现简单的停车场管理系统
最近学习数据结构的栈,队列,链表知识,遂做一个简单的停车场管理系统。#include <iostream>using namespace std;#define maxsize 14#define n 3#define fee 10//车辆信息struct car{ char bb; int num; int time;} ;//停车场栈...
2018-12-02 15:31:21
10682
3
原创 数据结构约瑟夫环(C++实现)【顺序结构及循环链表结构】
问题:编号为1、2、···、n的n个人按顺时针方向围坐一圈,每人有一个正整数编号。从某个位置上的人开始报数,数到m的人便出列;下一个人(第m+1个)又从1数起,数到m的人便是第2个出列的人;依次重复下去,直到最后一个人出列,于是得到一个新的次序,试设计程序求出出列顺序。顺序结构要点:1.利用动态数组(末尾释放)及函数移位2.及时判断是否到末尾,回到开头#include&l...
2018-11-17 10:59:34
2933
原创 css实现水平垂直居中大合辑
一.水平居中:(1)行内元素把行内元素嵌套在一个块级(display:block)的父元素中,给父元素添加属性。.parent { text-align:center;}(2)块状元素.item { /* 有顶端外边距 */ margin: 10px auto; /*10px可变任意数值*/}(3)多个块状元素将要居中元素的display设为inli...
2018-11-08 14:00:43
136
原创 浅谈css盒子模型
说起css盒子模型,它基本内容很简单,但是他对排版起着至关重要的作用,在实际编程中大家一般喜欢用W3C标准模型盒子,除此之外,还有IE盒子这一模型。盒子,顾名思义,首先就需要有一个合适的大小来满足存放它的条件,所以我们有了 margin(外边距),来让它的大小适宜于整个网页页面,而不至于在页面中显示太过拥挤,更重要的是居中常常也用到它,后面我会详细讲居中这一块。而光有了外面的美观并不足够,盒子...
2018-11-06 00:26:05
211
原创 前端学习路线(1)
首先我想先介绍一下我的自学方式,可能不是适用于所有人,但希望能为别人提供一些借鉴。第一是HTML和css。我是用菜鸟课程初步入门的,我首先快速浏览看完了所有标签用法(这个很快,最多一天就能看完),然后在百度前端学院(好像就叫这个),我看的时候,刚好它的一期结束了,不过没关系,题目还是可以看的,我看了题目要求,滤过简单到爆的题目,在所有的题目中抽了两个来做,基本是最后两个吧,题目很棒,一个页...
2018-11-05 00:54:27
166
原创 初学前端小记
自学前端以来已经五月有余,中间断断续续,停了好久,加起来真正学习了的天数也不过一个月余,又最近心情不佳,本在自暴自弃边缘徘徊,但因巧合熟悉了一些大佬,看见他们的学习方式及言语态度,心中对自己的所做所为深感愧疚,遂记此次小记来警醒自己,不要好高骛远,好好打牢基础才是关键。这算是我自出生生以来写的第一篇博客,接下来,我想在我学习的每一天写写自己的所思所想,分享给大家,第一是提升自己学习的动力,第二是希...
2018-11-04 23:45:40
186
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人