- 博客(27)
- 收藏
- 关注
原创 自动调参工具--贝叶斯调参
一般的方法就是网格搜索(sklearn里面的gridsearch)、贝叶斯调参(hyperopt工具)。http://www.360doc.com/content/18/0707/15/7669533_768542933.shtml
2019-10-10 10:41:00
479
原创 Stacking结构介绍+代码实现
stacking是这两年打数据比赛被人熟知的方法,看了几篇,感觉有几个写的不错。1.介绍篇:https://blog.youkuaiyun.com/wstcjf/article/details/779899632.代码篇:https://blog.youkuaiyun.com/WxyangID/article/details/80205075https://blog.youkuaiyun.com/shine199...
2019-10-09 11:11:09
2453
转载 Mac 安装SecureCRT
网上搜了这么多,还是这个同学的方法详细可行https://blog.youkuaiyun.com/hc_mm/article/details/82657037
2019-07-12 18:32:12
1063
原创 Mac 安装lightgbm指南
版本:10.13.6先是按照官方指南做,然后有3个坑注意: (1)brew install gcc --without-multilib 这一步,显示without-multilib是无效命令,我就直接brew install gcc。然后最后几步,(2)export CXX=g++-7 CC=gcc-7这里是个坑,需要适配我们自己的gcc版本。查看自己的版本:通过c...
2019-07-09 16:16:19
2477
原创 PU learning 算法
一.背景介绍原本是02年提出的一个算法,但是到去年8月份,关于PU learning 的博客介绍都很少(可参考性很差),前几天做毕设,忽然欣喜地发现这半年里陆续出现了几篇关于该算法的文章,挺不错,和大家分享一下。1.去年我只找到了一篇ACM期刊的论文解析,有个博客介绍得很不错,文章思路通俗易懂,是很好的入门样例https://www.cnblogs.com/DjangoBlog/p/9...
2019-05-04 17:31:09
3602
转载 上传本地代码到git hub
先参考文章1,然后执行到第五步的时候,需要在把本地密钥加到github上,参考文章2,直接按第二条开始做就好,最后再把文章1的第六七步做完就好。一些常用指令:git add --all 添加所有更新git commit -m "we did it"//提交修改说明git status//查看状态git push origin master//上传修改git pull ori...
2019-03-08 22:11:27
378
原创 概率论的一些讨论
1.假设检验1)显著性水平αa.小概率事件:我们将发生概率小于某个阈值的事件称为小概率事件,一般让这个阈值=0.05(或者0.01),在假设检验中常记这个阈值为α,称为显著性水平。如果某件事的概率超过这个值,我们认为它不是小概率事件,我们便不能做这件事。放到假设检验中就是,如果最后计算的统计量P>阈值(即显著性水平),那么“我们接受H0,会犯错误”这个事就不是小概率了,也就是我们接受...
2018-08-28 15:57:46
1018
原创 IJCAI-2018--广告销量预测 19/5200 思路
这次比赛的最大感受就是:别掉以轻心,初赛和复赛开始我们成绩一直在前边,导致心态太翘,该尝试的探索的其他模型没有去做,光在特征上按照初赛思路去做,没有绝杀技,导致有后手的把我们ko了。惨痛教训。。。------------------------------------------------------------------------------------------------------...
2018-05-24 10:10:58
615
原创 推荐一个很全面的python安装包下载的网址
https://www.lfd.uci.edu/~gohlke/pythonlibs/#pillow
2018-05-22 15:45:05
2929
原创 研究生初学机器学习的几点建议
通过我自己的这大半年的接触和了解,结合找工作需要现对于如何入门机器学习提几点自己的看法。如果你以后要想干算法工程师、机器学习工程师,数据挖掘工程师。那么请你好好看一下我下面说的话。============================================================================总路线 先学机器学习,再学深度...
2018-05-18 17:51:41
9231
4
原创 Numpy,List,Dic,Dataframe 和Series
np是数组,list是列表。ny是可以查看数组shape的。而list没有shape标签list转化成np:a=np.array([1,2,3,4,5])字典要想幻化成list,需要先将自己转化成np.array,再用tolist函数变成列表。实例比较:def max()//求取集合中最大值下标那么哪些可以作为输入的集合呢?np.array([[2],[4],[3],[1],[9]]) 可以 ...
2018-05-18 17:24:32
402
原创 深度学习--资料篇
实验室学长给的意见是先学习机器学习,再学习深度学习。资料列表:1.西瓜书《机器学习》(周志华著)+AI圣经《Deep learning》/《深度学习》(英/中文版都有,根据自己情况来,中文版也不错)(作者是Ian Goodfellow,Yoshua Benjio等人)2.tensorflow的学习可以买本书参考,也可以直接去英文官网看教程,不懂去看官网,也可以看视频。熟练了以后参加几个比赛CCF的...
2018-05-18 17:21:34
308
转载 机器学习--模型比较篇
1.bagging & boosting1)样本选择上:Bagging:训练集是在原始集中有放回选取的,从原始集中选出的各轮训练集之间是独立的。Boosting:每一轮的训练集不变,只是训练集中每个样例在分类器中的权重发生变化。而权值是根据上一轮的分类结果进行调整。2)样例权重:Bagging:使用均匀取样,每个样例的权重相等Boosting:根据错误率不断调整样例的权值,错误率越大则权重...
2018-05-16 16:31:01
663
转载 机器学习--基础模型篇
1、线性模型http://www.cnblogs.com/pinard/p/6026343.htmlhttp://blog.youkuaiyun.com/u012102306/article/details/52988660http://blog.youkuaiyun.com/gamer_gyt/article/details/512327332、LogisticRegressionhttp://www.jianshu....
2018-05-16 16:21:13
212
转载 Python的一些特性
1.生成器(generator)1.1 yield理解:http://www.jianshu.com/p/d09778f4e0552.深浅拷贝a.转自我的简书b. https://blog.youkuaiyun.com/a657997301/article/details/79776097
2018-05-16 16:20:04
142
转载 数据结构基础知识
1树的遍历:三序:http://m.blog.youkuaiyun.com/soundwave_/article/details/53120766知二序,推二叉树(必须知道中序)https://www.cnblogs.com/xinchrome/p/4905608.html
2018-05-16 16:18:32
134
转载 有限内存读取超大数据
1.1https://www.kaggle.com/c/talkingdata-adtracking-fraud-detection/discussion/561051.2https://blog.youkuaiyun.com/xingkong_dahai/article/details/77140918分块读取完后,对int,float和object进行修改类型,可以节省很多内存,然后再保存成pickle文...
2018-05-16 16:13:09
1065
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人