- 博客(7)
- 收藏
- 关注
原创 Binary Search模板总结与LeetCode经典范题
Binary Seach在概念上很容易理解,无非就是每次将搜索空间划分为两份,只保留这二者中可能包含目标值的那一份,持续二分下去,直到完成搜索为止,由此将搜索复杂度从线性时间O(n)O(n)O(n)减少至对数时间O(log n)O(log\ n)O(log n)。但在具体实现上,想要在几分钟内成功写出一份bug free的代码并不是件简单的事情。我们常常会遇到一些恼人的细节问题,诸如while循环的条件应该用while left < right还是用while left <=
2020-08-02 13:04:00
757
原创 赛后复盘 - DataCastle 科大讯飞AI营销算法大赛
最近这个月参加了DataCastle上的科大讯飞AI营销算法大赛,最后的名次是97 / 1086,没能进入复赛(要求前50名)。其实也没什么好失落的,已经尽力了,这就是我现阶段的真实水平。最大的遗憾,应该是比赛结束前三天才知道这个比赛竟然有交流用的QQ群!感觉错过了一个亿!这段时间里总是在想,DataCastle这个平台怎么做得这么差,竞赛圈里没有人发帖,没有交流,只能靠自己和队友埋头苦干。后来才...
2018-10-09 22:49:34
5363
5
原创 基于numpy的前馈神经网络(feedforward neural network)
*** 代码部分可以直接通过Jupyter Notebook来查看这几天在上Andrew Ng教授开的Coursera系列课程Deep Learning,总觉得光是看视频和做作业还不够,还是得自己动手写写代码,亲自实现课程里提到的算法内容,于是便有了这篇博客,作为自己入门深度学习的里程碑吧。前馈神经网络机器学习有两个基本问题,一是回归,二是分类,神经网络大多用于解决分类问题,...
2018-09-08 14:29:21
3537
原创 经典SQL练习题(MySQL版)
原文首发于简书于[2018.07.30]网上有一篇关于SQL的经典文章,超经典SQL练习题,做完这些你的SQL就过关了,引用和分析它的人很多,于是今天复习SQL的时候找来练了练手。原作者用的是SQL Server 2008,我在这里用的是MySQL 8.0.11(二者语法差别不大),文本编辑器用的是Atom 1.28.2(不知道大家用什么,反正用Atom写SQL确实丝质顺滑)。题目顺序...
2018-09-08 14:26:47
218892
167
原创 用Python完成Excel的常用操作
原文首发于简书于[2018.07.23]在以前,商业分析对应的英文单词是Business Analysis,大家用的分析工具是Excel,后来数据量大了,Excel应付不过来了(Excel最大支持行数为1048576行),人们开始转向python和R这样的分析工具了,这时候商业分析对应的单词是Business Analytics。其实python和Excel的使用准则一样,都是[We ...
2018-09-08 14:20:04
50693
4
原创 分类树/装袋法/随机森林算法的R语言实现
原文首发于简书于[2018.06.12]本文是我自己动手用R语言写的实现分类树的代码,以及在此基础上写的袋装法(bagging)和随机森林(random forest)的算法实现。全文的结构是:分类树 基本知识predgini splitrulesplitrule_bestsplitrule_randomsplittingbuildTreepredict装袋法与...
2018-09-08 14:14:54
1872
原创 数据科学入门三个月的一些随想
原文首发于简书于[2018.05.30]这个学期旁听了统数学院的三门课:马景义老师的[数据挖掘],刘苗老师的[时间序列分析],李丰老师的[统计计算]。我以前说,没有数学的日子里,我的生活中只剩下了鄙视链和毒鸡汤,无法进行深层次的思考。现在上了三个月的课,仍是十分赞同这句话。三个月来,在数据科学这个行业里摸爬滚打,算是有不少收获,在这里写一些随想吧。全文的结构是:数据挖掘 关于这...
2018-09-08 13:45:17
1517
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人