自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Leon

胡乱写点博客

  • 博客(11)
  • 收藏
  • 关注

翻译 为什么样本方差是除以N-1而不是N?

具体链接请参考: http://www.visiondummy.com/2014/03/divide-variance-n-1/有空了再翻译

2018-09-27 19:50:02 1454

转载 Bias-Variance tradeoff

通常我们对监督学习模型进行评估的时候, 需要权衡variance和bias.模型评估主要根据公式,即用squred mean error来评估.通过一系列推导可以证明:(来源https://en.wikipedia.org/wiki/Bias%E2%80%93variance_tradeoff)因此模型的拟合效果是由的方差和偏差构成的. 方差高的模型,往往更复杂, 有更多的参数...

2018-09-27 19:00:58 691

原创 python常用算法

Quick Sort 快排def QuickSort(myList): if len(myList) > 1: pviot = myList[0] low = QuickSort([x for x in myList if x < pviot]) mid = [x for x in myList if x== pviot] ...

2018-05-10 22:52:26 284

原创 我们的作息习惯改变了很多

        这一二十年来,  绝大部分城市人口的作息习惯发生了很大变化, 尤其对于年轻人, 很多人都很晚才睡. 然而似乎没有多少人真正研究过, 这样的作息变化, 对每个人带来什么影响, 这样的情况下, 该如何保护我们的身体? 有什么商机?...

2018-05-09 09:42:54 445

转载 数据科学之路(Becoming a Data Scientist – Curriculum via Metromap)

http://nirvacana.com/thoughts/2013/07/08/becoming-a-data-scientist/

2018-05-07 14:12:43 516

原创 如何高效的获得信息?怎样让刷头条变得更有价值?

        最近,看了一些逻辑相关的书后,我觉得自己在通过阅读和听别人讲话时,获取信息的效率很低,归根结底是由于逻辑不够清晰。我的优点是极强的信息获取能力,可以通过检索获取一切问题的解决方法。如果在阅读的时候,能有更清楚的目的性,那么每天就算刷头条,仍可以获得大量有用信息。那么,该如何高效的刷头条?笔者最近有一些简单的思考,拿来分享。1.点开一条新闻的时候,应该有更清楚的目的性。       ...

2018-05-02 13:09:53 1178

原创 百度地图根据经纬度判断点是否在行政区内

有时候我们需要通过经纬度判断点是否在行政区内,这个问题的解答分为3步。1.获取点的坐标,这些一般来自于系统的自动抓取,主要记录事件发生的地理位置。这可能涉及不同坐标系的转换。2.获取行政区多边形信息,可利用百度地图API,用以下脚本<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org...

2018-04-26 10:05:35 13650 2

翻译 百科全书

1.Pearson correlation 和 Spearman correlation的区别是什么?A correlation coefficient measures the extent to which two variables tend to change together. The coefficient describes both the strength and the dir...

2018-04-25 15:50:00 192

翻译 为什么决策树模型不考虑变量之间的共线性?

在做线性回归时,假设之一是要求自变量之间没有强共线性,但是用决策树模型做预测时,却没有这个要求。于是乎,查询了一下,在Quora上找到了相关答案。Is multicollinearity a problem with gradient boosted trees?总结一下,主要有下面几个原因1.在统计分析中,作推断(inference)时,如果自变量存在共线性,将无法区分它们对因变量的影响,因此无...

2018-04-24 19:09:42 9146 1

原创 百度地图API热力图 (滑块动态调整参数,可获得行政区,且增加了关键字搜索功能)

        此文主要根据百度地图API热力图的demo(http://lbsyun.baidu.com/jsdemo.htm#c1_15),进行了一些小的调整,加入了其他一些模块,可用滑块动态调整参数,并可获得行政区。<!DOCTYPE html><html><head> <meta http-equiv="Content-Type" co...

2018-04-24 17:27:38 7978 12

原创 从今天起开始写博客

写博客的主要目的1.每天读取的信息量太大,需要进行整理归纳,这样可以更好的学以致用;2.将自己的有趣的想法记录想来,将自己的思考记录下来,通过博客成长;3.博客也是一个别人了解自己的方式,尤其对于我这种喜欢思考而不爱说话的人,这种方式更有用。...

2018-04-24 16:46:34 132

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除