- 博客(13)
- 收藏
- 关注
原创 桑基图-plotly
##读入数据URL <- paste0("https://cdn.rawgit.com/christophergandrud/networkD3/","master/JSONdata/energy.json")Energy <- jsonlite::fromJSON(URL)##查看数据构成str(Energy)List of 2 $ nodes:'data.frame': 4...
2018-03-24 20:23:55
2872
1
原创 python 调用openstreet
import numpy as npimport pandas as pdimport seaborn as snsimport foliumimport webbrowserfrom folium.plugins import HeatMapposi=pd.read_excel("/Users/mike/Desktop/heatmap.xlsx")num = 10lat =...
2018-02-27 11:45:41
886
原创 pandas apply vs agg vs transform
Data Prepartionimport pandas as pdimport numpy as npdf = pd.DataFrame({'A': [1, 1, 2, 2],'B': [1, 2, 3, 4],'C': np.random.randn(4)})2.先来一波正常聚合操作1.求和 sum,计数(非去重:size 或者 len 都可以,去重的:pd.Se
2017-11-14 16:18:07
3168
原创 pandas 实现 sql 中的row_number,dense_rank,rank
data df=pd.DataFrame({'Year':[2012,2013,2013,2014],'Value':[10,20,25,30]})---------------------------------df Value Year0 10 20121 20 20132 25 20133 30 2014实现row_number的排名
2017-11-10 12:38:52
6728
原创 python 实现动态行转列
python 代码import pandas as pdfrom collections import defaultdictgeo_df=pd.read_excel('path\geo.xlsx')geo_dict=defaultdict(list)for k,v in geo_df.values: geo_dict[k].append(v)for i,j in geo_dict
2017-07-04 15:22:38
1067
转载 用心理学解释用户行为
斯金纳同学(Burrhus Frederic Skinner,1904—1990,美国心理学家,新行为主义学习理论的创始人)是一名很严肃的心理学家,他摒弃了传统心理学中“心理活动”的不可考也不可靠的分析,将人的内部思维作为黑盒函数,对心理学的外在刺激与外在行为作为自变量和函数结果,进行科学实验分析,这就是“行为心理学”。而“斯金纳箱”,则是他的一项最著名的研究成果。什么是斯金纳箱?
2017-02-14 17:52:08
2610
原创 R -ggplot2 气泡图
关键词点击成本投入产出比总费用MTF词8.10.1732673有入金的词16.91.1523740外汇词5.50.1813979竞品词3.61.4612765外汇交易词6.30.6111285炒外汇词8.00.329866外汇平台词
2015-03-26 11:18:45
13573
转载 计算熵
1 计算熵我们检查的属性是是否出去玩。用Excel对上面数据的play变量的各个取值排个序(这个工作簿里把“play”这个词去掉),一共是14条记录,你能数出取值为yes的记录有9个,取值为no的有5个,我们说这个样本里有9个正例,5个负例,记为S(9+,5-),S是样本的意思(Sample)。这里熵记为Entropy(S),计算公式为:Entropy(S)=-(9/14)*log
2014-12-18 13:41:42
2286
转载 R 语言 RFM 模型实现
以前一直在猜测RFM的实现原理,今天总算了解了一点直接附上R code,google所得:##Creating Random Sales Data of the format CustomerId (unique to each customer), Sales.Date,Purchase.Valuesales=data.frame(sample(1000:1999,repla
2014-12-09 15:35:12
1530
原创 R-统计--参数的假设检验备忘
r代码> a=c( 914, 920, 910, 934, 953,940, 912, 924, 930)> t.test(a,mu=950,alternative='less') One Sample t-testdata: a t = -4.9589, df = 8, p-value = 0.0005542alternative hypoth
2014-12-04 17:31:08
1438
原创 case when 运用的一点提醒
对于运用sql 的同学对 case when 肯定很熟悉,这边就不贴出 case when 的语法了,直接上例子说明:下面是构建的测试数据,插入语句就不附上了。1.如图所示,结果应该和你想象的没什么不同2.改变一下SUM 的位置咦,好像结果完全相同啊,我是不是在忽悠你们啊,嘿嘿3.那么接下来我们修改一下 条件pay_sum>=20 and
2014-12-02 14:43:26
479
原创 数据分析---常用检验收录
t检验适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。包括配对资料间、样本与均数间、两样本均数间比较三种,三者的计算公式不能混淆。(处理时不用判断分布类型就可以使用t检验)t'检验应用条件与t检验大致相同,但t′检验用于两组间方差不齐时,t′检验的计算公式实际上是方差不齐时t检验的校正公式。U检验应用条件与t检验基本一致,只是当大样本时用U检验,而
2014-11-21 10:26:14
609
转载 深度分析DROP,TRUNCATE与DELETE的区别【我的数据库之路系列】
这次特意从数据库块的层次深度分析一下DROP,TRUNCATE和DELETE的区别: 在此之前先为那些初学数据库的童鞋们阐述2个概念,如果你还没有真正理解这2个概念那也请你看完:DML语句与DDL语句。简单的DML与DDL概念: 我们不去重复那些抽象又没用的概念,简单的说DML语句就是增删改(INSERT,DELETE,UPDATE),DDL就是对数
2013-10-31 16:14:31
756
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人