- 博客(28)
- 资源 (2)
- 收藏
- 关注
原创 dataframes
①转变list为DataFramenameFrame= pd.concat(allnames,ignore_index=True)②DataFrame的透视表功能nameFrame.pivot_table('births',index='year',columns='sex',aggfunc=sum)③DataFrame的排序功能nameFrame.so
2017-02-16 16:11:16
495
转载 远程访问jupyter notebook
http://blog.youkuaiyun.com/bitboy_star/article/details/51427306
2017-02-15 15:10:50
314
原创 又一次的迷茫
前行的路上,又开始迷茫,这是感觉最痛苦的事情了,处在这么一个高龄,要变换路线真是前怕狼后怕虎,对自己的选择能力非常担忧。前两天转而去看hadoop,hadoop是用java写的,hadoop权威指南这本书也基本都是使用java 的例子来讲解,java虽然之前用过一段时间,但是用到的东西非常有限。把hadoop的环境在linux上搞通后,运行了几个example,总是找不到感觉,感觉不如看p
2017-02-13 09:25:10
489
原创 python数据分析1
collections之DataFrame和SeriesDataFrame:用于把json字符串转化成表格形式frame如果是DataFrame类型,那么可以把他看成一个表其中frame['列名']得到的就是一列数据,也称之为Series使用series.value_counts()可以得到数据出现的频度 frameOut[64]:
2017-02-09 17:21:05
409
原创 python数据分析准备(安装python和canopy用于科学计算)
安装的时候走了点弯路,书上说的集成环境已经过时,后来百度了canopy做为集成环境安装canopy做为集成环境,默认启动需要连到X Server,因此在linux主机上安装了X client相关命令,包括X11, "X system" "Desktop"等等在window上安装了X-ming做为X server因为linux是远程主机,后来又在ssh上做了X11 转发最终canop
2017-02-09 16:29:11
1878
原创 置信区间(已知样本均值和样本的方差,求总体均值的置信区间)(n < 30)
当样本很小时 X¯¯¯\overline{X}服从T分布T ~ t(v)样本的数量为n时,v = n-1 T = (X¯¯¯\overline{X} - μ)/(s/n√\sqrt{n})与上篇文章的置信区间相似,只不过c换成了t置信区间取值范围为(X¯¯¯\overline{X} - t(v)*s/n√\sqrt{n}, X¯¯¯\overline{X} + t(v)*s/n√\sqrt{
2017-02-07 17:09:06
30234
3
原创 置信区间(已知样本均值和总体的方差,求总体均值的置信区间)(n > 30)
例子1:糖果公司用一个100粒糖球的样本得出口味持续时间均值的点估计量为62.7分钟,同时总体方差的点估计量为25分钟,这里的均值估计量是根据样本得出的,而方差是总体方差一般来说给出一个区间比给出一个精确的值更保险一些,此例正是为了获取这个区间, P(a<μ
2017-02-07 15:11:34
48632
原创 总体和样本
一: 基本点估值①均值 X¯¯¯\overline {X} 表示样本的均值 μ^\hat μ 表示总体的均值的点估计量 当认为可以使用样本均值代替总体均值的点估计量时 μ^\hat μ = X¯¯¯\overline {X} ②方差 σ^²\hat{\sigma}² 表示总体方差的点估计量σ^²\hat{\sigma}² = (Σ(x-x¯\overline {x} )²) /
2017-02-07 14:50:21
976
原创 是应该坚持自己,还是听别人的建议?
过年的时候使用电脑不太方便,用手机在看“深入浅出统计学”这本书,没办法记笔记,感觉效果不太好,回来后花时间把年里看的书用思维导图重新复习了一下,书看到一半的时候加了几个数据分析的群,问了下像我这样码农转数据分析的难易程度,不太被看好,心里有点犹豫,不知道自己选的路是否正确,先把这本书看完吧,同时还要不断思考自己的职业规划。
2017-02-04 15:05:42
383
原创 数据统计2(三种平均数)
①均值均值 = Σx / n = μ假设成绩为90分的有3个成绩为91分的有4个成绩为92分的有5个Σ(fx) = 90*3+91*4+92*5Σ(f) = 3+4+5均值 = Σ(fx)/Σ(f) ②异常值③中位数,把一堆数按照顺序排列后,在中间的数字为中位数
2017-01-23 11:37:27
1717
原创 数据统计1(各种统计图形)
饼图:参与者太多,对比又不太明显的时候不适合使用饼图条形图:可以比较直观的用于比较,适用于对类别的比较,但是不好看趋势折线图:比较容易看趋势,折线图的横轴必须是数值型,也就是说横轴本身有一定的规律直方图(要求面积和频数是成正比的,两个分组之间不能有间隔)当每个分组的宽度都是一致的时候,可以让每个分组作为横坐标,频数本身作为纵坐标每个分组的宽度不一致的时候如何画直
2017-01-23 10:41:24
4138
原创 数据分析3
利用R语言生成直方图hist(表$列,breaks)把所有的行分为breaks个组,也就是有多少个柱子,假设breaks=50如果采集到了250个样本的化,那么这250个样本分成50组,每组有一个平均值?一般来说breaks的值越大越能看到概貌,越小则越准确R语言计算标准差/均方差标准差:所有数减去其平均值的平方和,所得结果除以该组数之个数(或个数减一,即变
2017-01-21 14:12:28
316
原创 数据分析2(案例5和6)
案例五预测手机商会在什么时间点发布手机第一步使用排除法,第二步使用证据对假设加权,看出哪种假设的权值更高案例六第一步:基础概率(PL)为1%,也就是普通人的基础概率,使用方法1患病且检验为阳性的概率为90%没有患病且检验为阳性的概率为9%一个人在检验阳性的条件下患病的概率 = (基础患病概率 * 患病的人检验为阳性的概
2017-01-20 16:45:14
602
原创 数据分析初入门
惆怅之后总要前行,昨天在看一本书《深入浅出数据分析》,据说这本书是数据分析的入门级。。。 昨天看了100多页,印象中大概讲了这么几个案例 案例1:如何通过分析数据为公司提供销量 确认-分解-评估-决策 正确的决策要建设在正确的假设基础上 少女面霜,男士面霜? 案例2:如何通过变量、约束实现目标的最大利润化 solver 橡皮鱼 橡皮鸭 案例3:找出公司咖啡销量下滑
2017-01-20 09:39:23
348
原创 每天一点点
人生其实就是不断面临许多个选择,一段时间内,你会发现总有好多岔路口,有一些是别人给你创造的,有一些是你自己创造的,选择的能力实在是太重要了,最近ai特别的或,火到如果你不参与其中,未来的几年可能你就会失业?如何在自己选择的方向上找到一个切入点呢,太贪心又往往会一无所有。 如果有上帝告诉你,向一个方向努力,你肯定会成功的,相信成功的人的比率会非常高,但是实际上你想努力,却不知道自己的努力是
2017-01-19 11:19:08
290
原创 每天一点点
不得不说我的这次转化是非常功利的,是的,我是瞄准了就业这个目标去转化的,看重的是产品经理这个职位能够做的更长久,虽然我自己也不确定,是啊,谁能保证哪天产品经理不会来个35岁的约定呢? 即使是现在还有行走在泥潭里的感觉,对于编码来说,没有实际的项目,只是纯看书收效甚微,对于现在的我来说有的也就只有时间,这几天主要是看一些跟产品相关的文章,阅读的过程中伴随着对自己的选择是否正确的深深的忧虑
2017-01-18 10:15:58
212
原创 转化前的一些思考
到处都是技术转产品,感觉老掉渣了,但是我还是不可避免要走向这条路,纵然对于自己十几年的技术生涯有诸多不舍,也还是希望自己能在转产品的大路上顺利走下去。转变技术思维,把用户想成傻瓜式,从战略层、范围层、结构层、框架层、表现层去体验,体验APP具备商业思维,多看一些商业资讯类的网站,例如36氪、虎嗅等培养自己商业上的感觉 项目管理能力,这个已经有相关经验,所以应该不是问题文档能力,也需要加强
2017-01-17 16:05:22
229
转载 欢迎使用优快云-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2017-01-17 15:52:52
211
原创 extjs tabpanel 添加header不能重复加载tabpanel 的问题
创建一个tabpanel用以下configtabBarHeaderPosition : 2,header : { height : 80, layout : { align : 'stretchmax' }, title : { } },第二次创建此tabpanel时提示Canno
2015-03-10 14:13:28
748
原创 开发模式下,extjs中使用scss,并及时更新
使用sencha app build后会生成app-all.css,找到css文件的路径包含在index.html中,运行sencha app watch,修改scss时,所有变更会自动反映到app-all.css
2015-03-04 17:42:39
802
转载 为extjs项目添加图表支持
he application's app.json must have this require added:"requires": ["sencha-charts"]once added, refresh the application (within it's directory):sencha app refresh
2015-03-04 17:10:03
501
原创 extjs中的几个布局
hbox和column布局可以根据子控件的高度产生滚动栏,只需要把autoScroll属性设置true即可对于vbox布局,没办法产生滚动栏,只能在需要产生滚动栏的子控件中重新加上控件,使用布局auto,autoScroll属性设置true上述办法只适用于在单个子控件中产生滚动栏如果要在vbox布局中产生滚动栏。。可以直接使用auto布局
2015-02-16 11:17:22
245
原创 extjs中浮动控件和主控件的对齐方式
parent是朱控件float是浮动控件float.showBy(parent,alignmode);tl-tr其中tl代表top-left,tr代表top-righttl是指float的位置,tr是指parent的位置
2015-02-16 11:15:18
408
转载 多个slider的应用
http://try.sencha.com/touch/2.0.1/demos/Ext.field.Slider.component.allowThumbsOverlapping/viewer.html
2015-02-07 21:33:12
389
转载 extjs翻页控件
http://dev.sencha.com/ext/5.1.0/examples/kitchensink/#progress-bar-pager
2015-02-07 20:57:56
438
转载 extjs 图表的一个例子
http://dev.sencha.com/ext/5.1.0/examples/kitchensink/#widget-grid
2015-02-07 20:56:36
340
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人