
数据之美
文章平均质量分 95
攻城狮墨翁
攻城狮
展开
-
保姆级爬虫实践教程:如何抓取肯尼迪遇刺事件绝密文件
提到肯尼迪遇刺案,中国网友们最先想到什么?是不是脑洞大开?不过这个梗已经比较过时了,因为咱们的建国同志,每天都在整活。近日,特朗普依据其竞选承诺,公开了肯尼迪遇刺事件的绝密文件。这些文件不仅包含政府内部通信、目击者证词,还有大量未曾曝光的照片和证据。它们或许能揭示更多关于肯尼迪遇刺事件的细节,甚至挑战我们对这一历史时刻的传统认知。比如有美国网友看完后感叹,肯尼迪原来是美国最后一任总统呀。原创 2025-03-25 11:05:39 · 674 阅读 · 0 评论 -
Excel实战笔记
字符串提取有这样一列字符串,格式如下:source:14;discount:1000;startFee:3800;benefactor:我是虚构的nick;benefactorId:1125769573现在我们要把benefactor标签后面的值提取出来,比如上面这个字符串中提取出“我是虚构的nick”如果excel有正则表达式匹配函数,那么这当然很容易解决。可惜没有。原创 2013-04-23 19:50:41 · 999 阅读 · 0 评论 -
SAS频数统计
当一位数据分析师拿到一份崭新的数据时,他要做的第一件事很可能是了解其中关键指标的分布情况。频数统计是应对这一情况的最基本的分析工具。分析师通过创建频数统计表,获知某项指标各个或各段值所占的百分比,达到快速了解数据概况的目的。在数据量较少的情况下,强大的Excel可以以多种方式满足分析师的需求。但如果数据量达到百万级,则需要使用更为强大的分析工具。在本文中,我们介绍SAS的频数统计功能,这一功能是通原创 2013-04-07 08:23:50 · 18097 阅读 · 0 评论 -
SAS随机抽样
在统计研究中,针对容量无限或者容量很大以至于无法直接对其进行研究的总体,都是通过从中抽取一部分个体作为研究对象,以考察总体的特征。被抽取的部分个体称为该总体的一个样本。从总体中抽取样本的过程,称为抽样。 抽样包括随机抽样和非随机抽样。非随机抽样是从总体中抽取指定的个体,具有主观意向性,这里不做讨论。 随机抽样是按照随机原则,保证个体都有一定概率被抽取到的抽样方法。常见的随机抽样原创 2012-11-20 14:56:01 · 26100 阅读 · 0 评论 -
Windows 7和Windows 8下安装SAS
本文讲解Windows 7和Windows 8下安装SAS 9.1.3的步骤。打开控制面板,选择程序:在程序和功能项下选择“运行为以前版本的Windows编写的程序”选择程序位置:选择“尝试建议的位置”点击“测试程序”选择语言,默认为“中文(简体)”单击确定,出现SAS安装界原创 2012-11-03 15:26:28 · 4253 阅读 · 0 评论 -
SAS主成分分析
同事讲主成分分析,举了这么个例子:就像你选女人,有身材、相貌两个指标,如果身材、相貌都很突出,那当然很好选择;但如果两个女人,一个身材突出,一个相貌出众,看着都很喜欢,那可如何是好!这个时候通过主成分分析,汇总出一个指标,这个指标可以一定程度上代替原来的身材、相貌,这时就可以排序做出选择了。这例子当然有很多缺陷,但至少指出了主成分分析的目的之一:减少决策变量数,也就是降维。主成分分析的另一个目原创 2013-07-28 20:18:50 · 55359 阅读 · 14 评论