- 博客(22)
- 收藏
- 关注
原创 统计学 第二章
数据审核:数据是否有错误,对于原始数据,查看完整性:个数是否有遗失,准确性:数据是否有错。对于二手数据:数据的适用性和时效性。数据排序:按一定顺序将数据排列,以发现明显特征和趋势。按照某种标准分成不同的组别,分组后的数据称为分组数据。条形图:用长短,高度来表示数据的多少(纵置称为柱形图)。帕累托图:按类别出现的频数多少排序后绘制的条形图。饼图:用圆形及圆内扇形的度数来表示数值大小的图形。数据筛选:找出符合特定条件的某类数据。比率:不同类别个数的比值,例如男:女。频数:某一特定类别或组中数据的个数。
2024-10-27 16:19:38
437
原创 网络爬虫 认识网页
区分:动态网页一般每个人看起来不同,也可以用检查,查看网页源代码看javascript是否进行渲染。CSS:主要用于设置HTML页面中的文本样式(字体,大小),图片的外形(宽高,边框)等外观样式。(2)动态网页:一般用HTML和动态脚本语言如JSP,ASP,PHP编写,代码一般不可动。HTML:主要通过HTML标签对网页中的文本,按钮,图片,声音等内容进行描述。(1)静态网页:内容固定,一般以.html、.htm、.shtml为扩展名。网页前后端进行交互的语言:XML和JSON。1.网页制作的标准语言。
2024-10-26 16:51:10
259
原创 统计学 第二章
1.数据的来源 (1)间接来源:数据由别人通过调查或实验方法搜集的(二手资料) a.优点:搜集容易,成本低,作用广泛 b.缺点:对特定问题不准确,可能过时 (2)直接来源:通过调查和实验得来的数据(一手资料) 2.调查方法 (1)概率抽样:按随机原则抽样,总体中的每个单位都有都有一定的机会被选入样本 特点
2024-10-26 15:37:03
543
原创 统计学 第一章
b.时间序列数据:在不同时间收集的数据,有一定的时间顺序,如:2010-2020年我国的国内生产总值,描述现象随时间的变化。a.截面数据:在相同时间点上对不同对象的收集数据,例如:2021年我国各地区的地区生产总值,描述事物某一时刻的变化情况。a.分类数据:用文字描述,数据表现为类别,例如性别。A.描述统计法:研究数据分析,处理,汇总,图表等统计方法.a)离散数据,数据取值有限。E.统计量:用来描述样本特征的概括数字度量,是样本的函数。1.统计学是收集,处理,分析,解释数据并从数据中得出结论的科学方法。
2024-10-26 11:41:05
889
原创 Tableau 第十四课
R平方是拟合度,越大越好,0.14以上就说明很好,p值越小越好,小于0.05越好,决定了系数的可信度。R平方是拟合度,越大越好,0.14以上就说明很好,p值越小越好,小于0.05越好,决定了系数的可信度。其他回归分析一样的道理创建,哪个区域数据点越多,对拟合的影响越大,数据越少,对拟合影响越小。存在相关关系的变量,拟合成直线或者曲线,总结出数据的特征,以及预测未来。选择在这条趋势线,选择描述这条线,复制信息,添加一个注释。创建一个区域作为异常值,创建一个参数。有幂,指数,多项式,线性。
2024-10-20 21:59:56
480
原创 Tableau第十三课
添加字段,将这个显示能力标签放在总计2的标签里面,允许覆盖其他标签。不同排名连接相同的事物,显示排名间的相互关系。将x与y拖入,将路径放入路径,将f1放入颜色,将图改为线图。创建字段,将这个值拖到图1的标签里面,并允许标签覆盖标记。如果将进功能力放在最中间,就是把x和y加pi/2。将利润复制,创建两个图,再用双轴,再用同步轴。创建订购日期和利润的图,并把利润排序。将表2变为圆,将标签显示出来,并对齐。将y复制,并使用双轴合成一个表。将x、y、y修改固定值-7到7。将显示能力标签,转化为离散值。
2024-10-20 21:00:57
253
原创 Tableau 第十二课
将第二个图变为形状,线路放入详细信息,将站点放入到标签,允许覆盖其他标签,将站点放入到颜色里,把使用率放入到第一个图的颜色里,利用双轴将两个图合并。将第二个图设置为形状,将关系拖进详细标签,将省份拖入颜色,将省份拖入标签,显示允许覆盖标签。将x与y依次放入图中,取消聚合度量,将地区放入颜色里面,将大小调粗。将第二个图设置为形状,将点拖入标签,并设置允许覆盖其他标签。将地区放入标签,放入线首端,把数量放入标签,调整格式。将图改为线,将线路放进详细信息,创建两个图。将x,y放入,取消聚合度量。
2024-10-20 19:28:03
248
原创 Tableau 第十一次课
将整体数据的部分统计特征(均值,最小值)展示在图形中,既可以说明群体特征,还可以展示个体信息,更可以比较个体与整体的相对关系。将排名放在标签,进行上述的表计算,然后添加单位到标签,添加累计值到标签。将平均,最大,最小放在详细信息里面,才能在添加参考线有这个计算字段。创建计算字段,每一天人工服务接听量的平均值,最大值,最小值。将正确的排名放在标签里面,向之前编辑表计算,设计标签。将平均值,最大值,最小值的线或者区间加进去。将变化量放在大小里面,在创建一个计算字段。排名不对,将排名赋值,重新编辑。
2024-10-20 18:23:23
189
原创 Tableau 第十课
有第一四分位数和中位数,第三四分位数,上限,下限,异常值,IQR(两个四分位数的插值)漏斗图适用于业务流程的比较,直观的展示业务流程,可以快速发现流程中存在的问题。同时选中两个总计,按住ctrl一起托,将第三个表变为条形图,第四个表变为线图,再点击双轴。选择百分比,表向下,相对于第一个,意思是下面关注人数的增长占了公众号流量多少。编辑一个字段,如果85+就等于85,其他就变为整形,并把这个字段变为维度。创建一个阶段流量图,将阶段中数量从上到下排序,在右表直接拖动。在第四张表,添加数量,添加百分比。
2024-10-18 14:56:51
365
原创 Tableau 第九课
根据我们数据源字段,使用函数与运算符来构造公式定义的字段,类型是数值型和字符型等,新建的字段会保存在数据中。如果我下了一个订单,有笔1,篮球99,那平均下来是100,这是按照订单的方式求平均值。累计汇总就是累加,差异是这个值与上一个值的差异,可以选择相对于上一个还是下一个。构造一个两个不同计算利润率的对比图,其中,利润率是把标签所有的利润率加起来。这个数据怎么来的呢,可以点末尾查看详细数据,这个是订单/订单里面的内容。如何调整,现在计算的是3个月的平均值,如何计算两个月的,创建一个参数。
2024-10-18 09:24:58
493
原创 Tableau第八课
组是我们维度成员或者度量的离散值组合,通过分组可以实现维度成员的组合,以及不良值的按范围分类,组不能用于创建计算字段。创建合并集,就是筛选了一边,再筛选一遍(一定要同一个维度,就是连接字段)集是满足某些条件的数据子集,它是维度的部分成员。上面是静态的,下面是动态的,就是不需要选,自动生成。然后再创建图表,依次拖拽,也可以直接点中心的加号。创建好,可以把需要的层级从上到下,依次拉进去。分组的时候,是同时选中几个数据,然后点分组。第二种,直接把中心拖到部上,编辑分层名称。满足条件的是内,不满足条件的是外。
2024-10-17 13:24:07
204
原创 Tableau第七课
把标记设置多边形,点id放路径,公园名称放颜色,多边形地图的大小和标签没法添加,但是可以添加注释,对地图设置背景,添加图例。tableau可以添加图像作为数据的背景图像,可以通过自定义图像来更换地图的展示形式,选第一个。对填充地图的补充,基于地理编码数据文件的绘制一个多边形区域形成一个多边形地图。打开扩展现有名称测试.数据源,改变国家/地区,城市的地理角色,城市的图标变了,表示扩展了。选择相应的导入文件,在导入时可能报错,例如country。打开相应的数据源,修改大学的地理位置,双击大学。
2024-10-17 10:08:52
169
原创 Tableau 第六课
修改格式,样式表示地图最外面的部分,冲蚀是把这个外部背景颜色变淡,背景地图层就是地图的标记,主要是样式冲蚀国家名称。把第二个的当期值换成同期值,放在大小里面,出现两个名称,把第二个省市标签给拖出去。把当期值放在颜色里面会出现填充地图,放在详细标签会有数据,放在大小会显示形状。先生成一个填充地图,再行中,点击纬度,摁住ctrl,拖拽。把累计值放在颜色里面,改变纬度另外一张表的颜色。对于区域名不正确的,可以添加注释,再设置格式。再在行列添加一些标签,构成多维地图。选中纬度,点双轴,两个图合成一个图。
2024-10-16 19:32:12
197
原创 Tableau 第五课
第一种,直接把国家地区拖进去,再把国家地区拖入到标签(可以用正版免费14天试用版),一般点击右下角未知,点击筛选,可以筛选数据。如果想插入新的形状,找到这个路径,生成一个文件夹,放入png格式的图片,要把tableau关闭后,再打开。第一个取交集,第二个全部保留左侧,订单只取匹配的部分,第三个全部保留右侧,人员取交集,第四个全部保留。第四种,把经度纬度同时选中,在智能显示选地图,再把国家/地区放详细信息里面。第三种,经度放列里面,纬度放行里面,再把国家放详细信息里面。新建仪表板,第二个符号。
2024-10-16 17:32:38
224
原创 Tableau 第四课
这个是要添加的项可以是线,区间,分布和盒须图,这个线的数据来源是什么,是计算平均值还是什么,作用的是整个表还是区间,还是单元格。每一根小蓝柱,都是在前一个的运行利润总和,加上自身的利润,这个标签不代表条形图的实际高度,只表示这个类别的自身情况。先计算每个类别总的利润,再改变汇总:用前几天的盈利状况加上自身的状况看亏损,并在大于0表示盈利,小于0表示亏损。最终蓝色条纹会显示同期值和月度计划值,但表示同期值,竖线会显示月度计划值。当我们计算预期值和实际值时,先筛选出月份,绘制每个省的用电图。
2024-10-15 18:10:32
275
原创 Tableau第三课
其中向下倒三角可以表示是否循环,1-3个长方形表示运动快慢,左三角表示逆着时间,右三角表示顺着时间,显示历史记录可以表示显示轨迹。首先在页面栏要选择时间,才有右边时间变化的轮轴,然后选择电影类型,把年份NULL给取消掉。将颜色记录数脱出,选择累计票房拖到颜色里面,其中面积代表类型数量,深度代表票房数量。可以设置颜色,渐变颜色表示有几个颜色,中心表示以什么为界限。先用类型和数量放在大小绘制一个气泡图,在把标记变为文本。将地区拖入到行,再将总计拖到文本,基本表完成。在基础表的基础上,点智能显示,选第三个方框。
2024-10-14 17:38:16
133
原创 Tableau第二课
创建每年电影票房变化折线图,累计票房不是字符串,应该是度量,只需要拖拽到度量那个位置。绘制酒店价格饼图,开始是条形图,在智能显示选择饼图就会变为饼图。再将一个饼图大小调小,将价格等级拖走,再改变空心颜色。将数字转化为百分比,同时选择设置格式保留几位小数。先要在筛选器选出2015,再在列上改变数值类型。想要突出的数据可以添加注释,并设置相关格式。当数字太长,可以设置数字格式,将其缩小。1.1将数据源拆分,筛选出有用的信息。绘制环形图,先在标记选择饼图。先生成一个饼图有颜色,有角度。将两张图放在同一张图上。
2024-10-14 16:41:03
214
空空如也
我在PAT,结果是正确的,但输出来多一行空格
2023-12-21
可视化环境下、快捷方式、已有命令行界面下等启动Shell程序。
2023-12-12
为啥在谓词逻辑中证明推理是否有效需要将变量变为常量再把常量变为变量
2023-11-24
TA创建的收藏夹 TA关注的收藏夹
TA关注的人