- 博客(87)
- 收藏
- 关注
原创 【数据分析】有关前文的复习
只有在Series和DataFrame中,列索引筛选的数据进行格式转换时,才需要。对象中访问日期和时间的各个组成部分,便于日期时间数据的操作和分析。类似 Excel 的数据透视表功能,非常适合数据汇总和分析。它们非常适合处理结构化数据,尤其是时间序列和表格数据。是一个功能强大的工具,可以方便地将各种格式的数据转换为。统计和汇总:(需要其他计算时,要自行学习)函数内传入的参数,是需要转换的指定格式。日期时间格式,使得日期时间处理更为简单。是一个方便的接口,可以直接在。创建包含日期和时间的。
2025-03-23 17:36:59
900
原创 【数据分析】格式转化和时间类型1
在实际应用中,更多时候,我们从文件中读取数据,存放在CSV、Excel文件中的时间,都是字符串型数据。时间的运算,有自己的逻辑和规则,和现有的字符串、整型、浮点型的逻辑不一样。实用场景:拿到一份数据,或者在数据处理过程中,我们有时会简单对数据做一点简单变换,也就是数据预处理。在这里,这两列的数据,转化成时间格式后,重新赋值给这两列,也就是覆盖了原先的数据。:将更高频率的时间数据重采样到较低频率,如将每日数据转换为每月数据,并进行聚合。有时,也会将时间类型数据,按照指定的格式,转为字符串数据。
2025-03-23 17:32:33
1107
原创 【数据分析】数据筛选(布尔索引:多个判断条件)
接下来,要同时输出 "cutdown_price"大于0 和 "post_fee"大于0的行数据,就需要在一个索引中,使用 & 来连接对应的两个判断条件。这一行代码的功能是使用布尔索引结合取反运算符 `~`,从 `data` 数据框中筛选出 `A` 列中不大于 `2` 的行。中括号里的内容是一个条件表达式,用来判断cutdown_price"这一列值里是否大于0和"post_fee"这一列值是否大于0。中括号中的第一个小括号里是第一个判断条件:判断"cutdown_price"这一列数据是否大于0。
2025-03-19 13:46:41
1168
1
原创 【数据分析】数据筛选(布尔索引:一个判断条件)
使用pd.read_csv()函数读取路径为 "/Users/yequ/电商数据清洗.csv" 的CSV文件,并将结果赋值给变量data。上面的图可以看到,"cutdown_price"这一列里,85647对应的数据是1000,大于0,所以返回的布尔值是True。从输出的内容可以看到,返回的DataFrame就是data变量里,所有"cutdown_price"这一列值里大于0的行数据。# 使用print()和布尔索引,输出"cutdown_price"这一列值里大于0的行。
2025-03-19 13:40:15
829
原创 【数据分析】数据筛选与访问行列元素3
使用pd.read_csv()函数读取路径为 "/Users/yequ/电商数据清洗.csv" 的CSV文件,并将结果赋值给变量data。data = pd.read_csv("/Users/yequ/电商数据清洗.csv", index_col="order_id")data = pd.read_csv("/Users/yequ/电商数据清洗.csv", index_col="order_id")data = pd.read_csv("/Users/yequ/电商数据清洗.csv")
2025-03-17 11:12:29
795
原创 【数据分析】.loc和.iloc的应用2
data = pd.read_csv("/Users/yequ/电商数据清洗.csv", index_col="order_id")data = pd.read_csv("/Users/yequ/电商数据清洗.csv", index_col="order_id")表示:访问data中,index从3515712到3515716的行数据,包含3515716这一行数据。的CSV文件,并指定"order_id"列为index,然后访问订单号。如图,如果要访问某一行的数据,需要将这一行的index的值传入。
2025-03-17 11:08:26
763
原创 【数据分析】索引与数据筛选(1)
TODO 将变量data中的"payment", "price", "cutdown_price" 这三列修改为以元为单位的数据。# 使用print()输出变量data中的 "payment", "price", "cutdown_price" 这三列数据。# 使用print()输出变量data中的 "payment", "price", "cutdown_price" 这三列数据。将 data 中的"payment", "price", "cutdown_price" 这三列修改为以元为单位的数据。
2025-03-16 19:42:52
1170
原创 【数据分析】读取文档(读取Excel)
当我们需要读取指定工作表时,pd.read_excel()函数提供了一个参数:sheet_name,将要读取的工作表名称作为字符串传入该参数即可。此时,读取出的数据会被自动添加默认从0开始的行索引index和列索引columns,并且columns默认是原来数据的第一行。but now,我们想要具体分析该超市的销售情况,那么就需要读取Excel文件中的第二个工作表 - "销售订单数据"。除此之外,还有1个特殊的场景是只在处理Excel文件时能遇到的。与读取CSV文件相似, Excel文件的读取也差不多。
2025-03-16 19:39:13
434
原创 【数据分析】读取文件
data = pd.read_csv("/Users/yequ/电商数据清洗.csv", usecols=["payment","items_count"])# 读取路径为 "/Users/yequ/电商数据清洗.csv" 的CSV文件里的"payment"和"items_count"这两列中的数据。# 读取路径为 "/Users/yequ/电商数据清洗.csv" 的CSV文件里的"payment"和"items_count"这两列中的数据。# 导入pandas模块,并以"pd"为该模块的简写。
2025-03-13 16:40:50
889
原创 【数据分析】文件读取上(读取CSV)
data = pd.read_csv( "/Users/yequ/order_withoutColumns.csv",header=None,names=["订单号","用户id","支付金额","商品价格","购买数量","支付时间"])# 将数据的columns设置为:"订单号","用户id","支付金额","商品价格","购买数量","支付时间"data = pd.read_csv("/Users/yequ/电商数据清洗.csv")
2025-03-13 16:33:42
958
原创 【数据分析】有关DataFrame的知识(2)
使用DataFrame构造函数,传入参数:字典data作为values和columns,列表city作为index。使用DataFrame构造函数,传入参数:字典data作为values和columns,列表city作为index。使用DataFrame构造函数,传入参数:字典data作为values和columns,列表city作为index。属性获取到一个对象的index后,我们可以通过对其值,来改变它的index。是垂直方向进行处理,处理后是浮点数的数据类型,dtype是float64。
2025-03-12 16:22:24
696
原创 【数据分析】有关DataFrame的知识(1)
示例中,我们尝试用DataFrame构造函数,将定义的嵌套列表data和列表rank作为参数传入,并且结合参数columns,生成一个DataFrame,并赋值给变量result,并将其输出~我们来试一试,使用DataFrame构造函数,将定义的字典data和列表rank作为参数传入,生成一个DataFrame,并赋值给变量performance吧~构造DataFrame时,字典的keys,会成为DataFrame的columns。字典的keys,会成为DataFrame的列索引columns;
2025-03-12 16:19:26
778
原创 【6】数据分析检测(DataFrame 1)
同样的,和Series类似,DataFrame的行索引index是可以选择性定义的。若不传入参数index,那么生成的DataFrame的index就会默认从0开始生成。通过调用的pandas模块里的DataFrame()函数,可以构造一个DataFrame。将pd.DataFrame()函数创建的DataFrame,赋值给了df这个变量。字典的values是列表,列表中的值,会成为DataFrame的值values。,中文叫做数据框,是pandas模块最常用的数据类型,是一个二维的矩阵数据表。
2024-12-11 11:30:21
1214
原创 【5】数据分析基础(series2)
这种访问方式和字典相同,把index中的索引标签当做字典的key,而把Series序列的值当做字典的value。这种访问方式和字典相同,把index中的索引标签当做字典的key,而把Series序列的值当做字典的value。我们访问Series对象的values属性,会以数组的形式返回Series对象的值values。我们访问Series对象的index属性,可以返回这个Series的索引index。我们访问Series对象的dtype属性,可以返回Series对象的数据类型。
2024-12-11 11:17:52
894
原创 【4】数据分析基础(pandas中的series 1)
我们尝试用Series构造函数,传入一维数组GDP作为Series的值,传入列表rank作为Series的index,赋值给变量info,并将其输出。我们尝试用Series构造函数,传入列表GDP作为Series的值,传入列表rank作为Series的index,赋值给变量info,并将其输出。传入一个列表作为可选参数,列表中的元素,会成为Series中的索引(index)。示例中,GDP是一个列表,传入了pd.Series()函数中,列表中的元素会成为Series中的值(values)。
2024-12-10 23:10:18
886
原创 【3】数据分析基础(Numpy的计算)
可以通过字典的key访问对应的value,但是value不能直接进行批那么,有没有既能进行计算,同时又带有索引来允许我们快捷访问的数据类型呢?学习了NumPy中的array数组,和它可以直接进行计算的特性。这在数据分析中,是大部分计算功能的基石。在学习了N维数组的概念、常用属性以及如何创建一个N维数组后,我们来继续学习。进行计算的时候,NumPy会将该数字的计算过程应用到数组的所有元素上面。进行计算时,运算也是在相应的元素上进行。2.相同形状数组的计算。(Ctrl+单击即可)1. 数组和数的计算。
2024-12-10 23:06:18
505
原创 【2】数据分析基础(关于Numpy 的基础 1)
以此类推,[[[...]]]表示三维数组,三维数组中的每个元素都是一个二维数组;提供了一个叫做N维数组的数据结构,它和Python中的列表list类似,但前者的输入输出性能远优于后者。指的是数组中存储的元素类型,可以是:整型(int)、浮点型(float)、布尔型(bool)等。数组的维度和我们平常说的维度非常相似,接触最多的通常是一维(1D)和二维(2D)数组,可以通过。在这个平面上,除了前进、后退以外,还可以向左或者向右,所以有。二维数组中的每个元素都是一个一维数组,并且每一行的元素数量都是一致的。
2024-12-09 19:56:32
831
原创 【1】数据分析基础(一些概念)
df = pd.read_excel("/Users/survey/数据分析课程调研.xlsx",usecols=[0,3,4,5,6,7,8,9,10,26],skiprows=[1])data1 = pd.read_excel("/Users/survey/数据分析课程调研.xlsx",usecols=[3,11,12,13,14,15,16],skiprows=1)也就是数据分析的第二步,“收集数据”。因为填写时长少于5s,大概率是随意填写的,这一部分随便填写的数据,可能会干扰数据的有效性。
2024-12-09 19:42:00
1024
原创 【前端】如何制作一个自己的网页(18)定义列表
图中展示的某网站顶部信息,「首页」就可以理解为标题,对应的「历史上的今天」、「百科冷知识」和「图解百科」就是对标题的说明和描述。对某个术语或内容进行解释和描述,所以由标题和描述两部分组成,描述是对标题的解释和说明,标题是对描述的总结和提炼。和<li>标签一样属于容器标签,里面可以添加任意标签,也就是可以包含段落、图片、链接、列表等。标签一般和<dd>、<dt>标签配合使用,不会单独出现,且尽量在。和<dt>是同级标签,它们都是<dl>的子标签。、<dt>和<dd>虽然是同级标签,但是它们的。
2024-10-23 08:19:45
653
原创 【前端】如何制作一个自己的网页(16)
a href="https://np.baicizhan.com/website/lessons" target="_blank">网页开发然后,学习不同的列表结构所对应的样式、标签,并实际使用它们来搭建网页中整洁的列表结构。只需创建标签选择器,并根据图中的属性值,就可以分别设置将列表按照数字、大写字母、小写字母、大写罗马数字或小写罗马数字的顺序进行排列。第一个列表项是一个超链接,第二个列表项是一张图片,第三个列表项是另一个有序列表。是list item的缩写,表示列表项,即列表里的条目。
2024-10-22 20:29:47
767
原创 【前端】如何制作一个自己的网页(15)
数据分析</span>、<span>网页开发基础</span>等课程。<h3><span>夜曲编程</span><span>简介</span></h3><h3><span>夜曲编程</span><span>简介</span></h3><h3><span>夜曲编程</span><span>简介</span></h3><h3><span>夜曲编程</span><span>简介
2024-10-22 20:20:24
704
原创 【前端】如何制作一个自己的网页(14)
数据分析基础</span>、<span>数据分析进阶</span>、<span>网络爬虫</span>、<span>网页开发基础</span>等课程。<p>夜曲编程是一个在线学习编程的网站,发布了<span>数据分析基础</span>、<span>数据分析进阶</span>、<span>网络爬虫</span>、<span>网页开发基础</span>等课程。<h3><span>夜曲编程</span><span>简介
2024-10-21 22:11:56
1026
2
原创 【前端】如何制作一个自己的网页(13)
我们将会继续学习两种复合CSS选择器,以及在网页分组中的2个重要元素:div和span。如果有更多的元素,都需要设置相同的样式,这种写法不仅导致CSS代码量增加,而且非常重复。所以,除了设置颜色和文本对齐属性外,我们常常还需要设置高度和宽度属性。但是有时候,我们还需要对网页中的内容进行局部样式的修改。分组选择器里的声明可以给分组选择器所选择的不同元素同时设置样式。元素是对网页进行整体布局,结合CSS,可以设置一块区域的样式。/* 使用p标签选择器,设置样式 */分组选择器的出现,大幅减少了CSS的代码量。
2024-10-21 22:04:32
1021
原创 【前端】如何制作一个自己的网页(12)
这是较大的行高<br>这是较大的行高</p>在这里,我们将重点学习文本水平对齐、文本缩进、文本修饰、行高这四个属性。同时设置了文本样式的四个属性:文本水平对齐、文本缩进 、文本修饰和行高。类似于32px的这种方式,是采用数字和长度单位的方式来表示行高。属性,用于设置文本的水平对齐方式。<p>这是默认的标准行高<br>这是默认的标准行高
2024-10-19 23:21:12
965
原创 【前端】如何制作一个自己的代码(10)
也就是说,为了更精确地表示颜色,我们会通过具体的数值来最大限度地控制颜色。红,绿,蓝三原色叠加,组合起来有1600多万种不同的颜色。但是不同的浏览器,对颜色的解析可能存在差异,实际开发中不建议使用颜色名称来指定颜色。函数,是通过对red、green、blue三原色的强度进行控制,从而实现不同的颜色。的FF表示red的强度,00表示green的强度,后一组00表示blue的强度。中,除了使用RGB定量地表示颜色,还有一种常见的表达方法--十六进制码。的属性值,设置成颜色的英文名就能显示对应的颜色。
2024-10-18 22:18:02
830
原创 【前端】如何制作一个自己的网页(9)
而CSS中提供了多种不同类型的选择器,我们需要根据不同的情况,选择不同的CSS选择器。当然,如果我们想筛选特定的几个标签,就需要用到类选择器。类选择器像身份证的姓名,因为一个姓名可以被多个人使用,所以类选择器可以选择一类标签。顾名思义,标签选择器,是通过具体的标签名,找到页面所有同名的标签,来设置样式。类选择器,就是根据标签的class属性,来匹配具体的HTML标签。比如,标签选择器a可以直接改变标签中的标签的颜色。比如,第13-15行,虽然标签和标签都有。
2024-10-18 22:12:56
1234
3
原创 【前端】如何制作一个自己的网页(8)
内部样式表,将CSS样式定义在HTML文档的内部。-- 使用标签,引入路径为style.css的CSS文件 -->在复杂应用中,外部样式表是最常见的引用CSS的方式。我们可以通过同一个CSS文件,来设置不同HTML文档的样式。CSS的引用方式有三种:内部样式表、外部样式表、行内样式。包含着文档的样式信息,标签内部需要放入具体的CSS代码。由于行内样式定义在标签内部,所以它只对所在的标签有效。行内样式,也叫内联样式,是在 HTML 元素标签的。的出现,使得网页的样式与内容分离开来。
2024-10-17 09:16:15
1201
原创 【前端】如何制作自己的网站(7)
因此,CSS必须和HTML协同工作,那么如何在HTML中引用CSS呢?使用HTML时,需要遵从一定的规范,CSS也是如此。从现在开始,制作网页不再只是编写一个HTML文档,而是结合了多张图片、多个html文档的开发项目。学习了网页的基本骨架,并使用HTML语言在网页中添加了文本和图片等HTML元素。当然,如果一个网页只有基本骨架和基本元素,那么它看起来就会十分混乱,不够美观。比如,这里的选择器h1,就表示为所有h1元素定义样式。属性,是指我们给HTML元素设置的样式名称。包含选择器、属性、属性值三个部分。
2024-10-17 09:08:24
591
原创 【前端】如何制作一个自己的网页(6)
点击此处了解我</a><img src="images/head.png" alt="头像">例如右边的代码,将href设置为“aboutme.html”的地址。例如右边的代码,将第24行的a元素指向第11行的h1元素。<a href="#top">回到头部
2024-10-16 17:07:34
3693
2
原创 【前端】如何制作一个自己的网页(5)
图片数量较多时,我们可以将所有图片放在同一个文件夹中(如右图images),并将该文件夹与html文档放在一起。你也可以只设置图片的宽度(或高度),浏览器会按照比例自动调整图片的高度(或宽度)。当图片过大时,屏幕无法完整显示图片内容。属性用于记录图片所在的文件位置,浏览器可以通过该地址找到要使用的图片。比如,右边的代码仅设置了宽度,浏览器会按照比例自动调整图片的高度。当浏览器未能找到图片时,alt中的内容会代替图片显示在网页中。选择图片,点击右键,选择复制图片地址,写入src=“”中。
2024-10-16 13:54:08
1248
原创 【前端】制作一个自己的网页(4)
、<br>三个标签,它们分别代表了标题、段落与换行三种元素。若我们需要将A角色的台词与B角色的台词分组时,可以使用分类属性class。但与class的区别在于,id属性的值是唯一的,类似于我们的身份证号码。在使用时,将想要格式化的文字作为内容,放在相应的标签中即可。<p class="b">B:一百八一杯~</p><p id='unlock'>点击此处解锁</p><p class="a">A:宫廷玉液酒
2024-10-15 11:23:59
1061
原创 【前端】制作一个简单的网页(2)
有时你会发现<html>标签中设定了一个名为lang的属性,它用来告诉浏览器这是“网页使用的语言”。当浏览器识别到你常用的语言(比如中文)与lang中的语言不一致,会自动询问你是否需要翻译网页内容。当浏览器识别到你常用的语言(比如中文)与lang中的语言不一致,会自动询问你是否需要翻译网页内容。这类标签不需要内容产生效果,通常表示对网页的某种行为,它们不用标记任何内容,开始即是结束。比如,<hr>标签的作用是在网页中添加一条分割线,它仅包含开始标签,是一个单标签元素。
2024-10-14 11:04:55
577
原创 【前端】制作属于自己的网页(1)
在标记的过程中,如果使用了某个开始标签,通常需要使用对应的标签进行结尾。但并非所有的标签都是如此,HTML中还存在一些元素,它们仅由开始标签构成。开始标签、标记内容、结束标签,三者结合在一起,组成了网页中的一个元素。注释仅用来解释代码的意图,加载网页时,浏览器不会执行注释中的内容。比如,图中将title元素,放在了<head>标签中。此时可以适当的在代码上添加换行与缩进,调整代码的结构。在浏览器看来,右边四种写法所呈现的网页效果是一致的。元素的内容除了文本以外,还可以是其它的元素。
2024-10-14 10:55:52
2530
原创 word文档的写入(1)
我们来观察下右边的“成绩报告单模版.docx”,红色框出的就是我们需要填入信息的位置。能够发现,在这个Word文档中,我们需要写入的信息,既有在。,我们知道一个Word文档(Document)的基本组成单位是段落(Paragraph),而段落中的文本内容至少包含一个或多个样式块(run)。在Word文档中,找到一个需要插入信息的位置,并将信息插入到Word文件对应的位置中。之后,我们再学习,批量从Excel里读取信息,然后将信息批量加入Word文档中。在将信息写入Word文档前,我们需要先读取该文档。
2024-09-17 21:35:08
1192
原创 word文档的读入(8)
东临碣石", "行舟绿水前", "孤山寺北贾亭西", "断肠人在天涯", "故人具鸡黍", "一曲新词酒一杯", "何当共剪西窗烛", "误入藕花深处", "烟笼寒水月笼沙", "万籁此都寂", "初日照高林", "腾蛇乘雾"]这里,我们通过了格式化的方式设置工作表对象["列号行号"],具体代码为:sheet[f"A{index}"]。现在,我们已经读取到了所有需要获取的信息,也计算出了学生的选择题和填空题的分数。在编写代码的过程中,需要同时操作Excel与Word中的表格,容易混淆。
2024-09-17 21:33:40
583
原创 word文档的读入(7)
东临碣石", "行舟绿水前", "孤山寺北贾亭西", "断肠人在天涯", "故人具鸡黍", "一曲新词酒一杯", "何当共剪西窗烛", "误入藕花深处", "烟笼寒水月笼沙", "万籁此都寂", "初日照高林", "腾蛇乘雾"]东临碣石", "行舟绿水前", "孤山寺北贾亭西", "断肠人在天涯", "故人具鸡黍", "一曲新词酒一杯", "何当共剪西窗烛", "误入藕花深处", "烟笼寒水月笼沙", "万籁此都寂", "初日照高林", "腾蛇乘雾"]
2024-09-12 13:00:15
727
原创 word文档的读入(6)
东临碣石", "行舟绿水前", "孤山寺北贾亭西", "断肠人在天涯", "故人具鸡黍", "一曲新词酒一杯", "何当共剪西窗烛", "误入藕花深处", "烟笼寒水月笼沙", "万籁此都寂", "初日照高林", "腾蛇乘雾"]东临碣石", "行舟绿水前", "孤山寺北贾亭西", "断肠人在天涯", "故人具鸡黍", "一曲新词酒一杯", "何当共剪西窗烛", "误入藕花深处", "烟笼寒水月笼沙", "万籁此都寂", "初日照高林", "腾蛇乘雾"]
2024-09-12 12:53:48
1261
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人