清华大学出版社——Python数据分析与挖掘第7章课后习题答案

3、读取文件“jiuye.xlsx”中本年度某高校计科专业学生的就业数据,绘制就业类型和占比的饼状图,运行结果如下图所示。

import matplotlib as mpl
import matplotlib.pyplot as plt
import pandas as pd
mpl.rcParams['font.sans-serif']=['SimHei']
mpl.rcParams['font.size']=12
data=pd.read_excel("C:\\Users\\Administrator\\Desktop\\jiuye.xlsx")
plt.figure(figsize=(6, 6))
plt.title("本年度计科专业学生的就业类型")
plt.pie(data["所占比例"],labels=data["就业类型"],startangle=90,shadow=True,autopct='%.1f%%')
plt.show()

在这里插入图片描述

4、绘制如下不规则子图。
第一个子图为折线图,x为np.arange(1,100),y为x的平方值。
第二个图为散点图,x为np.arange(0,10),ynp.random.rand(10)。
第三个图为条形图,x和y的值分别是[20,10,30,25,15]和[25,15,35,30,20],
运行结果如图所示。提示:第一行的2个图占了221和222的位置,如果想在下面只放一个图,需把第3个子图所在的行两列当成一列,即2行1列第2个位置。

import numpy as np
plt.figure(figsize=(10, 7))
plt.subplot2grid((2,2),(0,0))
x=np.arange(1,100)
plt.plot(x,x**2)

plt.subplot2grid((2,2),(0,1))
x=np.arange(0,10)
y=np.random.rand(10)
plt.scatter(x,y)

plt.subplot2grid((
### 关于数据仓库数据挖掘课后习题 对于数据仓库和数据挖掘领域,清华大学出版社的相关教材通常会提供详尽的理论讲解以及实践练习。针对数据抽取这一知识点,在该类书籍中提到的数据抽取分为两种主要形式:静态抽取和增量抽取[^1]。 #### 静态抽取 静态抽取主要用于初次构建数据仓库时的大规模数据迁移过程。此方法涉及从源系统一次性获取大量历史数据并将其加载到目标环境之中。这种方式适合于新建立的数据仓库项目或是当现有数据量相对较小的情况之下。 #### 增量抽取 相比之下,增量抽取则是在已经建立了初步本之后用来更新已有记录的方法。它只传输自上次同步以来发生变化的新条目或修改过的旧条目。这种方法可以显著减少网络带宽消耗,并提高后续处理效率,特别适用于频繁变动但每次变化幅度不大的场景下保持数据最新状态的需求。 ```python def extract_data(extraction_type, source_system): """ 模拟不同类型的提取操作 :param extraction_type: 提取方式 'static' 或者 'incremental' :param source_system: 数据来源系统名称 """ if extraction_type == "static": print(f"正在执行来自 {source_system} 的全量(静态)数据抽取...") # 执行完整的数据复制逻辑 elif extraction_type == "incremental": print(f"正在执行来自 {source_system} 的增量数据抽取...") # 实现仅抓取新增/变更部分的功能 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值