PD初体验

本文分享了使用PD工具设计的“菜花评论网”数据库逻辑模型,模型中运用了较少见的继承关系,旨在通过PD使设计过程更为简易、清晰且严谨。

自己第一次用PD做的一个“菜花评论网”的数据库逻辑模型。其中用到了平时很不常用的继承关系。如果逻辑上正确的话,就可以直接生成物理数据库模型然后可以直接生成数据库。用PD的好处是,让你的设计更加容易、清晰、严谨。

### Pandas库的基本用法和初学者教程 Pandas 是一个强大的数据分析工具,广泛应用于数据处理、清洗和分析。以下是 Pandas 的基本用法介绍: #### 1. 安装 Pandas 在使用 Pandas 之前,需要确保系统已安装 Python 3.6+ 版本。可以通过以下命令安装 Pandas: ```bash pip install pandas ``` 此方法适用于大多数操作系统,包括 Windows、macOS 和 Linux[^1]。 #### 2. 导入 Pandas 在代码中导入 Pandas 库时,通常会使用缩写 `pd`,以便简化代码书写: ```python import pandas as pd ``` #### 3. 创建数据结构 Pandas 提供了两种主要的数据结构:`Series` 和 `DataFrame`。 - **Series** 是一维数组,类似于列表或数组,但每个元素都有一个唯一的索引(称为 index)。默认情况下,索引从 0 开始编号。 ```python s = pd.Series(['a', 'b', 'c', 'd', 'e']) print(s) ``` 输出结果如下: ``` 0 a 1 b 2 c 3 d 4 e dtype: object ``` 此处的索引从 0 开始自动分配[^2]。 - **DataFrame** 是二维表格结构,类似于 Excel 表格或 SQL 表。可以使用字典创建 DataFrame: ```python data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]} df = pd.DataFrame(data) print(df) ``` 输出结果如下: ``` Name Age 0 Alice 25 1 Bob 30 2 Charlie 35 ``` #### 4. 基本操作 以下是一些常见的 Pandas 操作示例: - **查看前几行或后几行** ```python print(df.head(2)) # 查看前两行 print(df.tail(2)) # 查看最后两行 ``` - **获取版本号** ```python print(pd.__version__) # 输出当前安装的 Pandas 版本号 ``` - **获取数据类型** ```python print(df.dtypes) # 查看每一列的数据类型 ``` - **获取行列数** ```python print(df.shape) # 返回 (行数, 列数) print(df.shape[0]) # 获取行数 print(df.shape[1]) # 获取列数 ``` - **获取索引和列名** ```python print(df.index) # 查看行索引 print(df.columns) # 查看列名 ``` - **随机抽样** ```python print(df.sample(n=2)) # 随机抽取两行 print(df.sample(frac=0.5)) # 按比例随机抽取一半数据 ``` - **统计描述** ```python print(df.describe()) # 对数值型列进行统计描述 ``` #### 5. 数据读取与写入 Pandas 支持多种文件格式的读取和写入,例如 CSV、Excel 和 SQL 数据库。 - **读取 CSV 文件** ```python df = pd.read_csv('file.csv') # 读取 CSV 文件 print(df.head(5)) # 查看前五行 ``` - **写入 CSV 文件** ```python df.to_csv('output.csv', index=False) # 将 DataFrame 写入 CSV 文件 ``` #### 6. 数据筛选与排序 - **数据筛选** ```python filtered_df = df[df['Age'] > 30] # 筛选年龄大于 30 的行 print(filtered_df) ``` - **数据排序** ```python sorted_df = df.sort_values(by='Age', ascending=False) # 按年龄降序排列 print(sorted_df) ``` ### 总结 Pandas 是一个功能强大且灵活的库,适合处理各种结构化数据。通过上述基本用法,初学者可以快速上手并完成简单的数据分析任务[^3]。
评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值