Python之数据分析（规范数据生成器Faker，学习、数据分析、开发测试专用）

最新推荐文章于 2025-05-09 14:00:00 发布

原创

最新推荐文章于 2025-05-09 14:00:00 发布 · 603 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#python #大数据 #编程语言 #数据分析 #数据建模

文章目录

- 写在前面

写在前面

无论是在我们学习数据分析之际，还是在实际的开发、测试过程中，我们常常需要构造数据进行功能验证，但手动创建数据简直太费时费力了，并且数据不够规范。
针对这个问题，现在Python提供了一个超级好用的伪造数据的开源库，它可以根据我们的需求伪造各种符合规范格式的数据，供我们学习和开发测试使用。
Faker是一个Python的第三方开源项目，内置的方法可以快速创建绝大多数类型的数据，比如姓名、地址、电话、身份证、时间、网络信息、文本信息等，并且结合python语法，可以向数据库批量构造压力测试数据。
使用前提当然是安装Faker第三方库：pip install Faker

一、生成数据写入csv文件中

1、创建对象
默认生成的数据为为英文，使用zh_CN指定为中文
fake = Faker(‘zh_CN’)

2、写入数据到csv文件完整代码

# 导入faker数据仿造库
from faker import Faker

fake = Faker('zh_CN')  # 创建Faker对象
def build_random_csv(n):
    for i in range(n):
        name = fake.name()  # 姓名
        birth = fake.date_object()  # 出生日期
        phone = fake.phone_number()