利用 pandas 导入表格数据时的数据清洗问题
从 SQL 数据库导入数据
在处理数据时,我们常常需要从 SQL 数据库中获取数据。企业系统中的数据通常比 CSV 或 Excel 文件的结构更好,但在进行探索性分析之前,仍需要进行一些处理。
准备工作
在开始之前,需要安装 pymssql 和 mysql-connector-python 库。可以通过以下命令进行安装:
pip install pymssql
pip install mysql-connector-python
本示例使用的数据集可从 这里 下载。
操作步骤
- 导入必要的库
import pandas as pd
import numpy as np
import pymssql
import mysql.connector
- 从 SQL Server 实例中检索和加载数据
超级会员免费看
订阅专栏 解锁全文
17万+

被折叠的 条评论
为什么被折叠?



