数据的形式:保存在CSV中,第一列为姓名,第二列之后为特征。
标准化
输入文件的路径,设置保存转化后的文件路径
import pandas as pd
from sklearn.preprocessing import StandardScaler
# 读取CSV文件
data = pd.read_csv(r'C:\Users\Administrator\Desktop\Breast\benign.csv')
# 提取特征列
features = data.drop('Name', axis=1)
# 初始化标准化器
scaler = StandardScaler()
# 对特征进行标准化
scaled_features = scaler.fit_transform(features)
# 将标准化后的特征重新添加到原始DataFrame中
scaled_data = pd.DataFrame(scaled_features, columns=features.columns)
scaled_data.insert(0, 'Name', data['Name'])
# 定义标准化后的文件路径
output_file = r'C:\Users\Administrator\Desktop\Breast\benign_standardized.csv'
# 将标准化后的数据保存到CSV文件中
scaled_data.to_csv(output_file, index=False)
# 打印成功信息
print("数据已经成功标准化并保存到文件:", output_file)
<