对数据进行标准化和归一化

梦里梦见梦不见的497

已于 2024-05-12 22:45:33 修改

阅读量399

点赞数 3

分类专栏：基础文章标签： python pandas 数据挖掘

于 2024-05-12 22:43:33 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_73101319/article/details/138770696

版权

数据的形式：保存在CSV中，第一列为姓名，第二列之后为特征。

标准化

输入文件的路径，设置保存转化后的文件路径

import pandas as pd
from sklearn.preprocessing import StandardScaler

# 读取CSV文件
data = pd.read_csv(r'C:\Users\Administrator\Desktop\Breast\benign.csv')

# 提取特征列
features = data.drop('Name', axis=1)

# 初始化标准化器
scaler = StandardScaler()

# 对特征进行标准化
scaled_features = scaler.fit_transform(features)

# 将标准化后的特征重新添加到原始DataFrame中
scaled_data = pd.DataFrame(scaled_features, columns=features.columns)
scaled_data.insert(0, 'Name', data['Name'])

# 定义标准化后的文件路径
output_file = r'C:\Users\Administrator\Desktop\Breast\benign_standardized.csv'

# 将标准化后的数据保存到CSV文件中
scaled_data.to_csv(output_file, index=False)

# 打印成功信息
print("数据已经成功标准化并保存到文件:", output_file)