one-hot编码是监督学习中经常对标签处理的一种方式。
假设我们有一组标签:
import numpy as np
import pandas as pd
labels = np.array(['Cat', 'Dog', 'Dog', 'Cat', 'Bird', 'Fish'])
print("Labels shape: %d" % labels.shape)
print("Labels:", labels)

我们可以利用pandas.get_dummies()生成one-hot型式:
print(pd.get_dummies(labels))
one_hot = np.asarray(pd.get_dummies(labels))
print("One-hot Labels shape:", one_hot.shape)
print("One-hot Labels:", '\n', one_hot)


本文深入讲解了在监督学习中常用的数据预处理技术——One-hot编码。通过实例演示了如何使用Python的Pandas库将类别标签转换为one-hot形式,便于模型理解和训练。
457





