线性回归
为什么叫h(x)
为什么用θ表示参数
θ是向量还是矩阵?
为什么用x表示特征
为什么X是一个来表示的向量
为什么在表格添加一列1 ?便于矩阵计算
为什么用表示误差?
K-means
基础概念:
1.要得到簇的个数,需要指定K值
2.质心:均值,即向量各维取平均即可
3.距离的度量:常用欧几里得距离和余弦相似度(先标准化)
4.优化目标: 就是每个簇内每个样本点到簇中心的距离之和最小
为什么叫h(x)
为什么用θ表示参数
θ是向量还是矩阵?
为什么用x表示特征
为什么X是一个来表示的向量
为什么在表格添加一列1 ?便于矩阵计算
为什么用表示误差?
K-means
基础概念:
1.要得到簇的个数,需要指定K值
2.质心:均值,即向量各维取平均即可
3.距离的度量:常用欧几里得距离和余弦相似度(先标准化)
4.优化目标: 就是每个簇内每个样本点到簇中心的距离之和最小