- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 机器学习之路——KNN+交叉验证
现在我们得到了样本集中所有电影与未知电影的距离,按照距离递增排序,可以找到K个距 离最近的电影。K-近邻算法按照距离最近的三部电影的类型,决定未知电影的类型,而这三部电影全是爱情片,因此我们判定未知电影是爱情片。首先我们需要知道这个未知电影存在多少个打斗镜头和接吻镜头,上图中问号位置是该未知电影出现的镜头数图形化展示,具体数字参见下表。没有哪个电影人会说自己制作的电影和以前的某部电影类似,但我们确实知道每部电影在风格。的打斗场景也更频繁,基于此类场景在某部电影中出现的次数可以用来进行电影分类。
2022-09-16 13:55:18
2848
原创 机器学习之路-特征工程
特征选择:从特征中选择出有意义对模型有帮助的特征作为机器学习最终的输入数据!归一化对于最大最小值敏感,如果数据中的异常值比较多则有一定的局限性。
2022-09-15 21:38:56
363
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人