1、自我介绍。问你的专业和方向。
2、说一下你参加的数据挖掘项目或者比赛。简述题目、数据、目的、评价指标、所用算法、遇到的问题、如何解决。
3、简述SVM过程,举几个常见的核函数,说说其用途。举例说明什么事支持向量。
4、说一下k-means过程。关于k的选择有什么好的看法?
5、举个你熟悉的分类算法,简述其原理和过程。
6、信息增益、信息增益率、基尼指数各是什么?信息增益率比和信息增益的区别是什么?
7、常见的排序算法中,时间复杂度是nlogn的有哪些?
8、快速排序过程原理,稳定性及其原因。
9、你的代码量是多少。
10、实习开始和结束时间。
11、你能自己实现及其学习算法吗?还是调用现有的库。
本文深入探讨了数据挖掘项目的实施,包括使用SVM、k-means等算法进行分类与聚类,以及信息增益、基尼指数在决策树构建中的应用。
878

被折叠的 条评论
为什么被折叠?



