1.mysql数据库中存储较长的字符串要用什么类型或怎么处理
CHAR 或 VARCHAR 的最大长度可以到 255,TEXT最大长度 65535,MEDIUMTEXT最大长度 16777215,LONGTEXT最大长度 4294967295。
2.决策树中 10个特征, 两个类别,100个数据,要如何构建决策树
如果每层都判断10个特征,那么最终的判别结果正确率是100%,但是这不利于测试其他数据(过拟合),那么我们每次从10个特征中挑选2个进行分类,然后进行多次分类,那么我们的训练集结果正确率不会是100%,但是能够更好的泛化这类问题。(这是面试官后来跟我谈的,我大致理解是这意思。以后会写上自己的想法)
3.hadoop的应用场景(与ES、MongoDB比较)
如果你仅仅想要通过关键字和简单的分析,那么Elasticsearch可以完成任务;如果你需要查询文档,并且包含更加复杂的分析过程,那么MongoDB相当适合;如果你有一个海量的数据,需要大量不同的复杂处理和分析,那么Hadoop提供了最为广泛的工具和灵活性
原文链接http://www.jianshu.com/p/2c7b0c76fa04
hadoop的应用场景http://www.youkuaiyun.com/article/2012-09-03/2809491-12-ways-companies-are-using-hadoop
面试总结
最新推荐文章于 2024-07-22 10:31:40 发布