
面试
文章平均质量分 65
miner_zhu
这个作者很懒,什么都没留下…
展开
-
费米估算问题
据说,有一次费米在芝加哥大学的课堂上提出了一个古怪的问题:芝加哥市一共有多少位钢琴调音师?见学生们一片茫然,费米提示把这个问题“分解成一些便于操作的小问题,然后鼓起勇气作猜测和假设”. 芝加哥有多少居民?可靠的估算是300万;平均每个家庭有多少人?4人;多少家庭有钢琴?大概三分之一,那么全市大约就有25万架钢琴;一架钢琴隔多长时间需要调音?平均5年,那么芝加哥平均每年有5万架次的钢琴需要调音;每个...原创 2018-09-28 16:41:36 · 5899 阅读 · 0 评论 -
十大机器学习算法要点
广义来说,有三种机器学习算法1、 监督式学习工作机制:这个算法由一个目标变量或结果变量(或因变量)组成。这些变量由已知的一系列预示变量(自变量)预测而来。利用这一系列变量,我们生成一个将输入值映射到期望输出值的函数。这个训练过程会一直持续,直到模型在训练数据上获得期望的精确度。监督式学习的例子有:回归、决策树、随机森林、K – 近邻算法、逻辑回归等。2、非监督式学习工作机制:在这个...转载 2018-07-22 19:38:18 · 483 阅读 · 0 评论 -
八大经典排序基本思想和python实现
一. 插入排序—直接插入排序思路:将待插入元素一个个插入到已有序部分#直接插入排序def insertSort(arr): if len(arr) <= 1: return for i in range(1,len(arr)): temp = arr[i] j = i while j > 0 and arr[j]>temp: arr[j]...原创 2018-07-13 22:10:15 · 449 阅读 · 0 评论 -
hadoop常见面试题
1.什么是hadoopHadoop 是一个开源软件框架,用于存储大量数据,并发处理/查询在具有多个商用硬件(即低成本硬件)节点的集群上的那些数据。 HDFS(HadoopDistributed File System,Hadoop 分布式文件系统):HDFS 允许你以一种分布式和冗余的方式存储大量数据。例如,1 GB(即 1024 MB)文本文件可以拆分为 16 * 128MB 文...转载 2018-07-13 09:01:53 · 4959 阅读 · 0 评论 -
Hadoop之MapReduce运行原理
MapReduce1.x架构客户端向JobTracker提交一个作业,JobTracker把这个作业拆分成很多份,然后分配给TaskTracker(任务执行者)去执行,TaskTracker会隔一段时间向JobTracker发送心跳信息,如果JobTracker在一段时间内没有收到TaskTracker的心跳信息,JobTracker会认为TaskTracker死掉了,会把TaskTrack...转载 2018-07-17 10:21:57 · 344 阅读 · 0 评论 -
Python中list,tuple,dict,set的区别和用法
Python提供多种数据类型来存放数据项集合,主要包括序列(列表list和元组tuple),映射(如字典dict),集合(set),下面对这几种数据类型分别介绍。Python中list,tuple,dict和set的主要区别:一句话来概括四种数据类型的区别是:tuple是一个不可改变的list,set是一个没有Value的dict,list和set的数据是可变的,tuple和dict的数据...转载 2018-07-17 09:48:59 · 9688 阅读 · 4 评论