- 博客(12)
- 资源 (3)
- 收藏
- 关注
原创 面试题:Java创建线程有几种方式?其实这个没有那么简单。
老生常谈的问题:你说一说 Java 创建线程都有哪些方式?Java 创建线程有两种方式:继承Thread类,并重写run()方法实现Runnable接口,覆盖接口中的run()方法,并把Runnable接口的实现扔给Thread代码实现以下:```javapublic static void main(String[] args) { // 第一种 MyTh...
2020-04-09 18:48:19
315
原创 Hadoop的概述
HDFS产出的背景和意义1.1hdfs产生的背景随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。hdfs只是分布式管理系统的一种。1.2hdfs的定义HDFS,它是一个文件系统,用于存储文件,通过目录树来定位文件;其次,它是分布式的,由很多服务器联合起来实现其功...
2019-11-05 18:53:51
156
原创 电子信息工程专业生产实习报告
目录前言 … 1一、实习目的及任务 … 1 1.1实习目的… 1 1.2实习任务要求… 2二、实习单位及岗位简介 … 2 2.1实习单位简介… 2 2.2实习岗位简介(概况)… 2三、实习内容(过程) … 3四、实习体会 … 5五、实习总结 …6前言 随着社会的快速发展,用人单位对大学生的要求越来越高,对于即将毕业的电子信息工程专业在校生而言,为了能更好的适应严峻...
2019-10-15 22:52:30
1826
1
原创 大数据开发工程面试(途家)
一面:简单说下项目常用的设计模式哪些?写一个单例模式nameNode的作用SecondaryNameNode作用冒泡排序写出MapReduce过程并讲解gc常用的算法二面:项目:用到的表有哪些,数据量、分层,数据从一开始到结束的转换过程(ods->sda…)fdw层的作用hive自定义函数有哪类:udaf、udtf(都是什么,不会)shuffle过程说说kafka...
2019-10-15 22:48:21
162
原创 盖娅互娱大数据开发工程面试
挑一最擅长的项目说说1.数据清洗的MapReduce程序2.spark和Hadoop的区别3.MapReduce的工作流程4.shuffle机制5.数据倾斜6.数据结构:二叉树 第n层的节点数 深度为h的节点数7.Linux的基本命令 编辑 复制 删除8.mysql题:name kecheng fenshu张三 语文 81张三 数...
2019-10-15 22:45:32
666
2
原创 大数据高频面试题总结
大数据面试总结1.==和equale的区别答:(1).可以比较基本类型也可比较引用类型,基本类型比较值,而引用类型比较内存地址。(2)equals的话,它属于java.lang.Object类里面的方法,如果该方法没有被重写过默认也是(源码149行);String类的equals方法被重写过的,而且String类在日常中用的比较多,形成了equals是比较值的错误观点。(3)具体的比较还是要看...
2019-10-15 22:38:56
1021
原创 【算法】队列笔记及程序分析(java)(三)
队列的引用场景:银行叫号系统。1.队列是一个有序列表,可以用数组或是链表来实现。2.遵循先入先出的原则。即:先入队列的数据,先要取出。后存入的后取出。示意图:(使用数组模拟队列示意图)说明:1.队列本身是有序的列表,若使用数组的结构来存储队列的数据,则队列的声明如上图,其中maxSize是队列的最大容量。2.队列的输入、输出是分别从前后端来处理,因此需要两个变量分别记录队列前后端的下标,...
2019-07-28 16:00:36
133
原创 【算法】稀疏数组——五子棋案列分析(java)(二)
分析问题:五子棋使用二维数组记录棋盘,该二维数组的很多值默认为0,因此记录了很多没有意义的数据–>稀疏数组当一个数组中大部分元素为0,或者为同一个值的数组时,可以使用稀疏数组来保存该数组。稀疏数组的处理方法:1.记录数组一共有几行几列,有多少个值2.把具有不同值的元素的行列及值在一个小规模数组中,从而缩小程序规模应用实列1)使用稀疏数组,来保留类似前面的二维数组(棋盘、地图)...
2019-07-26 12:09:36
174
原创 【算法】基础概念及几个经典案列(java)(一)
学习方法:应用场景->数据结构及算法–>剖析原理–>分析实现步骤–> 代码实现1)数据结构是一门研究组织数据方式的学科。有了编程语言也就是 有了数据结构,学好数据结构可以编写出更漂亮,更高效的代码。2)程序=数据结构+算法。3)数据结构是数据算法的基础。数据结构包括:线性结构和非线性结构线性结构1)线性结构作为最常用的数据结构,其特点是数据元素之间存在一对...
2019-07-26 12:01:45
133
原创 python爬虫基础二:爬取网站方法及案列分析
爬取网站import urllib.requestD=urllib.request.urlopen("https://www.baidu.com").read() print(D)案列一、如何爬取豆瓣上出版社列表并写入文件中 import urllib.request import re data=urllib .request.urlopen("https://re...
2019-07-26 08:05:08
322
原创 python爬虫基础
一、网络爬虫简单来说,网络爬虫就是自动从互联网中定向或不定向地采集信息的一种程序网络爬虫有很多种类型,常用的有通用网络爬虫、聚集网络爬虫等。1、网络爬虫做什么?1).搜索引擎2).采集金融数据3).采集商品数据4).自动过滤广告数据:正则表达式,scapy表达式5).采集竞争对手的客户数据6).采集行业相关数据,进行数据分析二 、.正则表达式1.原子是把正则表达式中最基本的...
2019-07-26 07:40:56
201
原创 hdfs的优缺点
hdfs的优点:1.高容错性(1)数据自动保存多个副本。(2)副本丢失后,自动恢复。2适合批量处理(1) 移动计算机而非数据 。(2)数据位置暴露给计算机框架(block块)3…适合大数据处理(1) GB、TB、甚至PB级数据。(2)百万规模以上的文件数量。注意:节点数可能10K+。4.可构建在廉价机器上。(1) 通过多个副本提高可靠性。(2)提供了容错和恢复机制。hdf...
2019-04-15 14:49:30
262
最新BAT的 java经典必考面试题.docx
2020-04-10
信息管理系统的毕业设计外文译文.docx
2020-04-10
PIDALION: Implementation issues of a Java-based Multimedia Search Engine over t
2020-04-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人