大数据学习之第二阶段Hadoop(第三篇)–Maven思维导图+复习知识点总结
思维导图:
(思维导图太大不好放,各位小伙伴可以在我的资源中免费下载即可,用作参考)
https://download.youkuaiyun.com/download/LangLang1111111/21192499

知识点总结
第一章 Maven 是什么?
如果上面的描述能够使你认识到使用Maven是多么的重要,我们下面就来介绍一下Maven是什么。
1.1 自动化构建工具
- Maven这个单词的本意是:专家,内行。读音是['meɪv(ə)n]或['mevn],不要读作“妈文”。
- Maven是一款自动化构建工具,专注服务于Java平台的项目构建和依赖管理。在JavaEE开发的历
史上构建工具的发展也经历了一系列的演化和变迁:
Make→Ant→Maven→Gradle→其他……
1.2 构建的概念
- 构建并不是创建,创建一个工程并不等于构建一个项目。要了解构建的含义我们应该由浅入深的从以下三个层面来看:
①纯Java代码
大家都知道,我们Java是一门编译型语言,.java扩展名的源文件需要编译成.class扩展名的字节码文件才能够执行。所以编写任何Java代码想要执行的话就必须经过编译得到对应的.class文件。
②Web工程
当我们需要通过浏览器访问Java程序时就必须将包含Java程序的Web工程编译的结果“拿”到服务器上的指定目录下,并启动服务器才行。这个“拿”的过程我们叫部署。
我们可以将未编译的Web工程比喻为一只生的鸡,编译好的Web工程是一只煮熟的鸡,编译部署的过程就是将鸡炖熟。
Web工程和其编译结果的目录结构对比见下图:
③实际项目
在实际项目中整合第三方框架,Web工程中除了Java程序和JSP页面、图片等静态资源之外,还包括第三方框架的jar包以及各种各样的配置文件。所有这些资源都必须按照正确的目录结构部署到服务器上,项目才可以运行。
所以综上所述:构建就是以我们编写的Java代码、框架配置文件、国际化等其他资源文件、JSP页面和图片等静态资源作为“原材料”,去“生产”出一个可以运行的项目的过程。
那么项目构建的全过程中都包含哪些环节呢?
1.3 构建环节
- 清理:删除以前的编译结果,为重新编译做好准备。
- 编译:将Java源程序编译为字节码文件。
- 测试:针对项目中的关键点进行测试,确保项目在迭代开发过程中关键点的正确性。
- 报告:在每一次测试后以标准的格式记录和展示测试结果。
- 打包:将一个包含诸多文件的工程封装为一个压缩文件用于安装或部署。Java工程对应jar包,Web工程对应war包。
- 安装:在Maven环境下特指将打包的结果——jar包或war包安装到本地仓库中。
- 部署:将打包的结果部署到远程仓库或将war包部署到服务器上运行。
第2章 Maven 如何使用
在这一节中,我们来看看Maven核心程序的安装和本地仓库的必要设置。然后我们就可以编写第一个Maven程序了。
2.1 安装Maven核心程序
-
检查JAVA_HOME环境变量。Maven是使用Java开发的,所以必须知道当前系统环境中JDK的安装目录。
C:\Windows\System32>echo %JAVA_HOME%
E:\java\jdk1.8.0_45 -
解压Maven的核心程序。
将apache-maven-3.5.4-bin.zip解压到一个非中文无空格的目录下。例如:
E:\apache-maven-3.5.4 -
配置环境变量。
M2_HOME
E:\apache-maven-3.5.4
path
%M2_HOME%\bin
- ④查看Maven版本信息验证安装是否正确
C:\Users\Administrator>mvn -v
Apache Maven 3.5.4 (1edded0938998edf8bf061f1ceb3cfdeccf443fe; 2018-06-18T02:33:14+08:00)
Maven home: E:\apache-maven-3.5.4\bin…
Java version: 1.8.0_45, vendor: Oracle Corporation, runtime: E:\java\jdk1.8.0_45\jre
Default locale: zh_CN, platform encoding: GBK
OS name: “windows 7”, version: “6.1”, arch: “amd64”, family: “windows”
2.2 Maven 联网问题
- 配置本地仓库
- Maven的核心程序并不包含具体功能,仅负责宏观调度。具体功能由插件来完成。Maven核心程序会到本地仓库中查找插件。如果本地仓库中没有就会从远程中央仓库下载。此时如果不能上网则无法执行Maven的具体功能。为了解决这个问题,我们可以将Maven的本地仓库指向一个在联网情况下下载好的目录。
- Maven默认的本地仓库:~.m2\repository目录。
Tips:~表示当前用户的家目录。 - Maven的核心配置文件位置:
解压目录E:\apache-maven-3.5.4\conf\settings.xml - 设置方式
以及准备好的仓库位置
E:\LocalRepository - 为了以后下载jar包方便,配置阿里云镜像
nexus-aliyun
central
Nexus aliyun
http://maven.aliyun.com/nexus/content/groups/public
2.3 IDEA中配置Maven
- 设置maven的安装目录及本地仓库
Maven home directory:可以指定本地 Maven 的安装目录所在,因为我已经配置了 M2_HOME 系统参数,所以直接这样配置 IntelliJ IDEA 是可以找到的。但是假如你没有配置的话,这里可以选择你的 Maven 安装目录。此外,这里不建议使用IDEA默认的。
User settings file / Local repository:我们还可以指定 Maven 的 settings.xml 位置和本地仓库位置。
- 配置Maven自动导入依赖的jar包
Import Maven projects automatically:表示 IntelliJ IDEA 会实时监控项目的 pom.xml 文件,进行项目变动设置,勾选上。
Automatically download:在 Maven 导入依赖包的时候是否自动下载源码和文档。默认是没有勾选的,也不建议勾选,原因是这样可以加快项目从外网导入依赖包的速度,如果我们需要源码和文档的时候我们到时候再针对某个依赖包进行联网下载即可。IntelliJ IDEA 支持直接从公网下载源码和文档的。
VM options for importer:可以设置导入的 VM 参数。一般这个都不需要主动改,除非项目真的导入太慢了我们再增大此参数。
2.4 IDEA中创建Maven Module
6) 右键→new Module→Maven
-
点击Next,配置坐标
-
点击Next,给Module命名
-
目录结构及说明
main目录用于存放主程序。
test目录用于存放测试程序。
java目录用于存放源代码文件。
resources目录用于存放配置文件和资源文件。
- 配置Maven的核心配置文件pom.xml
4.0.0
<groupId>com.atguigu.maven</groupId>
<artifactId>Hello</artifactId>
<version>1.0-SNAPSHOT</version>
<dependencies>
<dependency>
<groupId>junit</groupId>
<artifactId>junit</artifactId>
<version>4.0</version>
<scope>test</scope>
</dependency>
</dependencies>
第3章 Maven的核心概念
3.1 核心概念
- POM
- 约定的目录结构
- 坐标
- 依赖
- 仓库
- 生命周期
- 插件和目标
- 继承
- 聚合
3.2 POM
Project Object Model:项目对象模型。将Java工程的相关信息封装为对象作为便于操作和管理的模型。Maven工程的核心配置。可以说学习Maven就是学习pom.xml文件中的配置。
3.3 约定的目录结构
现在JavaEE开发领域普遍认同一个观点:约定>配置>编码。意思就是能用配置解决的问题就不编码,能基于约定的就不进行配置。而Maven正是因为指定了特定文件保存的目录才能够对我们的Java工程进行自动化构建。
目录结构含义参见前面的描述。
3.4坐标
-
几何中的坐标
[1]在一个平面中使用x、y两个向量可以唯一的确定平面中的一个点。
[2]在空间中使用x、y、z三个向量可以唯一的确定空间中的一个点。 -
Maven的坐标
使用如下三个向量在Maven的仓库中唯一的确定一个Maven工程。
[1]groupId:公司或组织的域名倒序+当前项目名称
[2]artifactId:当前项目的模块名称
[3]version:当前模块的版本
com.atguigu.maven
Hello
0.0.1-SNAPSHOT -
如何通过坐标到仓库中查找jar包?
[1]将gav三个向量连起来
com.atguigu.maven+Hello+0.0.1-SNAPSHOT
[2]以连起来的字符串作为目录结构到仓库中查找
com/atguigu/maven/Hello/0.0.1-SNAPSHOT/Hello-0.0.1-SNAPSHOT.jar
※注意:我们自己的Maven工程必须执行安装操作才会进入仓库。安装的命令是:mvn install
3.5 依赖管理
-
基本概念
当A jar包需要用到B jar包中的类时,我们就说A对B有依赖。例如:commons-fileupload-1.3.jar依赖于commons-io-2.0.1.jar。
通过第二个Maven工程我们已经看到,当前工程会到本地仓库中根据坐标查找它所依赖的jar包。
配置的基本形式是使用dependency标签指定目标jar包的坐标。例如:
junit
junit
4.0test
-
直接依赖和间接依赖
如果A依赖B,B依赖C,`那么A→B和B→C都是直接依赖,而A→C是间接依赖。
3.5.1 依赖的范围
-
compile
[1]main目录下的Java代码可以访问这个范围的依赖
[2]test目录下的Java代码可以访问这个范围的依赖
[3]部署到Tomcat服务器上运行时要放在WEB-INF的lib目录下
例如:对Hello的依赖。主程序、测试程序和服务器运行时都需要用到。 -
test
[1]main目录下的Java代码不能访问这个范围的依赖
[2]test目录下的Java代码可以访问这个范围的依赖
[3]部署到Tomcat服务器上运行时不会放在WEB-INF的lib目录下
例如:对junit的依赖。仅仅是测试程序部分需要。 -
provided
[1]main目录下的Java代码可以访问这个范围的依赖
[2]test目录下的Java代码可以访问这个范围的依赖
[3]部署到Tomcat服务器上运行时不会放在WEB-INF的lib目录下
例如:servlet-api在服务器上运行时,Servlet容器会提供相关API,所以部署的时候不需要。 -
其他:runtime、import、system等。
各个依赖范围的作用可以概括为下图:
3.5.2 依赖的传递性
当存在间接依赖的情况时,主工程对间接依赖的jar可以访问吗?这要看间接依赖的jar包引入时的依赖范围——只有依赖范围为compile时可以访问。例如:
Maven工程 依赖范围 对A的可见性
A B C compile √
D test ×
E provided ×
3.5.3 依赖的原则:解决jar包冲突
-
路径最短者优先winword /a(-a)
-
路径相同时先声明者优先
这里“声明”的先后顺序指的是dependency标签配置的先后顺序。
3.5.4 依赖的排除
- 有的时候为了确保程序正确可以将有可能重复的间接依赖排除。请看如下的例子:
假设当前工程为MakeFriend,直接依赖OurFriends。
OurFriends依赖commons-logging的1.1.1对于MakeFriend来说是间接依赖。
当前工程MakeFriend直接依赖commons-logging的1.1.2
加入exclusions配置后可以在依赖OurFriends的时候排除版本为1.1.1的commons-logging的间 接依赖
com.atguigu.maven
OurFriends
1.0-SNAPSHOT commons-logging commons-logging
3.5.5 统一管理目标jar包的版本
以对Spring的jar包依赖为例:Spring的每一个版本中都包含spring-context,springmvc等jar包。我们应该导入版本一致的Spring jar包,而不是使用4.0.0的spring-context的同时使用4.1.1的springmvc。
org.springframework
spring-context
4.0.0.RELEASE
org.springframework
spring-webmvc
4.0.0.RELEASE
org.springframework
spring-jdbc
4.0.0.RELEASE
org.springframework
spring-orm
4.0.0.RELEASE
问题是如果我们想要将这些jar包的版本统一升级为4.1.1,是不是要手动一个个修改呢?显然,我们有统一配置的方式:
……
org.springframework
spring-context
spring.version</version></dependency><dependency><groupId>org.springframework</groupId><artifactId>spring−webmvc</artifactId><version>{spring.version}</version>
</dependency>
<dependency>
<groupId>org.springframework</groupId>
<artifactId>spring-webmvc</artifactId>
<version>spring.version</version></dependency><dependency><groupId>org.springframework</groupId><artifactId>spring−webmvc</artifactId><version>{spring.version}
org.springframework
spring-jdbc
spring.version</version></dependency><dependency><groupId>org.springframework</groupId><artifactId>spring−orm</artifactId><version>{spring.version}</version>
</dependency>
<dependency>
<groupId>org.springframework</groupId>
<artifactId>spring-orm</artifactId>
<version>spring.version</version></dependency><dependency><groupId>org.springframework</groupId><artifactId>spring−orm</artifactId><version>{spring.version}
这样一来,进行版本调整的时候只改一改地方就行了。
3.6 仓库
- 分类
① 本地仓库:为当前本机电脑上的所有Maven工程服务。
② 远程仓库
[1] 私服:架设在当前局域网环境下,为当前局域网范围内的所有Maven工程服务。
[2]中央仓库:架设在Internet上,为全世界所有Maven工程服务。
[3]中央仓库的镜像:架设在各个大洲,为中央仓库分担流量。减轻中央仓库的压力,同时更快的响应用户请求。
2) 仓库中的文件
① Maven的插件
② 我们自己开发的项目的模块
③ 第三方框架或工具的jar包
※不管是什么样的jar包,在仓库中都是按照坐标生成目录结构,所以可以通过统一的方式查
询或依赖。
3.7 生命周期
- 什么是Maven的生命周期?
Maven生命周期定义了各个构建环节的执行顺序,有了这个清单,Maven就可以自动化的执行构 建命令了。
Maven有三套相互独立的生命周期,分别是:
Clean Lifecycle在进行真正的构建之前进行一些清理工作。
Default Lifecycle构建的核心部分,编译,测试,打包,安装,部署等等。
Site Lifecycle生成项目报告,站点,发布站点。
再次强调一下它们是相互独立的,你可以仅仅调用clean来清理工作目录,仅仅调用site来生成站点。当然你也可以直接运行 mvn clean install site 运行所有这三套生命周期。
每套生命周期都由一组阶段(Phase)组成,我们平时在命令行输入的命令总会对应于一个特定的阶段。比如,运行mvn clean,这个clean是Clean生命周期的一个阶段。有Clean生命周期,也有clean阶段。
-
clean生命周期
Clean生命周期一共包含了三个阶段:
pre-clean 执行一些需要在clean之前完成的工作
clean 移除所有上一次构建生成的文件
post-clean 执行一些需要在clean之后立刻完成的工作 -
Site生命周期
pre-site 执行一些需要在生成站点文档之前完成的工作
site 生成项目的站点文档
post-site 执行一些需要在生成站点文档之后完成的工作,并且为部署做准备
site-deploy 将生成的站点文档部署到特定的服务器上
这里经常用到的是site阶段和site-deploy阶段,用以生成和发布Maven站点,这可是Maven相当强大的功能,Manager比较喜欢,文档及统计数据自动生成,很好看。 -
Default生命周期
Default生命周期是Maven生命周期中最重要的一个,绝大部分工作都发生在这个生命周期中。这里,只解释一些比较重要和常用的阶段:
validate
generate-sources
process-sources
generate-resources
process-resources 复制并处理资源文件,至目标目录,准备打包。
compile 编译项目的源代码。
process-classes
generate-test-sources
process-test-sources
generate-test-resources
process-test-resources 复制并处理资源文件,至目标测试目录。
test-compile 编译测试源代码。
process-test-classes
test 使用合适的单元测试框架运行测试。这些测试代码不会被打包或部署。
prepare-package
package 接受编译好的代码,打包成可发布的格式,如JAR。
pre-integration-test
integration-test
post-integration-test
verify
install将包安装至本地仓库,以让其它项目依赖。
deploy将最终的包复制到远程的仓库,以让其它开发人员与项目共享或部署到服务器上运行。 -
生命周期与自动化构建
运行任何一个阶段的时候,它前面的所有阶段都会被运行,例如我们运行mvn install 的时候,代码会被编译,测试,打包。这就是Maven为什么能够自动执行构建过程的各个环节的原因。此外,Maven的插件机制是完全依赖Maven的生命周期的,因此理解生命周期至关重要。
3.8 插件和目标
- Maven的核心仅仅定义了抽象的生命周期,具体的任务都是交由插件完成的。
- 每个插件都能实现多个功能,每个功能就是一个插件目标。
- Maven的生命周期与插件目标相互绑定,以完成某个具体的构建任务。
例如:compile就是插件maven-compiler-plugin的一个功能;pre-clean是插件maven-clean-plugin的一个目标。
3.9 继承
3.9.1 为什么需要继承机制?
由于非compile范围的依赖信息是不能在“依赖链”中传递的,所以有需要的工程只能单独配置。例如:
Hello
junit
junit
4.0
test
HelloFriend
junit
junit
4.0
test
MakeFriend
junit
junit
4.0
test
此时如果项目需要将各个模块的junit版本统一为4.9,那么到各个工程中手动修改无疑是非常不可取的。使用继承机制就可以将这样的依赖信息统一提取到父工程模块中进行统一管理。
3.9.2 创建父工程
父工程的打包方式为pom
com.atguigu.maven
Parent
pom
1.0-SNAPSHOT
父工程只需要保留pom.xml文件即可
1 在子工程中引用父工程
…
…
…
…
此时如果子工程的groupId和version如果和父工程重复则可以删除。
2在父工程中管理依赖
将Parent项目中的dependencies标签,用dependencyManagement标签括起来
在子项目中重新指定需要的依赖,删除范围和版本号
junit
junit
3.10 聚合
3.10.1 为什么要使用聚合?
将多个工程拆分为模块后,需要手动逐个安装到仓库后依赖才能够生效。修改源码后也需要逐个手动进行clean操作。而使用了聚合之后就可以批量进行Maven工程的安装、清理工作。
3.10.2 如何配置聚合?
在总的聚合工程中使用modules/module标签组合,指定模块工程的相对路径即可
本文详细介绍了Maven作为自动化构建工具的重要性,包括其核心概念如自动化构建、构建环节、插件和目标。重点讲述了Maven的使用,包括安装配置、本地仓库设置、IDEA中集成Maven以及创建Maven项目的过程。同时,文章深入解析了Maven的坐标系统、依赖管理、仓库分类和生命周期,为读者提供了全面的Maven知识总结。
1461

被折叠的 条评论
为什么被折叠?



