
大数据
文章平均质量分 77
life_+
这个作者很懒,什么都没留下…
展开
-
批量加载excel的xsl文件到hive分区表
批量加载excel的xsl文件到hive分区表原创 2022-08-19 16:14:18 · 634 阅读 · 0 评论 -
hive Serde解析复杂json串
使用hive-json-schema自动生成建表语句,Serde解析器解析JSON文件原创 2022-08-09 16:43:26 · 904 阅读 · 0 评论 -
scala函数式编程-常用的函数
foreach用来遍历集合的采用 foreach 来遍历集合, 可以让代码看起来更简洁, 更优雅.格式def foreach(f:(A) => Unit): Unit//简写形式def foreach(函数)说明案例 def main(args: Array[String]): Unit = { val list: immutable.Seq[Range.Inclusive] = List(1 to 10) val list2: immutable.Seq[I..原创 2021-04-01 19:09:14 · 139 阅读 · 0 评论 -
Scala集合
1.数组1.1定长数组创建数组语法格式一 : 通过指定长度定义数组val /var 变量名 = new Array[元素类型](数组长度)格式二 : 通过指定元素定义数组val /var 变量名 = Array(元素1, 元素2, 元素3...)注意在scala中,数组的泛型使用 [] 来指定.使用 数组名 (索引) 来获取数组中的元素.数组元素是有默认值的, Int:0, Double:0.0, String: null通过 数组名 .length 或者 数组名 .size 来原创 2021-03-31 20:14:57 · 155 阅读 · 0 评论 -
偏函数与Option类型
偏函数1.1 定义偏函数提供了更简洁的语法,可以简化函数的定义。配合集合的函数式编程,可以让代码更加优雅。所谓的偏函数是指 被包在花括号内没有 match的一组case语句 , 偏函数是PartialFunction[A, B]类型的的一个实例对象, 其中A代表输入参数类型, B代表返回结果类型.1.2 语法格式val 对象名 :PartialFunction[类型1,类型2]= { //这对大括号及其内部的一组case语句, 就组成了一个偏函数. case 值1 => 表达式1原创 2021-03-30 18:56:45 · 133 阅读 · 0 评论 -
Scala隐式转换
1.1 概述隐式转换和隐式参数是Scala中非常有特色的功能,也是Java等其他编程语言没有的功能。我们可以很方便地利用隐式转换来丰富现有类的功能隐式转换的本质 :隐式转换是在Scala编译器进行类型匹配时,如果找不到合适的类型,那么隐式转换会让编译器在作用范围内自动推导出来合适的类型。当编译器第一次编译失败的时候,会在当前的环境中查找能让代码编译通过的方法,用于将类型进行转换,实现二次编译。1.2 分类隐式参数普通方法或者函数中的参数可以通过 implicit 关键字声明为隐式参数,调用该方法时原创 2021-03-29 15:38:35 · 182 阅读 · 0 评论 -
Scala泛型
1. 泛型泛型的意思是泛指某种具体的数据类型, 在Scala中, 泛型用[数据类型]表示. 在实际开发中, 泛型一般是结合数组或者集合来使用的, 除此之外, 泛型的常见用法还有以下三种:泛型方法泛型类泛型特质1.1 泛型方法泛型方法指的是把泛型定义到方法声明上, 即:该方法的参数类型是由泛型来决定的. 在调用方法时, 明确具体的数据类型.格式def 方法名[泛型名称](..) = { //...}需求定义方法getMiddleElement(), 用来获取任意类型数组的原创 2021-03-28 21:59:44 · 1242 阅读 · 0 评论 -
三、算术运算符
1.1 运算符简介用来拼接变量或者常量的符号就叫: 运算符, 而通过运算符连接起来的式子就叫: 表达式. 实际开发中, 我们会经常用到它.例如: 10 + 3 这个就是一个表达式, 而+号, 就是一个运算符. 注意: 在Scala中, 运算符并不仅仅是运算符, 也是函数的一种, 这点大家先了解即可, 后续我们详细讲解.1.2 运算符的分类算术运算符赋值运算符关系运算符逻辑运算符位运算符注意: Scala中是没有三元运算符的, 被if-else给替代了.原创 2021-03-27 12:46:19 · 779 阅读 · 1 评论 -
二、输出语句和分号
1.1 输出语句方式一: 换行输出格式: println(里边写你要打印到控制台的数据);方式二: 不换行输出格式: print(里边写你要打印到控制台的数据);注意: 不管是println(), 还是print()语句, 都可以同时打印多个值.格式为: println(值1, 值2, 值3...)1.2 分号Scala语句中, 单行代码最后的分号可写可不写. 如果是多行代码写在一行, 则中间的分号不能省略, 最后一条代码的分号可省略不写.示例:println("Hello原创 2021-03-26 22:41:19 · 563 阅读 · 0 评论 -
1. Scala简介与环境搭建
1. Scala简介与环境搭建1.1 概述 Scala(斯嘎拉)这个名字来源于"Scalable Language(可伸缩的语言)", 它是一门基于JVM的多范式编程语言, 通俗的说: Scala是一种运行在JVM上的函数式的面向对象语言. 之所以这样命名, 是因为它的设计目标是: 随着用户的需求一起成长. Scala可被广泛应用于各种编程任务, 从编写小型的脚本到构建巨型系统, 它都能胜任. 正因如此, Scala得以提供一些出众的特性, 例如: 它集成了面向对象编程和面向函数式编程的各种特性, 以原创 2021-03-26 21:59:58 · 242 阅读 · 0 评论 -
(一)HBase基础
(一)HBase基础一、介绍官网1、基本概念 hbase是bigtable的开源java版本,是建立在hdfs之上。提供高可靠性、高性能、列存储、可伸缩、实时读写nosql 的数据库系统。它介于nosql和RDBMS之间,仅能通过主键(row key)和主键的range来检索数据,仅支持单行事务(可通过hive支持来实现多表join等复杂操作)。主要用来存储结构化和半结构化的松散数据。Hbase查询数据功能很简单,不支持join等复杂操作,不支持复杂的事原创 2020-07-20 20:50:34 · 230 阅读 · 0 评论 -
(四)JDBC-MySQL 事务
一、介绍1、概念事务指的是逻辑上的一组操作,组成这组操作各个逻辑单元要么全都成功,要么全都失败。MySQL 事务主要用于处理操作量大,复杂度高的数据。比如说,在转账交易当中,甲转给乙100元,那么甲的账户要减少100,同时乙的账户增加100.2、Mysql中的事务 在 MySQL 中只有使用了 Innodb 数据库引擎的数据库或表才支持事务。 事务处理可以用来维护数据库的完整性,保证成批的 SQL 语句要么全部执行,要么全部不执行。 事务用来管理 insert,upda原创 2020-07-20 20:03:59 · 144 阅读 · 0 评论 -
(三)JDBC-SQL注入漏洞和CRUD操作之PreparedStatement
一、SQL注入漏洞分析1、分析2、测试public class UserDao { /** * 完成用户登录的方法:解决SQL注入漏洞 * @param username * @param password * @return */ public boolean login2(String username,String password){ Connection conn = null; Prepa...原创 2020-07-19 13:07:37 · 250 阅读 · 0 评论 -
(二)JDBC API
[jdbc]一、DriverManager1、作用一这个方法可以完成驱动的注册,但是实际开发中一般不会使用这个方法完成驱动的注册。原因:如果需要注册驱动,就会使用DriverManager.registerDriver(new Driver());,但是查看源代码在代码中有一段静态代码块,静态代码块已经调用了注册驱动的方法。如果再手动调用该方法注册驱动,就会导致驱动被注册两次。实际开发中一般会采用:Class.forName(“com.MySQL.jdbc.Driver”);2、作用二:管理事务原创 2020-07-19 12:49:20 · 923 阅读 · 0 评论