
收获
La victoria
向内认知,向外行走
展开
-
mysql 对取当前日期周一和周日语句
select subdate(curdate(),date_format(curdate(),'%w')-1)//获取当前日期在本周的周一 select subdate(curdate(),date_format(curdate(),'%w')-7)//获取当前日期在本周的周日 这两句语句是mysql用来取当前日期的周一或周日的一个方法,那么这句如何运作的呢? %w 是以数字的形式来表示周中的天数( 0 = Sunday, 1=Monday, . . ., 6=Saturday),0为周日...原创 2020-06-24 09:42:22 · 744 阅读 · 0 评论 -
win在cmd查杀进程
1. 查:netstat -ano | findstr "8080"2. 杀:taskkill -PID 8082 -F原创 2020-06-09 21:02:54 · 378 阅读 · 0 评论 -
mysql binlog基本原理
基于binlog的主从复制Mysql 5.0以后,支持通过binary log(二进制日志)以支持主从复制。复制允许将来自一个MySQL数据库服务器(master) 的数据复制到一个或多个其他MySQL数据库服务器(slave),以实现灾难恢复、水平扩展、统计分析、远程数据分发等功能。二进制日志中存储的内容称之为事件,每一个数据库更新操作(Insert、Update、Delete,不包括Select)等都对应一个事件。下面以mysql主从复制为例,讲解一个从库是如何从主库拉取binlog,并回放转载 2020-05-29 17:28:35 · 1189 阅读 · 0 评论 -
azkaban3安装教程
https://blog.youkuaiyun.com/weixin_42179685/article/details/90716366转载 2020-05-29 16:06:54 · 538 阅读 · 0 评论 -
转发 微博 Qzone 微信 Linux 常用运维脚本
https://www.toutiao.com/a6830935261363307016/转载 2020-05-28 18:23:03 · 250 阅读 · 0 评论 -
Apache 资料下载地址:
Apache 资料下载地址:http://archive.apache.org/dist/原创 2020-05-18 14:41:35 · 204 阅读 · 0 评论 -
github搜索技巧
查考github官网搜索说明:https://help.github.com/en/github/searching-for-information-on-github/searching-for-repositories举例:in:readme spring boot stars:>3000(下载数) forks:>1000in:description 微服务 language:java pushed:>2020-03-01in:name example 名字中有“.原创 2020-05-18 09:30:24 · 496 阅读 · 0 评论 -
mysql sql语句大全
1、说明:创建数据库CREATE DATABASE database-name2、说明:删除数据库drop database dbname3、说明:备份sql server--- 创建 备份数据的 deviceUSE masterEXEC sp_addumpdevice 'disk', 'testBack', 'c:\mssql7backup\MyNwind_1.dat...转载 2020-04-21 19:25:46 · 384 阅读 · 0 评论 -
数据建模方法及步骤
何为建模?数据几乎总是用于两种目的:操作型记录的保存和分析型决策的制定。简单来说,操作型系统保存数据,分型型系统使用数据。前者一般仅反映数据的最新状态,按单条记录事务性来处理;其优化的核心是更快地处理事务。后者往往是反映数据一段时间的状态变化,按大批量方式处理数据;其核心是高性能、多维度处理数据。通常我们将操作型系统简称为OLTP(On-Line Transaction Processing)...转载 2020-04-21 19:22:23 · 8025 阅读 · 0 评论 -
Docker概念
容器 什么是Docker? Docker思想、特点 Docker容器主要解决什么问题 容器 VS 虚拟机 Docker基本概念: 镜像(Image),容器(Container),仓库(Repository)Docker 是世界领先的软件容器平台,所以想要搞懂Docker的概念我们必须先从容器开始说起。一 先从认识容器开始1.1 什么是容器?先来看看容器较为官方的解释...原创 2020-04-13 15:18:01 · 268 阅读 · 0 评论 -
linux下 oracle怎么导入dmp文件
先创建数据库用户:create user XXX identified by xxx default tablespace XXXXX;grant connect,resource,dba to XXX ;数据库:用户名:XXXX密码:XXXX服务器连接地址和SID:10.XX.XX.XXX:1521/orcl1、给dmp文件加权限chmod 777 /home/userct/...转载 2020-04-02 16:36:03 · 3150 阅读 · 0 评论 -
oracle--SYSTEM表空间不足问题
杂症二、SYSTEM表空间不足报错一、杂症:PLSQL登录,报错:ORA-00604: 递归 SQL 层出现错误ORA-01653: 表.无法通过(在表空间中)扩展ORA-02002: 写入审记线索时出错二、病理:1、表空间不足2、数据库的审计功能已经开启引起(SYS.AUD$表)三、病因定位:先连接上数据库:# su oracle# sqlpl...转载 2020-04-02 13:53:17 · 781 阅读 · 0 评论 -
通俗易懂的Kafka入门
什么是ZooKeeper? 什么是消息队列?众所周知,消息队列的产品有好几种,这里我选择学习Kafka的原因,无他,公司在用。我司使用的是Kafka和自研的消息队列(Kafka和RocketMQ)改版,于是我就想学学Kafka这款消息队列啦。本篇文章对Kafka入门,希望对大家有所帮助。本文知识点提前预览:一、什么是Kafka?首先我们得去官网看看是怎么介绍Kaf...原创 2020-04-02 13:17:18 · 223 阅读 · 0 评论 -
分库分表
一、数据库瓶颈1、IO瓶颈2、CPU瓶颈二、分库分表1、水平分库2、水平分表3、垂直分库4、垂直分表三、分库分表工具四、分库分表步骤五、分库分表问题1、非partition key的查询问题(水平分库分表,拆分策略为常用的hash法)2、非partition key跨库跨表分页查询问题(水平分库分表,拆分策略为常用的hash法)3、扩容问题(水平分库分表,拆分策略为常用的hash法)六、分库分表总...原创 2020-03-31 08:57:54 · 200 阅读 · 0 评论 -
从mysql主从复制到微信开源的phxsql
严格的来说,微信开源的phxsql不是数据库,而是一个数据库的插件;传统的互联网数据库结构一般是这样的:服务访问数据库是通过分片来的:除了这种基于hash的分片,还有一种基于range的分片方式通常,基于range的分片场景下会引入一个新的服务来保存range分片的元信息,列如etcd:数据库连接是这样进行的: 第1步, 先监控etcd服务上的...转载 2020-03-30 14:24:07 · 194 阅读 · 0 评论 -
CDATA-从Oracle导出数据并导入到Hive
1、配置源和目标的数据连接源(oracle):目标(Hive 2.1.1),需要事先将hive的驱动程序导入HHDI的lib目录中。Hive2.1.1需要的jar包如下:可根据自身情况更换hadoop和hive的jar包。hadoop-common-2.6.0.jarhive-common-2.1.0.jarhive-jdbc-2.1.0.jarhive-met...原创 2020-03-28 16:02:39 · 428 阅读 · 0 评论 -
Intellij IDEA常用技巧
Intellij IDEA是一个非常好用的IDE,但是刚刚从Eclipse等IDE切换过来的同学可能对IDEA很不习惯,进而产生IDEA没有Eclipse好用的感觉。其实在IDEA中有很多小技巧,熟悉它们可以让我们在开发的时候获得极大的方便。所以本文向大家介绍一些常用的技巧, 希望对大家有所帮助。当然因为Jetbrains系IDE都是互通的, 所以这里的一些技巧完全可以应用到PyC...原创 2020-02-28 20:54:33 · 481 阅读 · 0 评论 -
JVM参数详解
# 一、JVM参数## 1.1 标准参数-version -help -server -cp ## 1.2 -X参数非标准参数,也就是在JDK各个版本中可能会变动-Xint 解释执行 -Xcomp 第一次使用就编译成本地代码 -Xmixed 混合模式,JVM自己来决定 ## 1.3 -XX参数使用得最多的参数类型,非标准化参...原创 2020-02-28 09:19:05 · 1003 阅读 · 0 评论 -
Linux find命令大全
以下是find命令大全#find . {-atime/-ctime/-mtime/-amin/-cmin/-mmin} [-/+]num#atime:访问时间(access time),指的是文件最后被读取的时间,可以使用touch命令更改为当前时间;#ctime:变更时间(change time),指的是文件本身最后被变更的时间,变更动作可以使chmod、chgrp、mv等等;#...原创 2020-02-27 14:54:03 · 543 阅读 · 0 评论 -
Linux 问题故障定位
1、背景有时候会遇到一些疑难杂症,并且监控插件并不能一眼立马发现问题的根源。这时候就需要登录服务器进一步深入分析问题的根源。那么分析问题需要有一定的技术经验积累,并且有些问题涉及到的领域非常广,才能定位到问题。所以,分析问题和踩坑是非常锻炼一个人的成长和提升自我能力。如果我们有一套好的分析工具,那将是事半功倍,能够帮助大家快速定位问题,节省大家很多时间做更深入的事情。2、说明本篇文章主...转载 2020-02-27 14:33:00 · 642 阅读 · 0 评论 -
元数据管理在银行业务中的应用
伴随着我国银行信息化建设的发展,银行形成了包括核心系统、数据仓库、风险管理、客户关系管理等在内的多种业务和管理系统。大数据给银行数据处理带来的大容量、快速处理和多样性,使得银行在数据标准建设、信息共享、信息挖掘利用等方面面临挑战,也越来越重视元数据的管理和体系的建设工作。本篇文章,笔者将为大家解读一下有关银行进行元数据管理的三个问题,明确在行业快速变化的大环境下,如何建设符合银行自身特色的元数...原创 2020-02-22 16:13:01 · 1042 阅读 · 0 评论 -
生产环境下shell脚本:Mysql数据库备份和Mysql主从同步监控
在企业的Liunx运维中,经常需要应用到各种shell脚本,比如Mysql数据库备份Shell脚本和Mysql主从同步监控Shell脚本等等常用企业运维shell脚本。。下面分享两例,希望对大家有帮助Mysql数据库备份脚本(完整备份+异地备份)Mysql数据库备份其实方法有很多,一般非超大量业务,可以使用 mysqldump 。Mysql数据库备份可以采用在MYSQL从库上执行全量备份+...原创 2020-02-06 18:28:32 · 758 阅读 · 0 评论 -
「网易云音乐」歌单推荐算法
推荐算法可以通过APP表现进行反推,不会100%准确,但应该也八九不离十。推荐依据推荐算法不是无根之水,它必须借助用户的数据才可以进行推荐。即使是冷启动,也需要获得你的微博、微信(你的登录方式)或其他已注册用户的热门喜好。具体的数据包括:浏览记录 页面停留时间 歌曲播放次数 点击歌曲但未播放记录 点击歌曲且播放完成记录 歌曲、歌单、歌手的收藏记录 歌单播放...转载 2020-01-29 10:13:11 · 5261 阅读 · 2 评论 -
Centos7上配置nginx的负载均衡
一 重要的概念理解1 什么是nginx呢?Nginx是一个web服务器和反向代理服务器,用于HTTP、HTTPS、SMTP、POP3和IMAP协议.2 什么是反向代理呢?反向代理隐藏了真实的服务端,当我们请求 www.baidu.com 的时候,就像拨打10086一样,背后可能有成千上万台服务器为我们服务,但具体是哪一台,你不知道,也不需要知道,你只需要知道反向代理服务器是谁就好了...原创 2020-01-28 12:23:13 · 301 阅读 · 0 评论 -
Tomcat
1、Tomcat是什么Tomcat是一个应用服务器,比方说,我有个web项目是想让他运行,就可以在运行在tomcat平台上,如果开启就可以运行访问,如果停掉tomcat服务,那么无法访问了2、Tomcat的默认端口是多少,怎么修改?8080修改方式:(1)找到Tomcat目录下的conf文件夹(2)进入conf文件夹里面找到server.xml文件(3)打开...原创 2020-01-28 12:18:58 · 499 阅读 · 0 评论 -
Shell脚本结合Hive自动分析日志信息
Nginx的日志信息很多都是用时间进行区分的,比如下面的日志信息可以按照这样的数据建立分区表:二级分区表建立数据库创建数据表create table load_dynamic_table (id string,url string,referer string,keyword string,type string,guid string...转载 2019-12-23 19:22:03 · 332 阅读 · 1 评论 -
银行数据架构体系
数据架构层面通过数据分类、分层部署等手段,从非功能性视角将数据合理布局。通过整体架构管控和设计,支持业务操作类和管理分析类应用(系统),满足业务发展及IT转型对数据的需求,架构的扩展性和适应性能够提升数据分析应用的及时性、灵活性和准确性。那实际情况下各个银行的数据架构体系会有所不同,根据各行的业务发展、客户数据量、交易数据量、功能需求等会有不同的演变路径以及发展方向。一般国有银行、股份制银行等...原创 2019-12-22 11:43:48 · 3956 阅读 · 0 评论 -
Apache Spark和Apache Flink的区别
Apache Spark和Apache Flink的区别Apache Spark是Apache软件基金会开发的开源集群计算框架。Apache Spark非常快,可以用于大规模数据处理。它是大数据技术领域现有大型数据处理工具的替代。Apache Flink是一个开源框架,用于数据流应用程序的流处理,在分布式应用程序中具有高可用性、高性能、稳定性和准确性。Apache Flink在流引擎...转载 2019-12-21 13:28:45 · 472 阅读 · 0 评论 -
Hive 和 Impala的比较
Hive 和 Impala的异同Hive是一个建立在APACHE HADOOP之上的数据仓库软件项目,由Jeff在Facebook的团队开发,目前已经发布了2.3.0的稳定版本。它被用于总结大数据,使查询和分析变得容易。Apache Hive是SQL-in Hadoop的有效标准。Impala是一个运行在Apache Hadoop上的并行处理SQL查询引擎,用于处理存储在HBase (Hado...原创 2019-12-21 12:00:36 · 6154 阅读 · 1 评论 -
Docker 基础
什么是DockerDocker 使用 Google 公司推出的 Go 语言 进行开发实现,基于 Linux 内核的 cgroup,namespace,以及 AUFS 类的 Union FS 等技术,对进程进行封装隔离,属于 操作系统层面的虚拟化技术。由于隔离的进程独立于宿主和其它的隔离的进程,因此也称其为容器。Docker 在容器的基础上,进行了进一步的封装,从文件系统、网络互联到进程隔离...原创 2019-12-21 11:59:28 · 211 阅读 · 0 评论 -
sqoop的使用之导入到hive和mysql
先登录hive在hive中操作,创建数据库:create database frommysql;创建表创建表create table importhive_info(num int,name string)row format delimited fields terminated by "\t";数据也有了执行语...转载 2019-12-21 11:57:51 · 222 阅读 · 0 评论 -
Zookeeper的介绍
高并发分布式开发技术体系已然非常的庞大,从国内互联网企业使用情况,可发现RPC、Dubbo、ZK是最基础的技能要求。关于Zookeeper你是不是还停留在Dubbo注册中心的印象中呢?还有它的工作原理呢?经典应用场景呢?对前面三个问题,如若回答时没有自己的思路或者说并未了解,那么我觉得我可以帮助到你去入门,并深化这些知识,让你在面试中更好地去回答。话不多说进入正题1. 并发环境下面临的挑战...原创 2019-12-21 11:52:44 · 223 阅读 · 0 评论 -
nginx介绍
什么是反向代理与负载均衡什么是反向代理当我们有一个服务器集群,并且服务器集群中的每台服务器的内容一样的时候,同样我们要直接从个人电脑访问到服务器集群服务器的时候无法访问,必须通过第三方服务器才能访问集群这个时候,我们通过第三方服务器访问服务器集群的内容,但是我们并不知道是哪一台服务器提供的内容,此种代理方式称为反向代理什么是负载均衡公司会建立很多的服务器,这些服务器组成了服务器...转载 2019-12-17 14:56:00 · 108 阅读 · 0 评论 -
sed
sed 命令是什么sed 命令表示 Stream Editor(流编辑器),用来在 Linux 上执行基本的文本操作。它可以执行各种功能,如搜索、查找、修改、插入或删除文件。此外,它也可以执行复杂的正则表达式匹配。它可用于以下目的:查找和替换匹配给定的格式的内容。 在指定行查找和替换匹配给定的格式的内容。 在所有行查找和替换匹配给定的格式的内容。 搜索并同时替换两种不同的模式...原创 2019-12-08 17:03:35 · 268 阅读 · 0 评论 -
awk
awk的工作模式awk是一个文本处理工具,通常用于处理数据并生成结果报告语法格式第一种形式awk 'BEGIN{}pattern{commands}END{}' file_name语法格式解释BEGIN正式处理数据之前pattern匹配模式{commands}匹配命令,可能多行END处理完所有匹配数据后执行第二种形式standard ou...原创 2019-12-08 17:02:41 · 243 阅读 · 0 评论 -
Redis可视化管理客户端
在之前的文章中,我曾介绍过好几个Redis的可视化管理客户端,像国产的RedisView、WebRedisManager以及一个官方收费的RedisDesktopManager,这几个不管是从颜值还是功能可能都有些差强人意,就曾有朋友在留言去吐槽过。那么因此今天就介绍两个免费开源且跨平台的Redis客户端管理工具,其中一个也是国人开发的!RedisPlus码云:https://git...原创 2019-12-08 11:07:31 · 1304 阅读 · 0 评论 -
Kafka安装教程
Kafka集群部署概述之前的大数据集群主要是离线处理的方式对集群的数据进行开发处理。当前的集群数据量已经达到了PB级别了,离线数据获取主要是从数仓侧进行全量或者增量的方式导入大数据平台,部分是通过SFTP的方式解析进入大数据平台,少量数据是通过接口的方式准实时接入到大数据平台。随着业务的发展,对于实时数据的接入和应用显得越来越重要了,接下来的时间会一直更新整个时间数据接入和应用的分享。...原创 2019-12-08 11:01:59 · 527 阅读 · 0 评论 -
22道机器学习常见面试题目
来源:机器学习算法与自然语言处理本文为你带来22道机器学习常见的面试问题和回答。1、无监督和有监督算法的区别?有监督学习:对具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测。这里,所有的标记(分类)是已知的。因此,训练样本的岐义性低。无监督学习:对没有概念标记(分类)的训练样本进行学习,以发现训练样本集中的结构性知识。这里,所有的标记(分类)...原创 2019-12-07 21:43:42 · 1582 阅读 · 0 评论 -
Linux下用dd命令测试硬盘的读写速度
一、测试写速度:time dd if=/dev/zero of=/tmp/test bs=8k count=1000000测试结果:565 MB/s二、测试读速度:time dd if=/tmp/test of=/dev/null bs=8k测试结果:4.7GB/s三、测试读写速度:time dd if=/tmp/test of=/var/test bs=...原创 2019-12-02 13:33:25 · 24947 阅读 · 1 评论 -
sql注入经典案例重现,再带你了解黑客技术
经过了我们前段时间的sql注入学习,今天我们来深入学习一下sql注入之cookie注入首先我们打开靶场环境随便点开一篇文章尝试在结尾构造一下 and 1=1可见是使用了防注入的,但是目前我们是使用get方式提交的参数,我们将id=171包括后面的全部删除一下试试显示数据库出错这里存在cookie注入,首先我们恢复成原来的界面然后我们下载一个...转载 2019-11-30 20:35:39 · 696 阅读 · 0 评论