zilong230905-优快云博客

原创 redis与linux系统调用epoll

redis 是一个单线程却性能非常好的内存数据库，主要用来作为缓存系统。 redis 采用linux网络IO多路复用技术(epoll)来保证在多连接的时候，系统的高吞吐量。redis的高并发与epoll介绍如下：redis的高并发的原因：1）绝大部分请求是内存操作，非常快速2）单线程，避免了不必要的上下文切换3）IO内部实现采用l...

2019-09-02 23:13:12 424 2

原创 kafka与linux系统调用

尽管kafka的消息保存在磁盘中，kafka依然有着高吞吐率，支持每秒百万级的写入请求，一个重要的原因是kafka使用了多项linux系统调用，使得读写速度那么快。本篇首先简要介绍kafka，然后说明kafka使用的linux系统调用mmap和sendfile。 kafka的broker为消...

2019-09-02 23:11:23 419

转载 Java中其他各式各样的问题

这部分包含 Java 中关于 XML 的面试题，JDBC 面试题，正则表达式面试题，Java 错误和异常及序列化面试题125）嵌套静态类与顶级类有什么区别？(答案)一个公共的顶级类的源文件名称与类名相同，而嵌套静态类没有这个要求。一个嵌套类位于顶级类内部，需要使用顶级类的名称来引用嵌套静态类，如 HashMap.Entry 是一个嵌套静态类，HashMap 是一个顶级类，Entry是一个嵌...

2019-03-09 10:38:09 414

转载关于 OOP 和设计模式

这部分包含 Java 面试过程中关于 SOLID 的设计原则，OOP 基础，如类，对象，接口，继承，多态，封装，抽象以及更高级的一些概念，如组合、聚合及关联。也包含了 GOF 设计模式的问题。103）接口是什么？为什么要使用接口而不是直接使用具体类？接口用于定义 API。它定义了类必须得遵循的规则。同时，它提供了一种抽象，因为客户端只使用接口，这样可以有多重实现，如 List 接口，你可以...

2019-03-09 10:36:41 1064

转载 Java 最佳实践

包含 Java 中各个部分的最佳实践，如集合，字符串，IO，多线程，错误和异常处理，设计模式等等。76）Java 中，编写多线程程序的时候你会遵循哪些最佳实践？(答案)这是我在写Java 并发程序的时候遵循的一些最佳实践： a）给线程命名，这样可以帮助调试。 b）最小化同步的范围，而不是将整个方法同步，只对关键部分做同步。 c）如果可以，更偏向于使用 volatile 而不是 synchr...

2019-03-09 10:36:02 697

转载 Java IO 和 NIO基础知识

IO 是 Java 面试中一个非常重要的点。你应该很好掌握 Java IO，NIO，NIO2 以及与操作系统，磁盘 IO 相关的基础知识。下面是 Java IO 中经常问的问题。66）在我 Java 程序中，我有三个 socket，我需要多少个线程来处理？67）Java 中怎么创建 ByteBuffer？ByteBuffer bb = ByteBuffer.wrap(newbyte[...

2019-03-09 10:34:15 990

转载 Java 集合框架

这部分也包含数据结构、算法及数组的面试问题48) List、Set、Map 和 Queue 之间的区别(答案)List 是一个有序集合，允许元素重复。它的某些实现可以提供基于下标值的常量访问时间，但是这不是 List 接口保证的。Set 是一个无序集合。49）poll() 方法和 remove() 方法的区别？poll() 和 remove() 都是从队列中取出一个元素，但是 po...

2019-03-09 10:33:15 227

转载 java关于内存的基本概念

Java 基本概念面试题44）“a==b”和”a.equals(b)”有什么区别？如果 a 和 b 都是对象，则 a==b 是比较两个对象的引用，只有当 a 和 b 指向的是堆中的同一个对象才会返回 true，而 a.equals(b) 是进行逻辑比较，所以通常需要重写该方法来提供逻辑一致性的比较。例如，String 类重写 equals() 方法，所以可以用于两个不同对象，但是包含的字母...

2019-03-09 10:31:45 342

转载 JVM 底层与 GC（Garbage Collection）

31）64 位 JVM 中，int 的长度是多数？Java 中，int 类型变量的长度是一个固定值，与平台无关，都是 32 位。意思就是说，在 32 位和 64 位的Java 虚拟机中，int 类型的长度是相同的。32）Serial 与 Parallel GC之间的不同之处？Serial 与 Parallel 在GC执行的时候都会引起 stop-the-world。它们之间主要不同...

2019-03-09 10:30:35 294

转载数据类型和 Java 基础

17）Java 中应该使用什么数据类型来代表价格？如果不是特别关心内存和性能的话，使用BigDecimal，否则使用预定义精度的 double 类型。18）怎么将 byte 转换为 String？可以使用 String 接收 byte[] 参数的构造器来进行转换，需要注意的点是要使用的正确的编码，否则会使用平台默认编码，这个编码可能跟原来的编码相同，也可能不同。19）Java 中怎...

2019-03-09 10:28:25 417

转载多线程、并发及线程的基础问题

多线程、并发及线程的基础问题1）Java 中能创建 volatile 数组吗？能，Java 中可以创建 volatile 类型数组，不过只是一个指向数组的引用，而不是整个数组。我的意思是，如果改变引用指向的数组，将会受到 volatile 的保护，但是如果多个线程同时改变数组的元素，volatile 标示符就不能起到之前的保护作用了。2）volatile 能使得一个非原子操作变成原子操...

2019-03-09 10:23:28 215

1) 什么是线程？线程是操作系统能够进行运算调度的最小单位，它被包含在进程之中，是进程中的实际运作单位。程序员可以通过它进行多处理器编程，你可以使用多线程对运算密集型任务提速。比如，如果一个线程完成一个任务要100毫秒，那么用十个线程完成改任务只需10毫秒。Java在语言层面对多线程提供了卓越的支持，它也是一个很好的卖点。2) 线程和进程有什么区别？线程是进程的子集，一个进程可以有很多线程，...

2019-03-09 10:18:07 577

原创 python sklearn预处理方法

1. 标准化(scale)标准化目的是去均值。变换后各维特征有0均值，单位方差。也叫z-score规范化（零均值规范化）。计算方式是将特征值减去均值，除以标准差。import numpy as npfrom sklearn import preprocessingin_data = np.array([[5.1, -2.9, 3.3],[-1.2, 7.8, -6.1]])da...

2018-12-31 13:27:52 381

原创 presto部署连接postgresql

Presto配置依据官网介绍（https://prestodb.io/docs/current/installation/deployment.html）按步骤配置并启动presto。下载presto-server并解压重命名为presto，进入presto并新建etc、data文件夹；依据官网介绍，在etc文件夹下增加并配置presto各配置文件。 3. 增加postgre...

2018-12-26 15:16:31 3635

翻译 spark部署所需硬件资源

存储系统由于大多数Spark作业可能必须从外部存储系统（例如Hadoop文件系统或HBase）读取输入数据，因此将其尽可能靠近此系统放置非常重要。我们建议如下：如果可能的话，在与HDFS相同的节点上运行Spark。最简单的方法是建立一个Spark 独立模式集群同一节点上，并配置Spark和Hadoop的内存和CPU的使用情况，以避免相互干扰（Hadoop的，相关的选项是 ma...

2018-12-15 13:23:10 725 1

原创 windows7搭建vscode运行vue

vscode下载安装https://code.visualstudio.com/Download设置中文字体https://jingyan.baidu.com/article/7e44095377c9d12fc1e2ef5b.html运行vue工程在下侧控制台，打开“终端”，可执行如下命令运行工程npm run dev ...

2018-12-10 16:31:56 726

转载 vue windows7安装

参考：vue+webpack+npm搭建的纯前端项目

2018-12-10 16:23:32 413

原创 docker-compose部署kafka

docker-compose部署kafka介绍如下：编写docker-compose.yml文件，将文件中IP修改为本机ip，docker-compose.yml文件内容如下：version: '2'services: zookeeper: image: wurstmeister/zookeeper ports: - "2181:2181" kafk...

2018-12-09 14:42:10 1518

原创 streamsets docker版安装部署

首先确保系统安装并启动docker 打开streamsets官网，选择docker image，如下图所示参照官网介绍即上图所示，执行docker run...命令，完成streamset安装部署 ...

2018-12-09 14:37:00 2791 3

原创 streamingpro部署

部署环境为centos7,部署步骤如下下载与编译运行按照如下步骤，下载编译运行git clone https://github.com/allwefantasy/streamingpro .cd streamingpro./dev/make-distribution.shcp streamingpro-bin-1.1.3.tgz /tmpcd /tmp &...

2018-12-09 14:13:22 326

原创 CentOS7下PostgreSQL安装过程

参考： CentOS7下PostgreSQL安装过程修改密码，需首先执行connect： connectALTER USER postgres PASSWORD '123456';

2018-11-28 13:51:30 209

原创 kafka consumer partition分配

成功Rebalance的结果是，被订阅的所有Topic的每一个Partition将会被Consumer Group内的一个（有且仅有一个）Consumer拥有。每一个Broker将被选举为某些Consumer Group的Coordinator。某个Cosnumer Group的Coordinator负责在该Consumer Group的成员变化或者所订阅的Topic的Partititon变化时协...

2018-10-19 18:58:07 2638

原创 superset安装与问题解决

1.centos7环境安装superset Installation & Configurationsuperset介绍跟环境搭建CentOS7下安装python-pip2. superset docker经验证，在centos7下面这种方法可用superset安装与使用参考：Superset搭建及其简单使用3.问题（1）Was unable to ...

2018-10-16 09:31:50 3930

原创 kafka-manager-1.3.3.18.zip(centos7编译)

centos7编译kafka-manager-1.3.3.18.zip, 支持kafka1.1.01. sbt安装curl https://bintray.com/sbt/rpm/rpm | sudo tee /etc/yum.repos.d/bintray-sbt-rpm.repoyum install -y sbt2. 下载 kafka-manager-1.3.3.18.zip...

2018-10-11 17:19:43 1345

转载 CentOS 7下安装配置 VNC Server

vncserver安装参考：CentOS 7下安装配置 VNC Servervncserver设置开机自启动vncserver在centos7下设置开启自启动命令：systemctl enable vncserver@:1.service vncserver查询启动服务命令vncserver -list ...

2018-10-09 17:34:27 271

原创 docker部署大数据软件

1. hdfs 使用Docker部署单节点hadoop操作如下：docker pull sequenceiq/hadoop-docker:2.7.1 docker run -it sequenceiq/hadoop-docker:2.7.1 /etc/bootstrap.sh -bash 2. zookeeper 使用Docker部署单节点zookeeper操作如下：...

2018-10-09 17:31:40 575

原创 mongodb部署与开机自启动

1. 创建文件夹root用户mkdir /usr/local/mongodbchown docker:docker /usr/local/monogdbmkdir -p /data/mongodbchown -R docker:docker /data/mongodbdocker用户cd /data/mongodbmkdir db logs2解压将mongo...

2018-10-09 16:42:58 938

原创 suse12 redis-sensienl-keepalived双击热备部署

1. 部署环境本次部署环境为suse12，部署方式为离线部署2. 软件版本软件版本为redis-3.0.5，keepalived-1.3.6，依赖包有libopenssl-devel-1.0.1i-18.1.x86_64.rpm，zlib-devel-1.2.8-8.1.x86_64.rpm3. 部署过程部署过程参考，《利用redis-sentinel+keepalived...

2018-05-20 09:28:04 2078 2

原创 docker制作nginx静态网站示例

1. 环境centos72. 配置步骤本次配置的路径/home/dockerdir/，建立sample文件夹cd /home/dockerdirmkdir samplecd sample2.1Dockerfile配置进入/home/dockerdir/sample目录，touch Dockerfile，vim Dockerfile输入以下内容FROM centosMAINTAINER ZHA...

2018-04-30 08:43:44 577

原创 nginx在centos7环境下配置webserver

1.nginx在centos7环境安装打开linux终端输入如下命令，安装nginxyum updateyum -y install nginx或者rpm -Uvh http://nginx.org/packages/centos/7/noarch/RPMS/nginx-release-centos-7-0.el7.ngx.noarch.rpmyum -y install nginx2.ngi...

2018-04-30 00:26:02 559

原创 centos7 连接不上mongodb

使用mongodb的java api编写程序，连接mongodb服务连不上，mongodb服务、客户端程序在不同机器上。发现有两种原因，第一：mongodb服务所在机器防火墙未关；第二：mongodb启动该时绑定ip。以下是centos防火墙关闭、查询，及mongodb启动命令[root@localhost Desktop]# systemctl stop firewalld.servi...

2017-12-21 13:01:29 2184

原创通过MessageAndMetadata获取key和message

createDirectStream方式通过以下四步，获取key和message1. 获取Topic上次消费到的offset，信息保存在inputTopicLockMaster参数配置的zk中,即,localhost:21812. Create direct kafka stream with brokers and topics2. 利用MessageAndMetadata，重写接口PairFunction<T, K, V>的方法，获取key和message4. 获取rdd每个元素的key、mes

2017-09-09 23:42:27 4537

翻译 createDirectStream官网例子

区别Receiver接收数据，这种方式定期地从kafka的topic+partition中查询最新的偏移量，再根据偏移量范围在每个batch里面处理数据，使用的是kafka的简单消费者api 优点：1. 简化并行，不需要多个kafka输入流，该方法将会创建和kafka分区一样的rdd个数，而且会从kafka并行读取。 2. 高效，这种方式并不需要WAL，WAL模式需要对数据复制两次，第一次

2017-09-09 23:04:18 5150

原创 predictionio执行train、deploy、eval的命令和执行命令后的打印输出分别如下

predictionio执行train、deploy、eval的命令和执行命令后的打印输出分别如下

2017-06-29 22:30:06 2095

原创 scala符号<:和: =>以及_*等

scala符号<:和: =>以及_*等

2017-06-11 23:03:53 737

原创 predictionio_train解析-执行pio train代码解析

predictionio_train解析-执行pio train代码解析

2017-06-11 22:48:53 780

原创 spark-streaming kafka api（KafkaUtils.createDirectStream）使用

本程序参照spark-streaming kafka官方示例注意：官方提供的spark-streaming-kafka调用借口，java和scala使用是不同的1.本次的程序为（以local[2]方式启动）本次主要学习spark-streaming-kafka接口KafkaUtils.createDirectStream

2017-05-14 02:20:18 11904 1

翻译 kafka部署与简单使用

本次部署参照官方的quick start，链接：http://kafka.apache.org/quickstart本次部署kafka版本 kafka_2.11-0.10.2.0.tgz，下载地址为http://kafka.apache.org/downloads

2017-05-14 01:28:54 2134

原创 Storm HBase遇到的问题

Storm HBase遇到的问题

2017-05-09 20:05:13 1061

翻译 predictionio部署

predictionio部署安装。predictionio由两部分组成：eventserver和predictionserver，eventserver负责数据源的收集，predictionserver为推荐引擎。三类数据需要保存：数据源eventdata、模型（modeldata）、metadata。三类数据默认保存在PostgreSQL，可在pio-env.sh中配置，pio-env.sh文件位置为apache-predictionio-0.10.0-incubating/conf，默认提供的模版文件p

2017-04-02 16:57:20 2204 1

人工智能平台openpai配置文件与github下载包

人工智能平台（AI）openpai配置文件与github下载包，其中配置文件有layout.yaml、config.yaml，github下载包有calicoctl与cni-plugins，安装过程中两个包下载不来，可通过手动方式下载上传到目的文件夹

2022-07-14

azkaban-solo-server-0.1.0-SNAPSHOT.zip

azkaban安装包，solo启动模式，centos7环境

2021-09-02

python_whl_matplotlib.rar

python matplotlib安装依赖离线包，安装命令pip install [whl文件路径]，详见readme

2020-04-16

python_whl_pandas_sikitlearn.rar

python3.7 sikitlearn pandas whl离线安装包，在Python37\Scripts文件夹下执行命令安装，pip install whl文件，详见readme

2020-04-15

gda300jar.zip

编译gdal3.0.0源码使支持gdal javaapi读写hdfs

2019-07-04

libhdfs312so.zip

libhdfs.so是hadoop提供的操作HDFS的C语言客户端,hadoop3.1.2

2019-07-04

python机器学习入门-鸢尾花data建立python机器学习

python机器学习入门-用鸢尾花data建立python机器学习，本次运行Python版本为3.6.2，且已安装相关python库

2019-01-01

presto部署并连接postgresql

presto部署并连接postgresql，并包含presto配置文件，参考官网部署连接写的笔记

2018-12-26

docker部署大数据软件

docker部署大数据软件，docker-compose安装，docker安装kafka，zookeeper等。

2018-10-10

suse12 redis-sensienl-keepalived双击热备部署

suse12 redis-sensienl-keepalived双击热备部署，部署与验证中遇到的问题与解决方法

2018-05-20

docker nginx静态网站示例

docker nginx静态网站示例，docker Dockerfile方式build docker镜像，启动nginx容器

2018-04-30

mongodb连接不上记录文档

mongodb连接不上记录文档，并且报如下异常，mongodb部署在centos7上，待关闭防火墙，且改变mongodb启动方式后，顺利连接上，并将数据保存到mongodb数据库。

2017-12-21

predictionio部署

predictionio由两部分组成：eventserver和predictionserver，eventserver负责数据源的收集，predictionserver为推荐引擎。三类数据需要保存：数据源eventdata、模型（modeldata）、metadata。三类数据默认保存在PostgreSQL，可在pio-env.sh中配置，pio-env.sh文件位置为apache-predictionio-0.10.0-incubating/conf，默认提供的模版文件pio-env.sh.template，需执行若下命令

2017-04-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人