weixin_43637653-优快云博客

原创自制证书nextcloud打开onlyoffice报错问题解决办法

首先，nextcloud和onlyoffice都需要改成https，这个可以参考我另一篇写的很粗糙的文章，主要遇到的问题就是其他用户终端无法打开office，只有管理员能打开，也就是调试机能打开。后来在没有打开的终端中访问了一下onlyoffice，再回来打开nextcloud中的office，居然成功了，也可以新建，后来才反应过来，是因为自建证书未受信的原因。两种办法，一种是将证书给客户让用户每台电脑都在浏览器添加onlyoffice证书，另一种就是让他们先访问一下onlyoffice主页即可。

2023-11-11 19:51:46 881 1

原创 Nextcloud docker 版安装部署自制证书https访问添加onlyoffice以及调优解决概览报错

Nextcloud docker 版安装部署自制证书https访问添加onlyoffice以及调优解决概览报错

2023-11-09 20:32:34 3703 2

原创 Dokcer离线rpm包20.10.9

Docker离线rpm包下载20.10.9

2023-10-31 16:29:14 130

原创联想ThinkPad x1carbon 7th，i5 8265安装win7踩过的坑

最近有人让我给这台电脑装win7，预装的是win10的系统，看了下配置，觉得应该没什么问题，可装的时候遇到了很多坑，首先，我们正常就是修改bios为uefi然后再把硬盘格式改成mbr，然后直接安装就可以了，开始显示没问题，但却一直卡在安装设备到45%不动了，以往的经验是SATA没有改成achi，但是这台电脑bios并没有，不管是升级还是降级都没有。最后是怎么解决的呢，废话不多说，开始主题，具体细节不多说懂得都懂准备工作，pe，win7镜像(带nvme和usb新的镜像)，还有就是去联想官网下载最新版本的b

2021-02-14 16:55:09 3545 2

原创 spark的一些重要知识点

Spark的一些重要的知识点1.spark的shuffle有几种方式shuffle过程中分为shuffle write和shuffle read，而且会在不同的stage中进行的在进行一个key对应的values的聚合时，首先，上一个stage的每个map task就必须保证将自己处理的当前分区中的数据相同key写入一个分区文件中，可能会多个不同的分区文件，接着下一个stage的reduc...

2018-11-27 17:39:47 372

转载 kafka的一些问题总结笔记

kafka的一些问题总结笔记1.kafka在高并发的情况下，如何避免消息丢失和消息重复？kafka动态维护了一个同步状态的副本的集合（a set of In-Sync Replicas），简称ISR。在这个集合中的节点都是和leader保持高度一致的，任何一条消息只有被这个集合中的每个节点读取并追加到日志中，才会向外部通知说“这个消息已经被提交”。只有当消息被所有的副本加入到日志中时，才算...

2018-11-27 11:54:51 500

原创 Spark的笔记

#Spark中一些重要的知识点1、spark-on-yarn的应用场景 1.因为历史原因，方便运维部门维护，之前用的hadoop2.用yarn来运行各种任务，相比其他的资源调度系统更稳定，便于升级优化2、spark-on-yarn的执行流程 spark-on-yarn分为两种运行模式：client和clustercluster模式：1.由client向RM提交请求，并上传jar到...

2018-11-23 20:11:42 313

转载 flume中的一些重要的知识点

flume中的一些重要的知识点##1.flume的架构client:客户端,运行agent的地方source:数据源,负责接收数据channel:管道,负责接收source端的数据,然后将数据推送到sink端sink:接收channel端的数据并且持久化到目的系统ineterceptor:拦截器,作用于source和sink,flume允许使用拦截器拦截数据selector:选择器,...

2018-11-22 10:20:23 308

原创 hbase中的一些重要的知识点

hbase中的一些重要的知识点##1.应用场景1.需要对海量非结构化的数据进行存储2.需要随机近实时的读写管理数据##2.rowKey的设计长度原则: rowkey是一个二进制流,建议rowkey的长度不要超过16个字节原因如下：（1）数据的持久化文件HFile中是按照KeyValue存储的，如果Rowkey过长比如100个字节，1000万列数据光Rowkey就要占用100*10...

2018-11-22 10:19:50 315

原创 hive的一些重要的知识点

hive的一些重要的知识点（基于Hadoop的一个数据仓库工具）基本组成：用户接口：包括 CLI、JDBC/ODBC、WebGUI。元数据存储：通常是存储在关系数据库如 mysql , derby中。解释器、编译器、优化器、执行器。1.内部表，外部表，相同与区别相同：都是表区别：内部表数据由Hive自身管理，外部表数据由HDFS管理；内部表数据存储的位置是hive.metas...

2018-11-22 10:18:34 422

原创 hadoop中的一些重要知识点

hadoop之job和shuffle过程1、job提交流程1.客户端提交作业给resourcemanager2.resourcemanager返回给客户端jobid，存储路径（HDFS上的路径）信息3.客户端将job.jar、job.xml、job.split、job.splitinfo等信息上传到存储路径（HDFS上的路径/）4.客户端通知resourcemanager可以启动job...

2018-11-22 10:17:14 270

转载 zookeeper中的主要知识点

zookeeper中的一些主要的知识点##1.应用场景1.1 什么是zookeeperZookeeper是一个分布式协调服务；就是为用户的分布式应用程序提供协调服务zookeeper是为别的分布式程序服务的Zookeeper本身就是一个分布式程序（只要有半数以上节点存活，zk就能正常服务）Zookeeper集群的角色： Leader 和 follower （Observer）...

2018-11-22 10:16:14 202

原创 hdfs的一些重要知识点

HDFS的一些重要知识点hdfs将文件存放在哪里？datanode 用户的文件存放在datanode上，放在配置的目录dfs.datanode.data.dir下namenode 管理元数据（文件路径、副本数、文件的blockid，位置等信息）##1.读写流程一、读流程1、客户端向namenode请求读取文件（指定一个路径）2、namenode查询元数据信息，看文件是否存在，...

2018-11-22 10:15:09 414

转载 [Spark源码解析]DAGScheduler划分stage

#[Spark源码解析]DAGScheduler划分stage##注意：1，DAGScheduler将Job分解成具有前后依赖关系的多个stage2，DAGScheduler是根据ShuffleDependency（宽依赖）划分stage的,3，stage分为ShuffleMapStage和ResultStage；一个Job中包含一个ResultStage及多个ShuffleMapStag...

2018-11-19 10:27:24 337

原创 Spark任务提交执行全流程详解

**任务提交执行流程**Spark任务的本质是对我们编写的RDD的依赖关系切分成一个个Stage，将Stage按照分区分批次的生成TaskSet发送到Executor进行任务的执行Spark任务分两种：1、shuffleMapTask：shuffle之后的task2、resultTask：shuffle之前的taskSpark任务分配有两种方式：1，尽量打撒方式（系统默认）2，尽...

2018-11-15 17:57:52 1955

原创 Spark集群启动流程-Worker启动-源码分析

Spark集群启动流程-Worker启动-源码分析上篇文章介绍了Master启动（Master启动点击：https://blog.youkuaiyun.com/weixin_43637653/article/details/84073849），接下来，我们在源码里继续分析Worker的启动总结：(和Master几分相似) 1.创建ActorSystem对象，并将初始化参数传入2.创建了...

2018-11-15 09:55:32 511

原创 Spark集群启动流程-Master启动-源码分析

集群启动流程-Master启动-源码分析总结： 1.初始化一些用于启动Master的参数2.创建ActorSystem对象，并启动Actor3.调用工具类AkkaUtils工具类来创建actorSystem（用来创建Actor的对象）4.创建属于Master的actor，在创建actor的同时，会初始化Master5.生命周期方法（preStart）是在构造器之后，receiv...

2018-11-14 20:51:55 1021

原创 kafka中重要的知识点笔记

Kafka-消费模型High Level Consumer API不需要自己管理offset默认实现最少一次消息传递语义（At least once）comsumer数量大于 partiton数量，浪费。comsumer数量小于 partiton数量，一个comsumer对应多个partiton最好partiton数目是consumer数目的整数倍Low Level Cons...

2018-11-13 20:18:53 844 1

原创 Kafka中一些重要的组件的注意事项

Kafka中一些重要的组件的注意事项Producer（生产者） --生产者负责采集数据并把数据传输到kafka的某个topic中。比如：flum、java后台服务、shell脚本、logstash–生产者是由多个进程组成的（可以有多个生产者组成）。一个生产者可以作为一个独立的进程，可以独立的分发数据–多个生产者发送的数据时可以存储到同一个topic的同一个partition的–一个生产...

2018-11-12 09:31:18 479

原创 kafka api实现消费者

kafka api-实现消费者本次测试依赖：<dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-streaming_2.11</artifactId> <version>...

2018-11-12 08:44:37 289

原创 kafka api-实现生产者

kafka api-实现生产者本次测试依赖：<dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-streaming_2.11</artifactId> <version>...

2018-11-12 08:43:50 298

原创 kafka常见问题

#kafka常见问题 V21、如果想消费已经被消费过的数据consumer是底层采用的是一个阻塞队列，只要一有producer生产数据，那consumer就会将数据消费。当然这里会产生一个很严重的问题，如果你重启一消费者程序，那你连一条数据都抓不到，但是log文件中明明可以看到所有数据都好好的存在。换句话说，一旦你消费过这些数据，那你就无法再次用同一个groupid消费同一组数据了。原因...

2018-11-10 15:18:54 831

原创 kafka中的几个常见问题

#kafka中的几个常见问题 V1版1，每个topic的分区中有多个segment，一个分区会被分成相同大小数据数量不等的segment，数据的生命周期就是指的是segment的生命周期2，数据的存储机制：首先是Broker接受到数据，将数据放到操作系统的缓存里，（pagecache），pagecache会尽可能多的使用空闲内存，使用sendfile技术尽可能多的减少操作和应用程序之...

2018-11-10 15:09:58 240

原创 YARN的任务提交流程简述及图解

#YARN的任务提交流程简述及图解1，Client向ResourceManager发出请求,提交程序，（ResourceManager中有Scheduler调度器和ApplicationsManager应用程序管理器2，ResourceManager向Scheduler返回一个ApplicationID作为回应3，Client向RM回应Application Submission Conte...

2018-11-10 09:27:14 2998

原创 H-JavaAPI之过滤器

文章目录过滤器流程1、构造Table对象2、构造Scan对象3、构造比较器对象4、构造过滤器对象5、将比较器对象绑定到过滤器对象6、将过滤器对象绑定到Scan对象7、将Scan绑定到Table对象8、读取Table中的信息比较器类型RegexStringComparatorBinaryComparatorBinaryPrefixComparatorSubstringComparatorNullCo...

2018-11-08 09:27:15 703

weixin_43637653的博客