- 博客(154)
- 收藏
- 关注
原创 vmware网络设置踩的坑!
2、NAT网关不能用X.X.X.1,使用X.X.X.2,且虚拟机里的系统默认网关也是用X.X.X.2。1、笔记本通过无线上的网,NAT模式子网地址与家里的无线子网地址是同一个IP段。一、本地笔记本可以ping通虚拟机,但是虚拟机上不了网。
2024-12-10 19:00:20
292
原创 剑指offer-21-调整数组顺序使奇数位于偶数前面-golang
题目:输入一个整数数组,实现一个函数来调整该数组中数字的顺序,使得所有奇数位于数组的前半部分,所有偶数位于数组的后半部分。
2024-12-03 10:54:42
78
原创 剑指offer-16-数值的整数次方-golang
题目:实现函数Power,求base的exponent次方。不得使用库函数,同时不需要考虑大数问题。
2024-12-02 16:37:29
113
原创 剑指offer-14-剪绳子-golang
题目:给你一根长度为n的绳子,请把绳子剪成m段(m,n都是整数,且都大于1),每段绳子的长度记为k[0],k[1],…请问k[0]*k[1]*k[m]可能的最大成绩是多少?
2024-12-02 16:35:16
76
原创 剑指offer-05-替换空格-golang
题目:请实现一个函数,把字符串中的每个空格替换成“%20”。例如,输入“We are happy.”,则输出“We%20are%20happy.”。
2024-11-29 16:18:12
95
原创 剑指offer-04-二维数组中的查找-golang
题目:在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该数组。
2024-11-29 16:01:35
79
原创 剑指offer-03找出数组中重复的数字-golang
题目:在一个长度为n的数组里的所有数字都在0~n-1的范围内。数字中的某些数字是重复的,但不知道有几个数字重复了,也不知道每个数字重复了几次。请找出数组中任意一个重复的数字。例如,如果输入长度为7的数组{2,3,1,0,2,5,3},那么对应的输出时重复的数字2或者3。
2024-11-29 15:59:48
121
原创 GO知识点总结
一、底层原理1.select是随机的还是顺序的?select语句不使用default分支时,处于阻塞状态直到其中一个channel的收/发操作准备就绪(或者channel关闭或者缓冲区有值),如果同时有多个channel的收/发操作准备就绪(或者channel关闭)则随机选择其中一个。select语句使用default分支时,处于非阻塞状态,从所有准备就绪(或者channel关闭或者缓冲区有值)的channel中随机选择其中一个,如果没有则执行default分支。2.Go语言局部变量分配在栈还是堆?
2021-10-09 20:43:57
1740
原创 操作系统相关总结
一、并发、并行、同步、异步、阻塞、非阻塞并发:指一个时间段内,有几个程序在同一个CPU上运行,但是任意时刻只有一个程序在CPU上运行并行:指任意时刻点上,有多个程序同时运行在多个CPU上同步:指代码调用IO操作时,必须等待IO操作完成才能返回的调用方式。异步:指代码调用IO操作时,不必等IO操作完成就返回的调用方式。阻塞:指调用函数时候当前线程被挂起。非阻塞:值调用函数时当前线程不会被挂起,而是立即返回。阻塞非阻塞是对调用者而言,调用结果返回前进程的状态,是挂起还是继续处理其他任务。同步异步
2021-09-05 16:01:12
187
原创 网络相关总结
一、HTTP 与 HTTPS1、HTTPS协议需要到CA申请证书,需要一定费用2、HTTP信息是明文传输,HTTPS是具有安全性的SSL加密传输协议3、HTTPS和HTTP使用的是完全不同的连接方式,前者端口443,后者804、HTTP连接简单,是无状态的,HTTPS比HTTP安全。无状态是指两次连接通信之间是没有任何联系的,每次都是一个新的连接,服务端不会记录前后的请求信息。500:服务器内部错误。501:服务器不具备完成请求的功能。502:Bad Gateway错误。503:服务器目前
2021-08-30 22:13:09
151
原创 centos安装chromedriver并使用
yum install https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm# 查看安装的版本chromedriver -version根据上方查出的版本,在https://npm.taobao.org/mirrors/chromedriver中找到合适的安装包wget http://npm.taobao.org/mirrors/chromedriver/89.0.4389.23/chromedrive
2021-03-23 18:03:24
633
2
原创 Kafka知识点本文就够
本文目录一、Kafka概念二、消息队列的作用(一)缓冲和削峰(二)解耦和扩展性(三)冗余(四)健壮性(五)异步通信三、Kafka相对传统技术的优势(一)快速(二)可伸缩(三)持久(四)设计四、kafka 为什么那么快五、Kafka 消息是采用 Pull 模式,还是 Push 模式六、kafka中的broker的作用七、Zookeeper在Kafka中的作用八、Kafka 如何判断节点是否存活九、kafka中consumer group十、Kafka中是怎么体现消息顺序性的十一、消费者提交消费位移时提交的是当
2021-03-21 20:31:59
366
2
原创 Scrapy总结
本文目录一、 网络相关(一)HTTP 与 HTTPS(二)cookie和session(三)GET和POST区别(四)三次握手、四次挥手(1)三次握手(2)四次挥手(五)浏览器访问百度的过程(六)其他二、Scrapy组件三、 数据流四、 反爬机制和应对措施五、 日志信息和错误等级六、下载中间件(一)作用(二)拦截的请求(三)最重要三个方法(四)scrapy应用selenium的编码流程七、如何提升scrapy爬取数据的效率:八、爬取数据去重九、布隆过滤器一、 网络相关(一)HTTP 与 HTTPS1、
2021-01-24 18:44:22
481
原创 MongoDB知识点本文就够
本文目录一、 Mongo概述(一)Mongo适用场景(二)相关概念(三)Mongo是否需要很大的内存?(四)一、 Mongo概述(一)Mongo适用场景1、网站数据:Mongo非常适合实时的插入,更新与查询,并具备网站实时数据存储所需的复制及高度伸缩性。2、缓存:由于性能很高,Mongo也适合作为信息基础设施的缓存层。在系统重启之后,由Mongo搭建的持久化缓存层可以避免下层的数据源过载。3、在高伸缩性的场景,用于对象及JSON数据的存储。(二)相关概念1、mongodb是一个基于docume
2021-01-24 15:05:36
775
原创 Redis知识点本文就够
本文目录一、 Redis数据结构(1)String 字符串(2)Hash 哈希(3)List链表(4)Set集合(5)Zset有序集合二、 Redis单线程模型为啥这么快?(一)基于内存操作(二)C语言实现(三)简单的数据结构(四)多路I/O复用模型(五)单线程模型三、持久化之RDB与AOF(一)RDB(二)AOF(三)RDB和AOF对比四、 主从复制与故障转移(一)数据复制的意义(二)Redis注册复制原理(三)故障转移五、 高可用与 Sentinel 哨兵(一)sentinel的功能六、分布式缓存与 R
2021-01-10 17:57:13
2109
3
原创 MySQL知识点本文就够
MySQL知识点本文就够一、 数据库三大范式与五大约束(1)三大范式(2)五大约束二、 数据库事务(1)事务的四大特性(2)事务的四种隔离级别三、B树、B+树、二叉查找树、平衡二叉查找树、红黑树(1)B树(2)B+树(3)平衡二叉树(4)二叉查找树(3)红黑树四、MySQL锁(1)共享锁(S)(2)排他锁(X)(3)意向锁(4)意向共享锁(IS)(5)意向排他锁(IX)(6)表级锁(7)页级锁(8)行级锁(9)间隙锁(Next-Key锁)(10)死锁避免死锁(11)乐观锁(12)悲观锁五、 存储引擎(1)m
2021-01-10 14:32:00
3529
7
原创 使用PySpark处理数据
使用PySpark做用户画像文章目录使用PySpark做用户画像一、数据准备二、用户点击率1.创建SparkSession对象2.读取数据,将数据根据‘~’拆分,获取userid和behavior两列3.统计用户的各类行为数4.将userid,behavior和数量取出作为3列,并转为DataFrame格式5.根据userId进行分组,将behavior列数据进行旋转作为列标数值为cnt。并将behavior的0和1替换为“browse”和”click”。6.填充缺失值7.将计算的数据作为新列添加到数据8
2020-12-27 19:05:17
1167
原创 Pandas数据分析本文就够
十分钟快速上手Pandas数据处理一、常用操作1、csv读取和导出2、dataframe转换为列表3、某一列求和4、某一列格式转换5、选择数据6、修改数据7、删除数据8、处理NaN值9、保留小数和百分数处理10、列名更换11、复制12、相关值替换二、合并数据1、concat2、merge三、排名与排序1、排名,生成排序序号列。不改变数据顺序2、排序,改变数据顺序四、分组统计1、分组求和2、分组计数3、分组求累加值五、复杂操作1、条件赋值一、常用操作1、csv读取和导出df = pd.read_csv(
2020-07-16 19:53:58
649
原创 HBase分布式集群搭建(zookeeper+hadoop+hbase)超详细!
环境准备zookeeper:zookeeper-3.4.14hadoop:hadoop-2.8.5hbase:hbase-1.4.13master:namenode、resourcemanager,slave1:secondarynamenode、datanode,slave2:datanode一、Hadoop集群搭建1、hadoop安装包解压tar zxvf hadoop-2.8.5.tar.gz2、hadoop-env.sh、mapred-env.sh、yarn
2020-05-11 19:04:33
1482
2
原创 时间序列分析方法——ARIMA
一、相关概念1、ARIMA模型是一种流行且广泛使用的时间序列预测统计方法。ARIMA是AutoRegressive Integrated Moving Average的缩写。它是一类模型,它捕获时间序列数据中的一套不同的标准时间结构。AR:自回归。一种模型,它使用观察与一些滞后观察之间的依赖关系。使用原始观察的差分(例如,从前一时间步骤的观察中减去观察值)以使时间序列静止。MA:移动平...
2020-04-11 16:38:32
4354
原创 读取HBase字节串转码问题
从HBase读取数据非常容易,本人使用的是Python,HBase python支持库happybase操作起来非常方便,主要的问题就是数据编码解码问题。编码主要使用struct.pack(),解码使用struct.unpack()。最简单的方法就是向HBase存数据的时候首先都转为字符串的形式,再转为字节存储。这样解码就非常简单,可以直接使用decode()进行解码。HBase里的数据也是有可读...
2020-04-05 19:20:39
1391
原创 美团-走迷宫
matric = [[1,0,0,1,0,1], [0,1,0,1,0,0], [0,0,0,0,0,1], [0,0,1,0,0,0], [0,0,0,0,1,0]]b1,b2 = 1,0e1,e2 = 4,5rows,cols = len(matric),len(matric[0])visit...
2019-12-20 21:28:00
325
原创 二叉树前序、中序、后序遍历-python
一、中序遍历def inorderTraversal(root): if not root: return [] return inorderTraversal(root.left) + [root.val] + inorderTraversal(root.right)def inorderTraversal(root): stack = ...
2019-10-10 10:49:00
196
原创 63-股票的最大利润-python
题目:假设把某股票的价格按照时间先后顺序存储在数组中,请问买卖该股票一次可能获得的最大利润是多少def stock_max_val(arrys): bef_min = arrys[0] res = [0]*len(arrys) i = 1 while i<len(arrys): if arrys[i]<bef_min: ...
2019-09-24 15:41:00
147
原创 62-圆圈中最后剩下的数字-python
题目:0,1,...,n-1这n个数字排成一个圆圈,从数字0开始,每次从这个圆圈里删除第m个数字。求这个圆圈里剩下的最后一个数字。def delete_circle_n(head,n): p = head while p!=p.next: i = 0 while i<n: p = p.next ...
2019-09-24 15:33:00
108
原创 61-扑克牌中的顺子-python
题目:从扑克牌中随机抽5张牌,判断是不是一个顺子,即这5张牌是不是连续的。def is_continous(arrys): cnt_0 = arrys.count(0) res = sorted(arrys) i,length = cnt_0,len(res) cnt = 0 while i<length-1: if re...
2019-09-24 15:26:00
162
原创 设计一个高并发系统
升级过程为:最初系统——添加负载均衡——数据库分库分表+读写分离——缓存集群+消息中间件集群1、最初系统假设系统机器是4核8G,数据库服务器是16核32G。日活用户1W,系统层面每秒10次请求,数据库层每秒30次请求。2、添加负载均衡用户量增长了50倍,日活用户50万,高峰期对系统每秒请求500/s,对数据库的每秒请求1500/s问题:系统CPU负载过高,数据库可以接受...
2019-09-20 22:13:00
422
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人