
kafka
公众号菜鸟童靴
在不退步的同时,保持的一点点的进步,欢迎关注个人博客https://boyyongxin.github.io/
微信公众号:菜鸟童靴
展开
-
Kafka 里面的信息是如何被消费的?
作为一个爬虫工程师,Kafka 对你而言就是一个消息队列,你只需要掌握如何向里面写入数据,以及如何读取数据就可以了。请谨记:使用 Kafka 很容易,但对 Kafka 集群进行搭建、维护与调优很麻烦。Kafka 集群需要有专人来维护,不要以为你能轻易胜任这个工作。”本文,以及接下来的几篇针对 Kafka 的文章,我们面向的对象都是爬虫工程师或者仅仅需要使用 Kafka 的读者。关于 ...转载 2020-04-27 18:05:06 · 769 阅读 · 0 评论 -
为什么每一个爬虫工程师都应该学习 Kafka
摄影:产品经理与产品经理环游世界的瞬间这篇文章不会涉及到Kafka 的具体操作,而是告诉你 Kafka 是什么,以及它能在爬虫开发中扮演什么重要角色。一个简单的需求假设我们需要写一个微博爬虫,老板给的需求如下:开发爬虫对你来说非常简单,于是三下五除二你就把爬虫开发好了:接下来开始做报警功能,逻辑也非常简单:再来看看统计关键词的功能,这个功能背后有一个网页...转载 2019-12-16 12:02:27 · 262 阅读 · 1 评论 -
面试官:消息中间件(kafka)如何实现每秒几十万的高并发写入?
“这篇文章来聊一下Kafka的一些架构设计原理,这也是互联网公司面试时非常高频的技术考点。Kafka是高吞吐低延迟的高并发、高性能的消息中间件,在大数据领域有极为广泛的运用。配置良好的Kafka集群甚至可以做到每秒几十万、上百万的超高并发写入。那么Kafka到底是如何做到这么高的吞吐量和性能的呢?这篇文章我们来一点一点说一下。1、页缓存技术 + 磁盘顺序...转载 2020-04-23 14:25:41 · 351 阅读 · 0 评论