自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

fenglei0415的博客

only create，you can know

博客等级

码龄7年

88
原创

125
点赞

502
收藏

185
粉丝

关注

私信

分类专栏

数据仓库 9篇
分布式 2篇
Spark 4篇
Hive 3篇
Kafka 10篇
大数据 14篇
算法 14篇
python 20篇
linux 6篇
爬虫 3篇
数据分析 1篇
python进阶 4篇
数据结构 16篇
数据库 12篇
java 3篇
javascript 2篇
生活 3篇
工具 5篇

最新评论

kafka请求队列模块
青生先森: 抄的不错，下次继续
数仓中的缓慢变化维
Keven He: 拉链表是不是一种更好的方式呢
SparkSql 有关谓词下推
fendouderen: 博主，你好文章中提到的join后的条件（右表不下推）的这个结论，我这边测试的结果是右表的也会进行谓词下推的，spark的优化器会把join的方式优化成inner join,我这边测试用的是spark2.4.0的版本和spark3.3.2的版本；如果我的结论有问题，还请指教；谢谢
scrapy-redis架构
mukes: 博主，你博文里的这张图来源哪里？我在scrapy-redis github库中都没看到
单节点事务与分布式事务
技术小白白~: 大神总结的真好，技术肯定也不错平时可以多交流吗？

爬虫

关注

网络爬虫按照系统结构和实现技术，大致可以分为以下几种类型：通用网络爬虫、聚焦网络爬虫、增量式网络爬虫、深层网络爬虫。实际的网络爬虫系统通常是几种爬虫技术相结合实现的

关注数：文章数：3 文章阅读量：27716 文章收藏量：55

作者: 红岸水滴

https://github.com/fenglei110 从孤独中寻找自由。

展开

专栏收录文章