- 博客(6)
- 收藏
- 关注
原创 基于微信小程序的网络爬虫系统的设计与实现
为了减少网络爬虫对网站的潜在威胁,减轻网站服务器的压力,防止数据的大量流失,网站一般会采用以下几种反爬虫的技术限制网络爬虫:请求头校验机制、访问量限制、数据异步加载、验证码限制机制、CSS偏移量反爬虫等。要想设置一个网络爬虫,首先需要直接通过Request技术、Selenium自动化测试框架或Scrapy框架等方式请求URL,进行网页访问,获取响应数据,然后对数据进行解析,解析方法包括Regular Expression正则解析、Xpath解析、JSON解析以及Beautiful Soup 4解析等。
2024-06-25 21:28:44
2608
原创 汉字内码的查询与打印(代码实现)
汉字是中文信息处理的基本单位,汉字的编码是汉字处理的基础,设计数据结构,用来保存和查询汉字的区位码和国标码。
2024-04-25 21:50:05
520
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人