- 博客(4)
- 收藏
- 关注
原创 正大杯爬取微博评论数据分享
安装链接:https://www.python.org/downloads/windows/不难推断出第二页的max_id肯定藏在第一页中,以此类推,可以用递归来进行翻页采集。url:网页地址,是用来定位和访问互联网上资源(如网页、图片、视频等)的标准格式。安装链接:https://code.visualstudio.com/如果第一页参数和其他页参数不同,自行构建,没有max_id就传空。键值对取值,根据冒号左边的内容[键],提取冒号右边的内容[值]从第二页开始,只有max_id在变化。
2025-03-02 05:12:05
952
原创 计网期末复习
网络(Network)由若干结点(Node)和连接这些结点的链路(Link)组成多个网络还可以通过路由器互连起来,这样就构成了一个覆盖范围更大的网络,即互联网(或互连网)。因此,互联网使“网络的网络”(Network of Nexworks)"。因特网(Internet)是世界上最大的互连网络(用户数以亿计,互连的网络数以百万计)。计算机网络最简单定义:一些互相连接的、自治的计算机的集合互连:计算机之间可以用过有线或无线的方式进行数据通信自治:独立的计算机,它有自己的硬件和软件,可以单独运行使用。
2024-12-28 11:38:17
599
原创 Benchmark学习笔记
1.Apache Benchmark的原理:创建多个并发访问线程模拟多个访问者对某一URL地址进行访问。2.ab指令# get请求ab -n 总请求数量 -c 并发数量 网址#post请求ab -p 指定需要post的数据文件 -T 指定 content-type# -s: timeout,单位为秒# -t:timelimit,指定本次压测的最长时间限制 (如果不指定 -n ,这里会默认指定一个-n 50000)# -r:当发生 socket error 时不退出,而是继续执行请求。
2024-03-03 16:25:03
1238
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人