图片,网页,多媒体(网络资源),每一个网络资源都会有一个独一无二的url
http请求 去对应的url请求数据,有get请求和post请求。
网页有静态加载和动态加载的,静态加载的可以在网页的源代码中看到网页中的信息,动态加载的就不可以。
爬虫既可以cookie登录也可以模拟登录。json和字典类似
图片,网页,多媒体(网络资源),每一个网络资源都会有一个独一无二的url
http请求 去对应的url请求数据,有get请求和post请求。
网页有静态加载和动态加载的,静态加载的可以在网页的源代码中看到网页中的信息,动态加载的就不可以。
爬虫既可以cookie登录也可以模拟登录。json和字典类似