- 博客(5)
- 收藏
- 关注
转载 为何大量网站不能抓取?爬虫突破封禁的6种常见方法
在互联网上进行自动数据采集(抓取)这件事和互联网存在的时间差不多一样长。今天大众好像更倾向于用“网络数据采集”,有时会把网络数据采集程序称为网络机器人(bots)。最常用的方法是写一个自动化程序向网络服务器请求数据(通常是用 HTML 表单或其他网页文件),然后对数据进行解析,提取需要的信息。 本文假定读者已经了解如何用代码来抓取一个远程的 URL,并具备表单如何提交及 JavaScript 在浏
2017-11-20 19:55:16
594
原创 php爬虫爬取豆瓣电影top250内容
查看豆瓣api文档这是豆瓣开放的api中电影部分的文档 https://developers.douban.com/wiki/?title=movie_v2我们直接选择top250之后往下翻阅可以看到参数需求,有两个参数,start和count,分别代表请求开始的起始地址,这里是从0开始的,count代表请求的数目。<br/><br/> 返回数据有我们输入的参数start、c
2017-09-25 12:31:38
3196
原创 MySQL front 导入导出数据库时出错问题
从远程数据库导入一个库到本地,从远程数据库导出时正确,在本地生成了sql文件,但是导入到本地数据库时出错。1046 no database selected检查本地的MySQL数据库,发现没有与导入库对应名字的数据库存在,新建与sql文件相同的数据库名,重新导入,问题解决。
2017-07-11 14:48:02
2474
原创 初学android之使用Broadcast新建广播使手机关机时播放自定义音乐
原料1、android studio 2、android6.0以上的虚拟机或者真机准备工作新建一个module: ~在res文件夹下新建一个raw文件夹 ~将音乐文件放入raw文件夹中,名为start.mp3 (res/raw文件夹通常是存放资源文件,音频、视频等,raw文件夹中的文件会被映射到R.java文件中,使用时直接使用资源ID,即R.raw.资源id;)创建广播接收器B
2017-04-10 20:38:33
1035
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人