
爬虫
Cceking
编程是爱好,也是朋友
展开
-
Crawler4j学习笔记-util
Crawler4j学习笔记-utilutil有两个类,IO.java和Util.java。IO.java用于文件的操作。 deleteFolder用于删除文件夹,并通过deleteFolderContents删除文件夹内容。 这里是用来删除持久化的url数据的。当使用crawler4j时,会需要配置保存url的文件夹(可用于恢复上次操作)CrawlConfig config = new Craw原创 2017-01-24 15:20:51 · 684 阅读 · 0 评论 -
自定义协议
如何自定义协议确定调用的程序。创建注册表并执行。声明协议名和调用的程序、调用的方式。通过URL在浏览器上调用。通过URL向操作系统调用相应的程序。1win10下我测试发现jar是调不了的,exe是可以的,所以建议程序是exe的。简单起见,使用gcc生成测试用的程序,文件名为a.exe。源代码a.c #include <stdio.h>#includ...原创 2018-04-14 11:04:41 · 2443 阅读 · 0 评论