
爬虫
文章平均质量分 76
林渣渣就是林菜逼
心里构造出来一百行完美的代码,不如动手敲一行简单的代码。
展开
-
java利用正则表达式截取想要的内容
下面代码是从a.txt中读取内容并且输出,且输出想要截取的内容。直接甩代码:import java.io.BufferedReader;import java.io.FileInputStream;import java.io.IOException;import java.io.InputStreamReader;import java.util.regex.Matcher;...原创 2018-07-12 11:41:13 · 4577 阅读 · 0 评论 -
java爬虫 用PhantomJS模拟浏览器
首先刚开始的时候,遇到了个问题,java调用代码没法启动phantomjs。然后我重新下载了一波,冲配置环境变量,重新写了下。我是windows7,所以就是java + phantomjs ,环境windows7至于为什么要用这个,因为,爬虫有时候爬到页面源代码后发现并不能获取到想要的数据,所以需要模拟浏览器,获取浏览器获取的内容里面的数据。对了,我是在springmvc上面搞得数据处理,...原创 2018-07-24 17:40:36 · 5284 阅读 · 1 评论