本文是对博客 下雨天没带伞–JAVA实现网页爬虫及将数据写入数据库 –http://blog.youkuaiyun.com/sinat_38224744/article/details/70652767 中代码的理解和补充,并使用 Navicat for MySQL 软件实现对数据的可视化操作。代码分成两部分:Web.java + Jdbc.java
一、Web.java
/**
* 原博客:http://blog.youkuaiyun.com/sinat_38224744/article/details/70652767
* (1)设置URL、URLConnection、BufferedReader
* (2)设置正则表达式,通过获取的数据流进行解析
* (3)将符合匹配要求的数据存放到list数组中和数据库中
* (4)Listlist = new ArrayList();
* -->http://blog.youkuaiyun.com/u010340178/article/details/53507964
* (5) 对 " \\w+@\\w+(\\.\\w+)+ "的理解:
* -->https://zhidao.baidu.com/question/875897286591066732.html
*/
package web_one;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;

本文介绍了如何使用Java编写爬虫从网页抓取数据,并将其存储到MySQL数据库中。通过Web.java类实现网页数据的抓取,使用正则表达式匹配邮箱地址,并存储到ArrayList中。接着,Jdbc.java类建立数据库连接,利用PreparedStatement将数据插入到表中。此外,还使用Navicat for MySQL进行数据可视化操作。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



